ブロックチェーンの光と影──Solanaのラグプル詐欺データセットが問いかけるもの
- Seo Seungchul

- 2025年11月30日
- 読了時間: 11分

シリーズ: 論文渉猟
◆今回の論文:Abdulrahman Alhaidari et al. "SolRPDS: A Dataset for Analyzing Rug Pulls in Solana Decentralized Finance" (arXiv, 2025年4月6日)
概要:本論文は、Solanaブロックチェーン上の分散型金融におけるラグプル詐欺を分析するための初の公開データセット「SolRPDS」を紹介しています。2021年2月から2024年11月までの約4年間、37億件のトランザクションから62,895件の疑わしいリクイディティプールを抽出し、そのうち22,195件のトークンがラグプルのパターンを示していることを明らかにしています。データセットには流動性の追加・削除、不活性状態、最終取引時刻などの属性が含まれ、機械学習による検出手法の開発基盤として提供されています。
誰でも簡単にトークンを作って売買できる。手数料は限りなくゼロに近く、取引は爆速で完了する。そんな夢のような分散型金融の世界が、いま急速に広がっています。でも、それと同時に増え続けているのが「ラグプル」と呼ばれる詐欺です。開発者が突然プールから資金を引き抜き、投資家に無価値なトークンだけを残して姿を消す──。
今回取り上げるのは、そんなラグプルの実態をSolanaブロックチェーンで追跡した初の公開データセット「SolRPDS」。約4年分、37億件のトランザクションから抽出された、22,195件の疑わしいトークンの記録です。富良野とPhronaの対話を通じて、このデータが何を物語り、私たちにどんな問いを投げかけているのかを探っていきます。
データが語る「1日で消えるトークン」の正体
富良野:このSolRPDSっていうデータセット、面白いですね。Solanaのラグプルを追跡した初の公開データセットだって。37億件ものトランザクションから疑わしいトークンを抽出してる。
Phrona:37億件ってすごい数ですよね。そこから約22,000件が怪しいって。でも私が気になったのは、その中の75%が「1日で消える」っていう話。これ、どういうことなんでしょう。
富良野:あ、それね。論文では1-day tokenって呼んでるんだけど、要するにトークンが生まれてから最後のユーザーとのやりとりまでが1日以内っていう意味。つまり開発者がトークンを作って、少し資金を集めたらすぐに引き抜いて逃げる、っていうパターンが圧倒的に多いってこと。
Phrona:それってつまり、投資家が「これ怪しいな」って気づく前に終わっちゃうってことですよね。時間との勝負というか。
富良野:そう。だからこそデータが重要なんだと思います。このデータセットは、流動性がどう追加されて、どう引き抜かれたかっていう履歴を全部記録してる。それを見れば、瞬間的に消えるトークンと、ちゃんと運営されてるトークンの違いがはっきり見えてくる。
Phrona:でも、データがあるからって防げるわけじゃないですよね。現実には詐欺が起きた後にしか分からないっていうジレンマがある気がします。
富良野:たしかに。ただこのデータセットは過去のパターンを学習させることで、リアルタイムでの検出につなげようとしてるんですよね。機械学習のモデルを訓練して、怪しい動きを事前に察知できるようにする、と。
「安さ」が生む詐欺のインセンティブ
Phrona:ところで、なんでSolanaがこんなに詐欺の温床になってるんでしょう。EthereumやBinance Smart Chainでも同じようなことは起きてるけど、Solanaは特に多いって印象があって。
富良野:一番大きいのはガス代の安さだと思います。Solanaは1トランザクションあたり平均0.00025ドル。ほぼタダですよね。だからトークンを作るコストがほとんどかからない。それが詐欺師にとっては好都合なわけです。
Phrona:逆に言えば、参入障壁が低すぎるってことですよね。pump.funみたいなプラットフォームが出てきて、誰でも無料でトークンを作れちゃう。で、しかも開発者が大量の供給量を保持できる仕組みになってる。
富良野:そうなんです。だからこそ、このデータセットが重要だと思うんですよね。Solanaは取引速度も速いし、ユーザー数もどんどん増えてる。でも、その分だけ詐欺のリスクも高まってるわけで。データがなければ、そもそも対策の立てようがない。
Phrona:データがあっても、それを使いこなせる人がいなければ意味がないっていうのもありますよね。このデータセット、研究者だけじゃなくて、実際に投資してる人たちにどう届けるかっていう問題もある気がします。
富良野:それは本当にそう。いくら高精度な検出モデルを作っても、それが使われなければ意味がない。だからこそ公開データセットっていう形にしたんだと思います。誰でもアクセスできるし、改良も自由にできる。
「活性」と「不活性」──トークンの生と死
Phrona:このデータセット、トークンを「活性」と「不活性」に分けてますよね。その基準って何なんでしょう。
富良野:簡単に言うと、流動性が引き抜かれた後もユーザーが取引を続けてれば「活性」、取引が完全に止まってれば「不活性」って判断してるみたいです。不活性っていうのは、ユーザーが「もうこれダメだな」って気づいて離れたっていう証拠でもあるわけで。
Phrona:なるほど。でも疑わしいけどまだ取引されてるトークンもあるってことですよね。それって、騙されてることに気づいてない人がまだいるってことでもある。
富良野:そうなんです。だから論文では「疑わしい」ケースと「確定した」ケースを分けて記録してる。疑わしいケースっていうのは、急激に流動性が引き抜かれてるけど、まだ取引が続いてるっていう状態。確定したケースは、完全に不活性になってるもの。
Phrona:そうすると、疑わしいケースをどう扱うかが難しいですよね。完全に詐欺だって確定してるわけじゃないけど、でも警告を出すべきかもしれない。どこまで介入すべきなのか、っていう倫理的な問題も出てきそう。
富良野:それはありますね。ただ、分散型金融の理念って「自己責任」が前提じゃないですか。だからこそ、判断材料としてのデータが重要になってくる。このデータセットは、あくまで材料を提供するものであって、何を信じるかは各自が決めるべきだっていう立場なのかなと。
Phrona:でも、そうすると結局、情報を読み解けるリテラシーがある人だけが守られるっていう構造になりますよね。格差が広がるだけかもしれない。
機械学習が拓く未来、それとも……?
富良野:論文では機械学習で不活性トークンを分類する実験もやってますね。AdaBoostっていうアルゴリズムで97.6%の精度が出てる。
Phrona:それって高いんですか?
富良野:かなり高いですよ。ただ、これはあくまで過去のデータで学習した結果であって、未来の詐欺を確実に予測できるわけじゃない。詐欺師だって学習するわけで、パターンを変えてくる可能性もある。
Phrona:イタチごっこですね。それに、機械学習のモデルって、どうしてもブラックボックス化しやすいじゃないですか。なんでそう判断したのかが分からないと、信頼されにくいっていう問題もあるかもしれない。
富良野:そうなんですよね。だからこそ、このデータセットでは流動性の追加と削除の回数とか、引き抜きの比率とか、解釈しやすい指標を重視してるんだと思います。単純に「AIが怪しいって言ってます」じゃなくて、「こういう動きがあったから怪しい」って説明できる形にしたいんでしょう。
Phrona:でも結局、リアルタイムで動いてる詐欺を止めるのは難しいですよね。データセットがあっても、それをどう実装するかっていう問題が残ってる。
富良野:そこはまさにこれからの課題ですね。論文でも「将来の研究のための基盤」っていう位置づけで、完成形じゃないってことを強調してます。でも、とにかく公開して、みんなで考えていこうっていう姿勢は評価できると思います。
「分散」の理想と「中央」の必要性
Phrona:この話を聞いてると、分散型金融って理想は美しいけど、現実はかなり厳しいなって思います。仲介者を排除して、誰もが平等にアクセスできるっていうのは素晴らしいけど、その分だけ詐欺のリスクも高まる。
富良野:そうですね。EthereumやBSCは、まだある程度の標準化が進んでるから、セキュリティ対策もそれなりに整備されてる。でもSolanaは新しいし、独自のアーキテクチャを持ってるから、そういう標準がまだ確立されてない。
Phrona:それってつまり、ある程度の「中央」的な仕組みが必要だってことですよね。完全に分散化しすぎると、逆に誰も守れなくなる。
富良野:そのバランスが難しいんでしょうね。規制を強化しすぎると、分散型金融の魅力が失われる。でも野放しにすれば、詐欺が横行する。このデータセットは、そのバランスを模索するための一つの試みなのかなと。
Phrona:でも、データを公開することで、詐欺師にも手口がバレちゃうっていうリスクはないんですか?
富良野:それはあるかもしれないですね。ただ、悪意ある人はすでに手口を知ってるわけで、むしろ一般の人が知らなさすぎるっていう方が問題なんじゃないかな。情報の非対称性を少しでも解消する方が、長期的には健全だと思います。
ポイント整理
SolRPDSは、Solanaブロックチェーン上のラグプル詐欺を分析するための初の公開データセットであり、2021年2月から2024年11月までの約4年間、37億件のトランザクションから62,895件の疑わしいリクイディティプールと22,195件のラグプルパターンを示すトークンを抽出している
ラグプルとは、開発者が高利益を約束してユーザーから資金を集めた後、突然流動性プールから資金を引き抜き、投資家に無価値なトークンだけを残して姿を消す詐欺行為であり、分散型金融における深刻な問題となっている
Solanaがラグプルの温床になっている主な理由は、1トランザクションあたり平均0.00025ドルという極めて低いガス代と、毎秒最大65,000件という高速な取引処理能力により、トークン作成のコストがほぼゼロに近く、詐欺師にとって参入障壁が極めて低いためである
データセットに含まれる不活性トークンの約75%は、トークンが作成されてから最後のユーザー取引まで1日未満という極めて短い期間しか活動しておらず、これらは1日トークンと呼ばれ、投資家が詐欺に気づく前に完了する典型的なラグプルのパターンを示している
SolRPDSは、流動性の追加総量、削除総量、追加と削除の回数、追加削除比率、最初と最後のプール活動タイムスタンプ、最後のスワップ取引情報、不活性状態など15の属性を含んでおり、トークンの活動履歴を詳細に追跡できる構造になっている
データセットは「疑わしい」ケースと「確定した」ケースを区別しており、疑わしいケースは急激な流動性引き抜きや取引量の大幅な減少が見られるがまだユーザーが取引しているもの、確定したケースは完全に不活性化したものを指す
活性プールは平均80回以上の削除アクションを示し頻繁な取引と活発なプール管理が行われているのに対し、不活性プールは平均13回程度の削除しか見られず、多くは1回または数回の削除しかないことが分析から明らかになっている
機械学習による分類実験では、AdaBoostアルゴリズムが97.6パーセントの精度でトークンの活性・不活性状態を分類することに成功しており、流動性の削除回数と追加回数が最も重要な特徴量として機能している
EthereumやBSCと異なり、SolanaはEVM互換性がなく独自のランタイム環境とProof of HistoryとProof of Stakeを組み合わせた独自のコンセンサスメカニズムを持つため、既存の標準化されたセキュリティ対策をそのまま適用できないという課題がある
データセットの公開により、研究者や開発者が新しい検出・予防手法を開発するための基盤が整備され、リアルタイムでの不正検知システムの構築、他のブロックチェーンとの比較研究、より堅牢なガバナンスフレームワークの設計などが可能になることが期待されている
分散型金融の理想は仲介者を排除し誰もが平等にアクセスできる金融システムを実現することだが、その分だけ規制が緩く詐欺のリスクも高まるため、完全な分散化と適切な保護措置のバランスをどう取るかが重要な課題となっている
pump.funのようなプラットフォームが無料でのトークン作成を可能にし、開発者が大量の供給量を保持できる仕組みを提供していることが、ラグプルのリスクをさらに高める要因となっており、技術的な便利さと安全性のトレードオフが顕在化している
キーワード解説
【ラグプル】
開発者が投資家から資金を集めた後、突然流動性プールから資金を引き抜き姿を消す詐欺行為
【分散型金融】
仲介者を介さずブロックチェーン上で金融サービスを提供する仕組み
【分散型取引所】
中央管理者なしにユーザー間で直接暗号資産を取引できるプラットフォーム
【リクイディティプール】
分散型取引を可能にするためスマートコントラクト内に保管されるトークンの準備金
【Solanaブロックチェーン】
2020年にローンチされた高速・低コストが特徴の独自アーキテクチャを持つブロックチェーン
【ガス代】
ブロックチェーン上で取引を実行するために必要な手数料
【不活性トークン】
流動性削除後にユーザーとの取引が完全に停止したトークン
【1日トークン】
作成から最後の取引までが1日未満の極めて短命なトークン
【スマートコントラクト】
ブロックチェーン上で自動実行される契約プログラム
【EVM互換性】
Ethereum仮想マシンと互換性があり同じ標準を共有できること
【Proof of History】
Solana独自の時系列証明メカニズム
【機械学習分類】
過去のデータパターンを学習して新しいデータを分類する技術