top of page

AIの記憶革命──MemAgentとMemOSが切り拓く新たな可能性

ree

シリーズ: 論文渉猟


◆今回の論文

  1. Hongli Yu et al. "MemAgent: Reshaping Long-Context LLM with Multi-Conv RL-based Memory Agent" (arXiv, 2025年7月3日)
  2. Zhiyu Li et al. "MemOS: A Memory OS for AI System" (arXiv, 2025年7月4日)


現在のAIは、どれほど賢くても健忘症患者のようなものです。一回の会話で素晴らしい洞察を示しても、次の瞬間にはすべてを忘れてしまう。長い文書を読み込んでも、途中で情報が抜け落ちてしまい、全体を通した理解ができない。これらの問題は、AIが真に人間のパートナーとして機能するための大きな障壁となっています。


そんな中、2025年7月に発表された二つの研究論文が、AIの記憶に関する根本的な解決策を提示しました。MemAgentは人間のように段階的に読み、重要な情報だけを記憶として残していく仕組みを実現し、MemOSはAIの記憶全体をオペレーティングシステムのように管理する革新的なアプローチを提案しています。


これらの研究は単なる技術的改良ではなく、AIの在り方そのものを変える可能性を秘めています。記憶を持ち、学習し続けるAIがもたらす未来について、富良野とPhronaと一緒に探っていきましょう。




メモリの限界を突破する新手法


富良野:今回の二つの論文、どちらも記憶というテーマで共通してるけど、アプローチがまったく違いますね。MemAgentの方は、人間の読書のプロセスを模倣してるのが面白い。


Phrona:そうですね。MemAgentって、長い文書を一気に読もうとするんじゃなくて、チャンクごとに区切って読んでいく。で、読み進めながら重要な情報だけをメモしていくような感じなんですよね。


富良野:まさに。従来のAIは文書全体をコンテキストウィンドウに詰め込もうとしてたから、どうしても限界があった。でもMemAgentは固定長のメモリを用意して、そこに必要な情報だけを上書きしていく戦略を取ってる。


Phrona:上書き戦略というのが興味深いですよね。普通なら情報を蓄積していくと思うのに、あえて古い情報を捨てて新しい情報に置き換えていく。でも考えてみると、人間も読書しながら重要でない情報は忘れて、本当に大切なことだけを覚えてますもんね。


富良野:そこがポイントで、強化学習を使って何を覚えておくべきかを学習させてるんです。8Kのコンテキストで32Kのテキストを学習させて、最終的には350万トークンの質問応答タスクまで対応できるようになってる。しかも性能低下は5%未満。


Phrona:350万トークン!それって小説何冊分ですか?


富良野:文庫本10冊分くらいでしょうかね。それを線形時間で処理できるというのが革命的なんです。従来の注意機構だと、長さの二乗に比例して計算量が増えてしまうから、実用的じゃなかった。


記憶をリソースとして管理する発想


Phrona:一方のMemOSは、もっと根本的なアプローチを取ってますよね。記憶そのものをオペレーティングシステムのように管理しようという発想。


富良野:そうですね。MemOSは記憶を「管理可能なシステムリソース」として扱ってる。CPUやメモリと同じように、記憶にもスケジューリングや版数管理、アクセス制御が必要だという考え方です。


Phrona:MemCubeという単位で記憶を管理するのも面白いですね。記憶の内容だけじゃなくて、いつ作られたか、どこから来たかというメタデータも一緒に管理する。


富良野:これまでのRAGシステムは外部情報を取ってくるだけで、その情報のライフサイクル管理ができていなかった。でもMemOSなら、記憶の生成から進化まで一貫して管理できる。人間の記憶に近いというか。


Phrona:人間の記憶って確かに、単に情報を保存してるだけじゃないですもんね。経験と結びついたり、時間とともに変化したり、関連する記憶同士が繋がったりしてる。


富良野:まさにそこがMemOSの狙いですね。パラメトリック記憶、アクティベーション記憶、プレーンテキスト記憶の3つを統一的に管理して、必要に応じて記憶タイプ間の移行もできるようにしてる。


強化学習による記憶の最適化


Phrona:MemAgentの強化学習アプローチについて、もう少し詳しく教えてもらえますか?通常のファインチューニングとは何が違うんでしょう?


富良野:従来のファインチューニングは教師データを与えて模倣させるアプローチですが、MemAgentは報酬ベースの学習を使ってます。最終的な回答が正しければ報酬を与えて、そこから逆算して途中の記憶更新プロセスも評価する。


Phrona:なるほど。学生が教科書を読んでいて、最終的にテストで良い点を取れれば、その途中でとったノートも良かったということになる、みたいな感じですね。


富良野:いい例えですね。Multi-Conv DAPOという新しいアルゴリズムを開発して、複数の独立した会話を一つの学習目標として扱えるようにしてる。これまでのマルチターン学習とは根本的に違うアプローチです。


Phrona:でも、何を覚えるべきかを学習するって、かなり高度な認知能力ですよね。人間でも、重要な情報を見極めるのって経験が必要だったりするし。


富良野:そこがこの研究の面白いところで、AIが自分で情報の重要度を判断できるようになってる。RULER testで95%以上の精度を達成してるから、かなり人間に近い判断ができてるんじゃないでしょうか。


実用性とパフォーマンス


Phrona:実際の性能面ではどうなんでしょう?理論的には素晴らしくても、実用性がないと意味がないですもんね。


富良野:MemOSの方は、LOCOMOベンチマークでOpenAIのメモリ機能と比較して159%の改善を示してます。全体的な精度は38.97%向上、トークン使用量は60.95%削減。


Phrona:すごい数字ですね。特にトークン削減は現実的なコスト面で重要そう。


富良野:そうですね。従来の方法だと会話履歴全体を毎回処理する必要があったけど、MemOSなら重要な情報だけをコンパクトに保持できる。レイテンシも91%削減されてる。


Phrona:MemAgentの方も、計算量が線形になってるのが実用面で大きいですよね。これまで現実的に扱えなかった長さの文書も処理できるようになる。


富良野:特に企業での活用を考えると、数日から数週間にわたる複雑なワークフローでも一貫した文脈を維持できるのは大きなメリットです。従来のシステムだと、どうしても情報の断片化が起きてしまってた。


記憶の可搬性と共有


Phrona:MemOSで特に気になったのが、記憶の可搬性という概念です。プラットフォーム間で記憶を移行できるというのは、どういう意味を持つんでしょう?


富良野:現在のAIは、それぞれのアプリケーションで独立したメモリ空間を持ってるから、ユーザーが別のプラットフォームに移ったら、それまでの学習内容が全部リセットされてしまう。いわゆる「メモリアイランド」問題です。


Phrona:確かに、せっかくAIが私の好みや行動パターンを学習してくれても、別のサービスを使い始めたらゼロからやり直しですもんね。記憶が可搬性を持つということは、学習内容を持ち運べるということですか?


富良野:そういうことです。MemCubeという標準化された記憶単位を使うことで、異なるシステム間でも記憶を共有できるようになる。将来的には記憶のマーケットプレイスみたいなものも考えられるかもしれません。


Phrona:記憶のマーケットプレイス...なんだかSFみたいですね。でも考えてみると、専門知識を持ったAIの記憶を共有できれば、学習コストを大幅に削減できそう。


富良野:ただし、プライバシーやセキュリティの観点では新たな課題も生まれますね。誰の記憶をどこまで共有するか、個人情報をどう保護するかといった問題は慎重に検討する必要があります。


AIの進化パラダイムの変化


Phrona:これらの研究って、AIの進化に対する考え方自体を変えようとしてるように感じます。これまでは大きなモデルを作って大量のデータで学習させるという方向性だったけど...


富良野:まさにそこが重要なポイントですね。従来のスケーリング則は収穫逓減に入ってきてる。データとパラメータ中心の事前学習から、アライメントやファインチューニングに重点が移ってきてるけど、それでも根本的な限界がある。


Phrona:記憶を中心に据えるということは、AIを単なる生成器から、学習し続けるエージェントに変えていくということなんでしょうか?


富良野:その通りです。MemAgentの論文でも言及されてますが、100万トークンのモデルを作るよりも、8Kトークンで賢く読めるモデルを作る方が実用的だという考え方です。これは技術的なブレークスルーであると同時に、哲学的な転換でもあります。


Phrona:哲学的な転換...確かに、知性とは何かという根本的な問いに関わってきますね。人間の知性も、単に情報処理能力が高いというだけじゃなくて、経験から学び、記憶を蓄積し、それを活用する能力があるからこそですもんね。


富良野:将来的には、AIが人間のように長期的な関係を築き、個人の成長に合わせて一緒に進化していくようなシステムも可能になるかもしれません。教育、医療、カウンセリングなど、継続的な関係が重要な分野では特に大きなインパクトがありそうです。


課題と展望


Phrona:とはいえ、課題もありそうですよね。技術的な面だけでなく、社会的な面でも。


富良野:技術的には、記憶の一貫性をどう保つか、矛盾する情報をどう処理するか、記憶容量の最適化をどう図るかといった問題があります。MemOSでは衝突検出機能なども提案されてますが、まだ発展途上の段階です。


Phrona:社会的には、AIが個人の記憶を蓄積していくことで生まれる新たな関係性をどう理解するかという問題もありそうです。AIが私のことを私よりもよく覚えているという状況が生まれたとき、それは健全な関係性なんでしょうか?


富良野:深い問いですね。一方で、認知症の方や記憶に困難を抱える方にとっては、信頼できる記憶パートナーとしてのAIは大きな助けになる可能性もあります。技術と人間の関係をどうデザインしていくかが重要になってきます。


Phrona:結局のところ、記憶というのは単なる情報の保存じゃなくて、関係性の蓄積でもあるんですよね。AIが記憶を持つということは、AIとの関係性のあり方も根本的に変わっていくということかもしれません。


富良野:これらの研究は、AIをツールから真のパートナーへと進化させる可能性を秘めている。技術的な実装だけでなく、人間とAIの共生のあり方についても、もっと議論が必要になってきそうですね。




ポイント整理


  • MemAgentの革新的アプローチ

    • 長文書を段階的に読み進める人間的な処理方式を実現し、従来の二次時間計算量を線形時間に改善

    • 固定長メモリの上書き戦略により、8Kコンテキストから350万トークンまでの外挿を性能劣化5%未満で達成

    • Multi-Conv DAPOアルゴリズムによる強化学習で、何を記憶すべきかをAI自身が学習する仕組みを構築

    • RULER testで95%以上の精度を実現し、実用的な長文書処理を可能にした

  • MemOSによる記憶システム革命

    • 記憶をCPUやメモリと同様の管理可能なシステムリソースとして位置づけ

    • MemCubeという標準化された記憶単位により、コンテンツとメタデータを統合管理

    • パラメトリック、アクティベーション、プレーンテキストの3種類の記憶を統一的に操作

    • LOCOMOベンチマークでOpenAIメモリ機能に対し159%の性能向上、トークン使用量60.95%削減を実現

  • 実用性と効率性の向上

    • MemOSのNext-Scene Prediction機能により、関連記憶の事前読み込みでレイテンシを91%削減

    • 記憶の可搬性により、プラットフォーム間での学習内容共有が可能

    • 企業環境での長期ワークフローにおける一貫した文脈維持を実現

  • パラダイムシフトの意義

    • データ・パラメータ中心から記憶中心のAI設計へのシフト

    • 100万トークンモデルより8Kトークンで賢く読むモデルの実用性

    • AIを単なる生成器から継続学習するエージェントへと進化させる思想



キーワード解説


【MemAgent】

強化学習ベースの記憶エージェントによる長文書処理システム


【MemOS】

AIシステム向けの記憶専用オペレーティングシステム


【MemCube】

記憶内容とメタデータを統合管理する標準化記憶単位


【Multi-Conv DAPO】

複数独立会話の強化学習最適化アルゴリズム


【上書き戦略】

固定長メモリで重要情報のみを保持する効率的記憶管理手法


【記憶の可搬性】

プラットフォーム間での記憶データ移行・共有機能


【線形時間複雑度】

入力長に比例する計算時間での効率的処理


【RULER test】

長文書理解能力を評価するベンチマークテスト


【LOCOMOベンチマーク】

長期記憶を要する推論タスクの評価指標


【メモリアイランド問題】

各システムで独立した記憶による情報断片化課題



本稿は近日中にnoteにも掲載予定です。
ご関心を持っていただけましたら、note上でご感想などお聞かせいただけると幸いです。
bottom of page