賢さは量じゃなく、つながりで決まる――折り畳まれた思考の話

Seo Seungchul
4月30日
読了時間: 12分

シリーズ: 論文渉猟

◆今回の論文： Qiguang Chen et al., "The Molecular Structure of Thought: Mapping the Topology of Long Chain-of-Thought Reasoning" （arXiv, 2026年1月9日）

概要：大規模言語モデル（LLM）が長い推論の連鎖を人間の例示や非推論モデルから学べない理由を探った論文。効果的な推論軌跡は「分子構造」のような安定したトポロジーを持ち、「深い推論（共有結合的）」「自己反省（水素結合的）」「自己探索（ファンデルワールス力的）」という3種の"論理的結合"から構成されると提唱。表面的なキーワードの模倣では構造は転写されないことを示し、構造合成を誘導する手法（Mole-Syn）を提案した。

AIは、なぜ人間の「考え方」をそのまま真似しても賢くなれないのでしょうか。

最新の研究は、少し意外な場所からその答えを探しました。分子化学です。水分子がH₂Oという「形」を持つように、高度な推論にも安定した構造があるのではないか——そんな仮説から出発したこの論文は、思考の連鎖を「共有結合」「水素結合」「ファンデルワールス力」という化学的な比喩で記述することで、AI学習の謎に迫ります。

でも、これはAIだけの話でしょうか。富良野とPhronaの対話は、「何を知っているか」よりも「どうつながっているか」という問いへと、少しずつ深まっていきます。思考の「形」というアイデアは、学び、関係性、そして知識そのものの見方を変えるかもしれません。

思考を「形」で見るとはどういうことか

富良野： 今回の論文、思考の「分子構造」って、タイトルだけ見ると化学の話かと思いますね。

Phrona： 私も同じ反応でした。でも読み進めると、これはかなり本気の比喩なんですよね。比喩というより、むしろモデルとして使っている。

富良野： そうなんです。AIが長い推論の連鎖、何ステップにもわたる思考のプロセスを学ぼうとするとき、単に「どんな言葉が出てくるか」をなぞっても学べない、と。そこで彼らが言うのは、推論には安定した「形」があって、その形ごと移植しないといけない、という話です。

Phrona： 「形ごと移植」というのが面白い表現ですね。コピーしているようで、実はコピーできていない、っていう。

富良野： ちょうどそれです。同じ単語を並べても、その結びつきのパターンが違えば、全然別の「思考」になってしまう。論文ではこれを「意味論的異性体」と呼んでいて——

Phrona： 異性体、化学の用語ですよね。同じ元素を持ちながら、結合の仕方が違うと性質が変わる。

富良野： 水と過酸化水素、みたいな。H₂OとH₂O₂。原子の種類は同じなのに、つながり方が一個違うだけで、一方は水で、もう一方は消毒液になる。

Phrona： それを推論に当てはめたときの「つながり方」って、何なんでしょう。

富良野： 論文では3種類の「論理的な結合」として整理されています。まず「深い推論」——これは推論の骨格を形成する、強くて局所的なつながり。次に「自己反省」——後のステップが前のステップを振り返って誤りを修正する、折り返しのような動き。そして「自己探索」——離れた概念クラスター同士をゆるく橋渡しする動き。

Phrona： 3つの動きで推論が成り立っている、と。

富良野： はい。で、それぞれを化学の結合に喩えている。深い推論は共有結合——切れたら分子が壊れる、強い結びつき。自己反省は水素結合——分子が折れ畳まれる、やや柔軟な結びつき。自己探索はファンデルワールス力——近くにいると働く、弱いけど遠距離の結びつき。

Phrona： なんか、タンパク質の立体構造みたいですね。一次配列だけじゃなくて、折れ畳まれた最終的な形が機能を決める。

模倣の限界——言葉を真似しても「思考」は移らない

Phrona： でも、そもそもなぜ模倣じゃうまくいかないんでしょう。人間だって、真似から始めて学ぶじゃないですか。

富良野： そこが面白いところで、論文が示したのは、AIを「人間の推論例から学習させる」と、思いの外うまくいかない、ということなんです。人間の書いた思考のプロセスを読ませても、強力な推論モデルには遠く及ばない。

Phrona： 人間の推論が「弱い」という話ですか？

富良野： むしろ「構造が違う」という話だと思います。人間が書く推論の記録って、どこか線形なんですよね。こう考えて、次にこう考えて、という。でも強力なAIの推論軌跡を調べると、もっと折れ畳まれた、複雑な空間的構造を持っている。

Phrona： 人間の思考を書き言葉にした時点で、すでに何かが失われている、みたいな話ですね。

富良野： うん、そう読めます。書き下した推論は、推論の「結果」または「痕跡」であって、推論の「構造」そのものではないかもしれない。

Phrona： なんか、楽譜と演奏の違いみたいな気もする。楽譜から学べることと、実際に音楽家の演奏を聴いて学べることって、違いますよね。楽譜には記せない何かが演奏の中にある。

富良野： その比喩、結構いいかもしれない。論文でいえば、「キーワードの模倣」が楽譜の読解で、「構造の移植」が演奏のスタイルを丸ごと受け継ぐ、みたいな。

Phrona： じゃあ、どうすれば「構造」が移るんでしょう。

富良野： 論文は、強力な推論モデル同士の間では、この構造が比較的安定して転写できる、と言っています。同じような「結合の分布」を持っているから。逆に、構造が違うモデル同士を混ぜようとすると、かえって性能が落ちる「構造的カオス」が起きてしまう。

Phrona： 同じ原子の組み合わせでも、違う折れ畳まれ方をしているタンパク質を混ぜると、凝集して機能しなくなる、みたいな。

富良野： まさにその通りで、論文もその現象を実験で確認しています。統計的に似ているように見えても、深層の構造が合わなければ、学習が崩れる。

「ノード」より「エッジ」——何を知るかより、どうつながるか

Phrona： 少し話を引いて考えてみると、これって「何を知っているか」より「どうつながっているか」の方が重要だ、という話ですよね。

富良野： 論文はまさにそう明言していて、従来の研究はノード、つまり推論の各ステップ、各概念に注目してきた、と。でもこの論文はエッジ——ステップ同士の接続の質と分布——に焦点を当てている。

Phrona： エッジに着目する、か。なんか、社会ネットワーク論みたいですね。人を個体として見るより、誰と誰がどうつながっているかを見た方が、集団の動きが分かる、っていう。

富良野： そうそう。「誰がどんな知識を持っているか」より、「誰がどうつながっているか」の方が、情報の流れを決める、という見方に近い。

Phrona： あるいは都市の話でもそうで、どんな建物があるかより、どういう道でつながっているかが、街の使いやすさを決める。

富良野： 建物の質より、路地の設計、みたいな。

Phrona： で、この「エッジの重要性」を思考に当てはめると、どういうことが言えそうですか？

富良野： 推論の優劣は、個々の知識の正確さだけじゃなくて、知識をどう組み合わせるか、どう振り返るか、どう遠い概念に橋をかけるか、という「つながりのパターン」で決まる、ということだと思います。

Phrona： 「知識が多い」ことと「よく考えられる」ことは別、っていうのは、直感的にはわかる気がするんですよ。でも、何が違うのかは説明しにくかった。この論文は、その違いを「結合の構造が安定しているかどうか」として記述しようとしている。

富良野： 言語化しにくかったものに輪郭を与えようとしている、という意味では、認識論的に重要な試みだと思います。完全に成功しているかどうかは別として。

「折れ畳まれた思考」と、知識の立体性

Phrona： 「思考が折れ畳まれている」というイメージが引っかかっていて。それって、線形じゃない、ということですよね。

富良野： 論文では、深い推論は局所的に密なクラスターを形成して、自己反省はその後のステップが前のクラスターに折り返す動きをする、と言っています。意味的な空間の中で、思考が前後に往復しながら収束していく、みたいな。

Phrona： 一直線に進むんじゃなくて、戻ったり、迂回したりしながら。

富良野： そう。そして戻ることで、誤りが修正される。ただ前に進むだけじゃなく、過去の自分を参照しながら、軌道を修正していく。

Phrona： なんかそれ、人間の熟達にもそういう側面ありますよね。初心者は線形に「次は何をすればいいか」を追いかけるけど、熟達者はもっと往復する。前のステップに戻って確認したり、大きく迂回したりする。

富良野： 「振り返り」の質が、学習の深さを決める、という議論は教育研究でもありますよね。でも、その「振り返り」がどういう構造を持っているかを、ここまで几帳面に記述しようとした研究は少なかった。

Phrona： 教育の世界では「メタ認知」という言葉で大雑把に括られてきたものを、もっと細かく解剖しようとしている、みたいな感じ？

富良野： そうかもしれない。ただ、これはあくまでAIの推論軌跡を分析した話なので、そのまま人間に適用できるかは慎重にならないといけないけど。

Phrona： もちろん。でも、ヒントにはなる。

思考の「形」は学べるのか、それとも育つものか

Phrona： ちょっと気になっていたんですが、この「構造」って、与えることができるものなんでしょうか。それとも、何かを経験することで自然に育つものなんでしょうか。

富良野： 論文のアプローチは「与える」方向で、強いモデルの推論構造を分析して、それを弱いモデルに合成的に与えようとしています。Mole-Synという手法で。

Phrona： でもそれって、「料理のレシピを覚えさせる」のと、「何度も料理する経験から体得させる」のと、どちらに近いんでしょう。

富良野： うーん、もっと言うと、「どんな素材をどんな順番でどんな強さで調理するか」のパターン分布を直接転写しようとしている感じかな。レシピの写経じゃなくて、料理の仕方の癖ごとコピーしようとしている。

Phrona： 癖ごと。それが「構造の移植」か。

富良野： でも、人間の場合は、その癖は経験の堆積から出てくるものだから、転写できるかどうかはもっと難しい問いになりますよね。AIでこのアプローチが成功したとして、それが人間の学習にとって何を意味するかは、また別の話です。

Phrona： 「形を与えることができるか」という問いと、「形は自分で作るものか」という問いが、並走している感じがします。

富良野： その緊張は、教育論の根本にずっとある問いでもありますよね。教えるとはどういうことか、という。

「安定した構造」という問いが残すもの

Phrona： この論文を読んで、「安定」という言葉が何度も出てくることに気づいたんです。安定した構造、安定した学習。でも、思考って安定しすぎると、何かが失われる気もして。

富良野： 面白い引っかかりですね。論文が言う「安定性」は、学習可能性とか汎化性能のことで、つまり同じ構造が様々な問題で再現可能かどうか、ということなんですが。

Phrona： それはわかるんですけど、安定した構造を持った思考は、予測可能な思考でもある、という側面がある気がして。構造が固定されれば、その構造が得意でないことへの対応が弱くなる、みたいな。

富良野： なるほど、「安定」と「柔軟性」のトレードオフ、ということですね。論文はその点には直接答えていないけど、自己探索のボンドが弱い、遠距離の橋渡しをする役割を担っている、というのは、ある種の柔軟性を構造に組み込もうとしている、と読めるかもしれない。

Phrona： 強い骨格がありながら、ゆるいつながりも保持している。だから崩れにくい、という。

富良野： タンパク質でいえば、核となる部分は堅固に折れ畳まれていて、でも表面には柔軟なループ構造があって、それが機能的な多様性を生む、みたいな。

Phrona： なんか、組織論とも重なりますね。強いコアがあって、周縁が柔軟な組織が、変化に対応しやすい、みたいな話。

富良野： 飛躍はあるけど、そういう接続は面白いですね。「安定した構造を持つこと」と「固まりすぎないこと」のバランスが、知的な活動の根本に関わっている気がしてきた。

ポイント整理

思考の連鎖には「形」がある
- AIの高度な推論は、単語の並びではなく、推論ステップ間の「結合のパターン」として安定した構造を持つ。深い推論・自己反省・自己探索という3種の動きが、分子の化学結合のように推論全体を安定させる。
模倣では構造は移らない
- 人間が書いた推論の記録や、能力の低いモデルの例を真似しても、本質的な推論構造は転写されない。表面的な言葉の並びが似ていても、深層の結合パターンが違えば、全く別の推論になってしまう。
意味論的異性体——同じ素材、違う構造
- 同じ概念ノードを持つ推論チェーンでも、結合の仕方が異なれば成否が分かれる。化学の「異性体」（同じ原子・違う配置で別の物質）と同じ論理で、推論の質はノードではなくエッジ（接続の質）で決まる。
ノードよりエッジ——知識よりつながりの構造
- 従来の研究は「どんな概念が現れるか」に注目してきたが、この論文は「概念同士がどうつながるか」を重視する。何を知っているかより、どう折り返し、どう遠い概念に橋をかけるか、が推論の力を決める。
構造の混在は崩壊を招く
- 互いに安定した構造を持つ複数の異なるモデルを混ぜると、かえって「構造的カオス」が起きて性能が落ちる。統計的な類似性と構造的な適合性は別物であり、形が合わない素材の混合は学習を妨げる。
「安定」と「柔軟」のバランスが機能を決める
- 強固な推論の骨格（深い推論）と柔軟な遠距離のつながり（自己探索）が共存していることで、様々な問題に対応できる。固まりすぎず、でも崩れない——この構造上のバランスは、思考の質を考える上での根本的な問いを照らし出す。

キーワード解説

【連鎖推論（Chain-of-Thought / CoT）】

AIに「答えだけ」を出力させるのではなく、「考えるプロセス」を明示させる手法。「まずAを確認し、次にBを考え、その結果Cが導かれる」というように、推論のステップを言語化させる。長い連鎖推論（Long CoT）は、複数段階の複雑な問題を解く際に有効とされる。

【意味論的異性体（Semantic Isomers）】

同じ概念や単語を含みながら、それらの「結びつき方のパターン」が異なる推論チェーンのこと。化学の異性体（同じ原子を持ちながら構造が異なる分子）から借用した概念。見た目が似ていても、内部の結合構造が違えば推論の成否が分かれる。

【トポロジー（topology / 位相構造）】

ここでは「空間的な形や配置の構造」を指す。数学では、変形させても変わらない性質の学問だが、本論文では意味的な空間における推論ステップ同士の配置パターン（密なクラスター、折り返し、橋渡しなど）を指す言葉として使われている。

【エントロピー収束（entropy convergence）】

情報理論的な概念で、ここでは「推論の方向性がどれだけ速く絞られていくか」を指す。エントロピーが高い状態は、可能性が広がっている不安定な状態。推論が進むにつれてエントロピーが下がっていく（収束していく）速さが、学習の安定性に関わる、と論文は主張する。

【蒸留（distillation）】

強力なAIモデルの出力や振る舞いを使って、より小さく・軽いモデルを訓練する手法。教師モデルの知識を生徒モデルに「移植」するイメージ。本論文は、表面的な出力の蒸留ではなく、推論の「構造」を蒸留することの重要性を強調する。

【ファンデルワールス力（van der Waals force）】

物質間に働く弱い引力の一種。共有結合やイオン結合に比べて弱いが、近くにいることで働き、分子の凝集や複雑な立体構造の形成に貢献する。本論文では、遠く離れた概念クラスター同士を弱くつなぐ「自己探索」の結合に喩えられる。