top of page
Convisage
本ブログの内容は、あくまで代表 徐勝徹の個人的な見解であり、Projeteam, Inc.の公式見解や業務上の立場を示すものではありません。
検索

論文渉猟


半分捨てたら、むしろうまくいった――AIの学習を「あえて乱す」という逆転の発想
シリーズ: 論文渉猟 ◆今回の論文: Taejong Joo et al., "On Surprising Effectiveness of Masking Updates in Adaptive Optimizers" (arXiv, 2026年2月17日) 概要: 大規模言語モデル(LLM)の学習において、パラメータ更新をランダムにマスク(省略)することが高い効果を発揮することを示した研究。ランダムマスクがもたらす「曲率依存の幾何学的正則化」という理論的な説明を与えつつ、そこからさらにモメンタムと勾配の方向整合性を利用した「Magma」を提案。1Bパラメータ規模のモデルでAdamと比較して約19%、Muonと比較して約9%の性能改善(perplexity削減)を達成した。 大きなAIモデルを訓練するとき、計算リソースは惜しみなく使うのが当然だと思われています。勾配(こうばい)と呼ばれる学習の手がかりは、せっかく計算したのだから全部使う。それが常識でした。 ところが最近、その前提を揺るがすような研究が登場しました。パラメータの更新をランダムに

Seo Seungchul
4 日前読了時間: 12分


民主主義は「期待に応える」のか?──数字で見る、その実力と限界
シリーズ: 論文渉猟 ◆今回の論文: Maya Tudor, "What Democracy Does . . . And Does Not Do" (Journal of Democracy, 2025年10月) 概要: 民主主義が健康、教育、平和、経済成長といった社会的成果において実際に何を達成し、何を達成しないのかを、50以上の査読付き研究を基に実証的に検証した論文。民主主義の平均的なパフォーマンスは権威主義体制を上回るものの、その優位性は「劇的」ではなく「安定的」であることを示す。 民主主義への幻滅が広がっています。「強いリーダーシップがあれば、もっと成長できるのに」「選挙なんかやってる場合じゃない」——そんな声が、世界のあちこちで聞こえてきます。実際、急成長を遂げた権威主義国家の存在は、民主主義の「有用性」そのものに疑問を投げかけているようにも見えます。 では、民主主義は本当に「役に立たない」のでしょうか。オックスフォード大学のMaya Tudor教授は、この問いに正面から向き合いました。寿命、教育、平和、経済成長——これら人々が政府

Seo Seungchul
5 日前読了時間: 15分


AIは「ペーパークリップ・マキシマイザー」になるのか、それとも単なる「ドジっ子」なのか?──知能と一貫性のパラドックス
シリーズ: 論文渉猟 ◆今回の論文: Alexander Hägele et al., "The Hot Mess of AI: How Does Misalignment Scale With Model Intelligence and Task Complexity?" (arXiv, 2026年1月30日) 概要: AIモデルの誤りをバイアス(系統的誤り)とバリアンス(非一貫的誤り)に分解し、モデルの知能とタスクの複雑さに応じて「非一貫性(incoherence)」がどう変化するかを測定。フロンティアモデル(Claude Sonnet 4、o3-mini、o4-mini、Qwen3)を用いた実験の結果、推論が長くなるほど、またタスクが難しくなるほど、失敗が非一貫的になる傾向を発見。これは将来のAI失敗が「整列された危険な目標の追求」より「産業事故」に近い形態を取る可能性を示唆する。 AIが人間を超える知能を持ったとき、私たちは何を恐れるべきなのでしょうか。SF映画でよく描かれるのは、冷徹な計算に基づいて人類を脅かす超知性AIです。しかし

Seo Seungchul
5 日前読了時間: 15分


AIが「完全に」書いたディープラーニング基盤ソフト──VibeTensorが示す開発の未来
シリーズ: 論文渉猟 ◆今回の論文: Bing Xu et al., " VibeTensor: System Software for Deep Learning, Fully Generated by AI Agents " (arXiv, 2026年1月21日) 概要: VibeTensorは、大規模言語モデルを活用したAIエージェントによって生成された、オープンソースの深層学習システムソフトウェアです。PyTorchスタイルのテンソルライブラリをC++20で実装し、Python/Node.jsのフロントエンドからCUDAメモリ管理まで、一貫したランタイムを提供します。人間は高水準の設計指針のみを与え、コードの生成と検証はエージェントが自律的に行いました。NVIDIA H100およびBlackwell世代のGPUで動作検証が行われ、小規模な学習タスク(系列反転、CIFAR-10、ミニGPT)でエンドツーエンドの学習が完了しています。研究チームはこれをAI支援ソフトウェア工学における一つの里程標と位置づけています。 プログラマーがコードを書

Seo Seungchul
3月4日読了時間: 16分


AIはパラメータを変えずに賢くなれるのか?──強化学習の常識を覆す新アプローチ
シリーズ: 論文渉猟 ◆今回の論文: Yuzheng Cai et al., "Training-Free Group Relative Policy Optimization" (arXiv, 2025年10月9日) 概要: 大規模言語モデル(LLM)エージェントの性能向上には通常、コストのかかるパラメータ更新が必要とされる。本研究では、パラメータを一切変更せずにGRPO(Group Relative Policy Optimization)と同等の効果を得る「Training-Free GRPO」を提案。複数の出力を比較して「意味的な優位性」を自然言語の経験として抽出し、それをプロンプトに組み込むことで、数学的推論やウェブ検索タスクにおいて、従来の強化学習手法を大幅に下回るコストで同等以上の性能を達成した。 AIを賢くするには、膨大なデータで「再訓練」するしかない——そう思っていませんか。大規模言語モデル(LLM)の性能を高めるために、研究者たちは何千時間もGPUを回し、何万ドルものコストをかけて「パラメータ」と呼ばれるモデル内部の数値を調

Seo Seungchul
3月2日読了時間: 10分


AIと人間が「難問」を解くとき──Co-FunSearchが切り拓く協働の新地平
シリーズ: 論文渉猟 ◆今回の論文: Henri Nikoleit et al., "The Art of Being Difficult: Combining Human and AI Strengths to Find Adversarial Instances for Heuristics" (arXiv, 2026年1月23日) 概要: 本論文は、大規模言語モデル(LLM)を用いたFunSearchアルゴリズムと人間の専門家の協働によって、組合せ最適化問題のヒューリスティクス(近似解法)に対する「敵対的事例」を生成する手法「Co-FunSearch」を提案。ナップサック問題、ビンパッキング問題、階層的クラスタリング、ガソリン問題という4つの古典的問題において、10年以上更新されていなかった理論的下限を改善することに成功した。 「AIがついに数学上の難問を解いてみせた」——そんな見出しをニュースで目にすることが増えました。でも、実際のところどうなのでしょうか。AIは本当に「考えて」いるのか、それとも単にパターンを当てはめているだけなのか。

Seo Seungchul
2月25日読了時間: 13分


脳は「全部見ていない」のにうまくいく──「ジャストインタイム」で世界を理解する人間の認知戦略
シリーズ: 論文渉猟 ◆今回の論文: Tony Chen et al., "' Just in Time' World Modeling Supports Human Planning and Reasoning " (arXiv, 2026年1月20日) 概要: 確率的なメンタルシミュレーションは人間の推論・計画・予測において重要な役割を果たすとされるが、複雑な環境でのシミュレーションは人間の認知容量の限界を超える要求を課す。本論文では、シミュレーション、視覚探索、表象の更新を緊密に連携させる「ジャストインタイム(JIT)」フレームワークを提案。このモデルは、オブジェクトのごく一部しか符号化しないにもかかわらず、高い有用性を持つ予測を実現する。グリッドワールドのナビゲーション課題と物理的推論課題において、複数の行動指標でJITモデルが人間の行動をよく説明することを示した。 私たちは日常的に、複雑な環境の中で計画を立て、予測し、行動しています。たとえば、雑然としたリビングを横切ってソファまで歩くとき、落ちているおもちゃを避け、テーブルの角に注意

Seo Seungchul
2月23日読了時間: 15分


「存亡の危機」に晒される民主主義国家が抱えるジレンマ──ウクライナ、イスラエル、台湾の共通点
シリーズ: 論文渉猟 ◆今回の論文: Jarosław Kuisz et al., "The Post-Traumatic Sovereignty Trap" (Journal of Democracy, 2026年1月) 概要: 本論文は「ポスト・トラウマ的主権」という分析枠組みを用いて、存亡の脅威に直面する小規模民主主義国家──ウクライナ、イスラエル、台湾──の国内政治と外交政策を検討する。歴史的トラウマが集団的恐怖を形成し、現在の安全保障上の選択を規定している実態を明らかにするとともに、こうした国々が西側諸国との緊密な連携を維持するために民主主義的credentials(信頼性)をソフトパワーとして活用している点を分析している。 民主主義の価値を掲げながら、常に「国が消滅するかもしれない」という恐怖と向き合い続ける国があります。ウクライナ、イスラエル、台湾──地理も歴史も文化も異なるこの3つの国・地域には、ある共通した政治的条件があります。それは、権威主義的な大国から「そもそもお前に存在する権利はない」と突きつけられているということです。

Seo Seungchul
2月17日読了時間: 11分


「多数決=民主主義」という思い込みを疑う──制度設計の正当性をめぐる論争
シリーズ: 論文渉猟 ◆今回の論文: Michael Meyer-Resende, "What Institutions Truly Subvert Democracy?" (Journal of Democracy, 2026年1月) 概要: 本論文は、レビツキーとジブラットが提唱した「民主主義を損なう制度」という概念を批判的に検討する。権威主義的なアクターがルールを悪用しているという指摘には同意しつつも、民主主義を厳格な「投票多数決主義」に還元することへの警鐘を鳴らす。小選挙区制、連邦制における上院の平等代表、独立した中央銀行などを「本質的に疑わしい制度」と見なすことは、善意で設計された多くの制度選択を不当に「非民主的」とレッテル貼りすることになると論じる。 民主主義を守るために、どんな制度が必要なのか。この問いに対して、近年よく聞かれる答えがあります。「ポピュリスト政権がチェック・アンド・バランスを弱体化させ、多数派の意思を暴走させている」というものです。しかし、本当にそうでしょうか。 実は、権威主義的な政権が利用しているのは、多数派の力

Seo Seungchul
2月15日読了時間: 16分


「批判的思考力は教えられるのか」──341件の研究が示す、対話・実践・伴走の効果
シリーズ: 論文渉猟 ◆今回の論文: Philip C. Abrami et al., "Strategies for Teaching Students to Think Critically: A Meta-Analysis" (Review of Educational Research, 2015年6月) 概要: 批判的思考(Critical Thinking)の教育介入効果に関するメタ分析。2009年までに発表された準実験・真実験研究を対象に、341件の効果量を統合。加重平均効果量は0.30(p < .001)で、批判的思考スキルと傾向性の両方を向上させる有効な教育戦略が存在することを実証。特に「対話」「本物の問題への取り組み」「メンタリング」の3要素が、組み合わせて用いられた場合に最も効果的であることを明らかにした。 「批判的思考力を鍛えましょう」というフレーズは、大学の授業や企業研修でよく耳にします。でも、そもそも批判的思考って、本当に教えることができるのでしょうか。生まれ持った才能の問題なのか、それとも訓練で伸ばせるスキルな

Seo Seungchul
2月11日読了時間: 18分


AIに「仮想パソコン」を与えたら、勝手に進化し始めた──コード以外のタスクで知性が目覚める新しい学習パラダイム
シリーズ: 論文渉猟 ◆今回の論文: Daixuan Cheng et al., "LLM-in-Sandbox Elicits General Agentic Intelligence" (arXiv, 2026年1月22日) 概要: LLMに仮想コンピュータ環境(サンドボックス)を与えることで、コード以外の領域でも汎用的な知能を引き出せることを実証した研究。追加訓練なしでもLLMが自発的に外部リソースへのアクセス、ファイル管理、スクリプト実行を行うことを発見し、さらにサンドボックス内での強化学習手法(LLM-in-Sandbox-RL)を提案。数学、物理、化学、生命医学、長文理解、指示追従など多様な領域で性能向上を確認。Pythonパッケージとしてオープンソース化されている。 もし、AIに自分専用のパソコンを一台まるごと渡したら、何が起こるでしょうか。ファイルを自由に作ったり、必要なソフトをインストールしたり、ネットで調べものをしたり——そんな環境を手にしたAIは、教えられていないことまで自分で学び始めるかもしれません。...

Seo Seungchul
2月10日読了時間: 16分


アメーバにも「知性」がある?──「探索効率」で測る、ニューロンを超えた認知の世界
シリーズ: 論文渉猟 ◆今回の論文: Robert Chis-Ciure et al., "Cognition all the way down 2.0: neuroscience beyond neurons in the diverse intelligence era" (Synthese, 2025年11月6日) 概要: 生物学的知性を「多スケール問題空間における探索効率」として形式化し、「基層認知(basal cognition)」研究における認識論的な膠着状態の解消を目指す論文。古典的な問題解決理論を拡張し、新たな「問題空間の語彙」と「探索効率の指標」を定義する。アメーバの走化性(化学物質に向かう運動)とプラナリアの頭部再生を経験的モデルとして検証し、これらの「単純な」生物でさえ、控えめに見積もっても200倍から10^21乗倍という桁違いの探索効率を示すと報告。神経科学の深い洞察はニューロンそのものではなく、むしろ多様な構成と起源をもつ全体へと部分を結びつける「認知的接着剤」としての物理・数学的パターンにあると論じる。...

Seo Seungchul
2月9日読了時間: 13分


ニューラルネットワークの「常識」を覆す──KANは深層学習の地図を塗り替えるか
シリーズ: 論文渉猟 ◆今回の論文: Aradhya Gaonkar et al., "Kolmogorov Arnold Networks and Multi-Layer Perceptrons: A Paradigm Shift in Neural Modelling" (arXiv, 2026年1月15日) 概要: 本論文はKolmogorov-Arnold Networks(KAN)と多層パーセプトロン(MLP)の包括的な比較分析を行い、非線形関数近似、時系列予測、多変量分類といった計算課題における両者の有効性を検証している。 ChatGPTや画像認識AI、自動運転の頭脳——これらすべての根底には、「多層パーセプトロン」と呼ばれる基本構造が横たわっています。1980年代から使われてきたこの仕組みは、いわばAIの「標準部品」。でも、もしその部品を根本から作り直したら、どうなるでしょうか。 2024年、60年以上前の数学定理を武器に、まったく新しい設計思想を持つネットワークが登場しました。その名はKolmogorov-Arnold...

Seo Seungchul
1月26日読了時間: 11分


「縫い目」から見える脱植民地化──ガーナ独立運動を支えた一人の仕立て屋の物語
シリーズ: 論文渉猟 ◆今回の論文: Bright Gyamfi, "Uncovering Radical Histories: Anna Budu-Arthur’s Everyday Politics of Decolonization and Transnational Solidarity" (Radical History Review, 2025年10月1日) 概要: 本論文は、ガーナ独立運動において重要な役割を果たしながら公的な記録からほぼ消えていた女性、アンナ・ブドゥ=アーサーの生涯を、オーラルヒストリーと個人アーカイブを通じて復元する試みである。彼女の経験を通じて、脱植民地化が単なる政治的独立ではなく、日常的な実践と汎大西洋的な連帯のなかで形作られた複合的なプロセスであったことを明らかにしている。 アフリカ大陸で最初にヨーロッパの植民地支配から独立を勝ち取った国、ガーナ。1957年の独立は、世界史の大きな転換点として記憶されています。しかし、その輝かしい物語の主役として語られるのは、ほとんどが男性の政治家や活動家たちでした。.

Seo Seungchul
1月24日読了時間: 14分


AIは「ひとりで考える」のをやめた──推論モデルの内側で起きている「思考の社会化」
シリーズ: 論文渉猟 ◆今回の論文: Junsol Kim et al., "Reasoning Models Generate Societies of Thought" (arXiv, 2026年1月15日) 概要: DeepSeek-R1やQwQ-32Bなどの推論特化型AIモデルが、なぜ従来のモデルより高い推論精度を達成するのかを分析した研究。単に長い思考の連鎖を生成するだけでなく、内部で複数の視点を持つ「エージェント」間の対話のような構造を生成していることを発見。この「思考の社会(Societies of Thought)」とも呼べる現象が、推論精度向上の鍵であることを実験的に示した。 あなたが何か難しい問題に直面したとき、頭の中で自分自身と議論することはありませんか。「いや待てよ、それは違うんじゃないか」「でもこっちの見方もあるよな」と、まるで複数の自分が意見をぶつけ合うように。実は最新のAI、特にDeepSeek-R1やQwQといった「推論モデル」と呼ばれるシステムの内部でも、驚くほど似たことが起きているようです。...

Seo Seungchul
1月20日読了時間: 12分


AIが司法試験に「本当に」受かるとき――自己検証という発明
シリーズ: 論文渉猟 ◆今回の論文: Andrew Shin, "Self-Verification is All You Need To Pass The Japanese Bar Examination" (arXiv, 2026年1月6日) 概要: 大規模言語モデル(LLM)に日本の司法試験短答式を解かせる研究。既存の手法では問題を真偽判定に分解して学習させていたが、本研究では試験の元の形式と採点基準を忠実に再現したデータセットを構築。「自己検証」機能を組み込んだファインチューニングにより、2024年度試験で合格点(93点)を上回る96点を達成。複数エージェントを協調させる方式より、単一モデル+自己検証の組み合わせが高い性能を示した。 「AIが司法試験に合格した」というニュースを聞くたびに、少し引っかかることがあります。それは「本当に同じ条件で受けたのか?」という素朴な疑問です。多くの研究では、問題を分解したり、採点方式を変えたり、何らかの形で「試験の側を変えて」成果を出してきました。 今回ご紹介する研究は、その常識を覆すものです。慶應義

Seo Seungchul
1月16日読了時間: 11分


誰がAIの行方を決めるのか?――専門家支配と市民参加のはざまで
シリーズ: 論文渉猟 ◆今回の論文: Lucile Ter-Minassian, "Democratizing AI Governance: Balancing Expertise and Public Participation" (arXiv, 2025年1月16日) 概要: 本論文は、AIガバナンスにおける専門家主導と民主的参加のバランスを分析。フランスの気候市民会議とブラジルのAI規制枠組みを事例に、参加型・熟議型民主主義モデルの可能性と課題を検討。EU向けのガバナンス提言を含む。 AIが医療診断を左右し、採用選考を動かし、刑事司法に影響を与える時代になりました。自動運転車が街を走り、生成AIが文章を書き、画像を作る。こうした技術が私たちの生活を根本から変えようとしている今、ひとつの問いが浮かび上がります。「この技術のルールは、いったい誰が決めるべきなのか?」 歴史的に見れば、技術のガバナンスは専門家の領域でした。原子力も、遺伝子工学も、専門知識を持つ少数の人々が規制の枠組みを作ってきました。しかしAIは違います。その影響範囲があまりに

Seo Seungchul
1月11日読了時間: 11分


AIが「民意」を製造する時代――直接民主主義は救世主か、それとも暴走装置か
シリーズ: 論文渉猟 ◆今回の論文: David Altman, "The AI Democracy Dilemma" (Journal of Democracy, 2026年1月) 概要: 生成AIが市民発議型の直接民主主義(イニシアチブや国民投票など)をどう変容させるかを分析した論考。AIは法案起草の自動化、マイクロターゲティングによる動員最適化、超個人化された説得を可能にし、直接民主主義のハードルを劇的に下げる。しかし同時に、熟議の空洞化、市民社会の弱体化、信頼の腐食を通じて、民主的正当性の基盤を損なうリスクがある。著者は「自動化された人民投票」という悪夢のシナリオと「熟議の拡張」という望ましい未来を対比させ、AIウォーターマーク、公益AI基盤、独立したアルゴリズム監査などの制度的ガードレールを提案している。 もし、AIがあなたの不安や怒りを正確に読み取り、それにぴったり合った政治メッセージを届けてきたら、どう感じるでしょうか。しかも、そのメッセージは隣人からの本音に見え、友人がシェアした体験談のように響く。でも実際には、すべてがアルゴリ

Seo Seungchul
1月8日読了時間: 17分


AIエージェントはいかにして「学ぶ」のか――4つの適応パラダイムが拓く次世代AI設計
シリーズ: 論文渉猟 ◆今回の論文: Pengcheng Jiang et al. "Adaptation of Agentic AI" (arXiv, 2025年12月18日) 概要: 本論文は、エージェント型AIシステムにおける「適応」の研究を体系的に整理し、エージェント適応(A1・A2)とツール適応(T1・T2)の4つのパラダイムからなる統一的枠組みを提案。それぞれの設計空間、トレードオフ、実践的な選択指針を明らかにし、ソフトウェア開発、深層研究、コンピュータ操作、創薬などの応用領域における具体例を示している。 私たちの日常に浸透しつつあるAIアシスタント。コードを書き、文書を検索し、複雑なタスクをこなす。しかし、こうした「エージェント型AI」がどのように能力を向上させていくのか、その仕組みを体系的に整理した研究はこれまでほとんどありませんでした。 2025年12月に発表されたこの論文は、スタンフォード大学、プリンストン大学、ハーバード大学、イリノイ大学など34名の研究者による共同研究として、AIエージェントの「適応(Adaptation

Seo Seungchul
2025年12月30日読了時間: 14分


物理学で読み解く民主主義と独裁の間の揺らぎ――拡散方程式が明かす政治体制の動き方
シリーズ: 論文渉猟 ◆今回の論文: Paula Pirker-Día et al. "Unraveling 20th-century political regime dynamics using the physics of diffusion" (arXiv, 2024年11月18日) 概要: V-Demプロジェクトの民主主義データに拡散マップ技術を適用し、政治体制の変化が統計物理学の異常拡散方程式に従うことを示した。民主主義国家は遅拡散、独裁崩壊国家は速拡散を示し、中間領域が最も不安定であることを明らかにした。 「なぜある国は民主化するのに別の国はそうならないのか」「なぜ民主主義が後退する国があるのか」――政治学の中心的な問いに対して、物理学の拡散理論が意外な光を当てています。ポツダム大学とサウスカロライナ大学の共同研究チームは、1900年から2021年までの172カ国のデータに拡散マップと呼ばれる手法を適用し、政治体制の変化が「異常拡散」という物理現象に従うことを明らかにしました。 民主主義国家は「遅く広がる粒子」のように振る舞い、崩

Seo Seungchul
2025年12月26日読了時間: 18分
bottom of page