「無料で使い放題」の終焉?――Wikipedia25周年、巨大テック企業との新たな取引が示す"知識の経済学"
- Seo Seungchul

- 1 日前
- 読了時間: 13分

シリーズ: 知新察来
◆今回のピックアップ記事:Deborah Mary Sophia, "Wikipedia owner signs on Microsoft, Meta in AI content training deals" (Reuters, 2026年1月15日)
概要:Wikipediaを運営するWikimedia財団が、Microsoft、Meta、Amazon、Perplexity、Mistral AIとのパートナーシップを発表。創設25周年を機に、AI企業がWikipediaのコンテンツを学習データとして利用するための商業サービス「Wikimedia Enterprise」の拡大が明らかにされた。
Wikipediaが2026年1月15日に創設25周年を迎えました。「誰でも無料でアクセスできる百科事典」として、インターネットの民主的な理想を体現してきたこのプラットフォームは、いま大きな転換点に立っています。Microsoft、Meta、Amazon、Perplexity、Mistral AIといった巨大テック企業やAIスタートアップとの新たなパートナーシップが発表されたのです。
一見すると「企業がWikipediaを支援する」という美談に聞こえるかもしれません。しかし、その背景を掘り下げると、複雑な構図が浮かび上がってきます。AI企業がWikipediaの記事を大量に学習データとして利用し、検索エンジンのAI要約機能がWikipedia本体への訪問を減らしている——。つまり、「使う側」が利益を得る一方で、「作る側」の持続可能性が脅かされてきたのです。
富良野とPhronaが、この「知識の共有地」をめぐる新しい現実について語り合います。ボランティアが築いた人類の知識インフラは、AI時代にどう変容していくのでしょうか。
25年目の誕生日に届いた「請求書」
富良野:Wikipediaが25歳ですか。インターネット上のサービスで、これだけ長く、しかも基本的なモデルを変えずに続いているものって、実はそう多くないですよね。
Phrona:2001年のスタートから考えると、ほとんどインターネットの歴史と重なっていますよね。FacebookよりもTwitterよりも、YouTubeよりも前から存在している。
富良野:しかも非営利で、主な収入源は一般ユーザーからの少額寄付。年間800万人ほどの人たちが平均15ドルくらいを寄付してきたと言われています。25万人のボランティア編集者が300以上の言語で6500万以上の記事を書いて、維持してきた。
Phrona:「みんなで作る百科事典」という、ちょっと夢のような理念が、奇跡的にずっと機能してきたわけですよね。でも今回の発表、その夢のモデルに何か変化が起きているように感じました。
富良野:そこなんですよ。今回発表されたのは、Microsoft、Meta、Amazon、それからPerplexityやMistral AIといったAI企業が、Wikimedia Enterpriseという商業サービスの有料顧客になったということ。Googleとは2022年からすでに契約があったんですが、それが一気に拡大した形です。
Phrona:「商業サービス」というのが気になります。Wikipediaって無料で誰でもアクセスできるはずですよね?
富良野:そうです。コンテンツ自体はクリエイティブ・コモンズのライセンスで公開されていて、今後もそれは変わらない。ただ、大企業が大量のデータを高速で取得したいときに、専用のAPIを提供する——つまり、効率的なパイプラインを有料で使ってもらうという仕組みなんです。
サーバーを「叩きまくる」AIたち
Phrona:でも、なぜ今そういうサービスが必要になったんでしょう?
富良野:端的に言うと、AI企業がWikipediaのサーバーを「叩きまくっていた」からです。Wikimedia Enterpriseの代表であるレーン・ベッカーが言っているんですが、企業がAIの学習データとしてWikipediaの情報を大量にスクレイピングする——つまり自動収集する——ようになって、サーバーへの負荷が急増した。
Phrona:無料で公開されているから、好きなだけ持っていける状態だったと。
富良野:そうなんです。2025年の春にブラジルから異常に大きなトラフィックがあって、調べてみたら人間のふりをしたボットだった。人間っぽいアクセスパターンを装って検知を回避しようとしていたんですね。
Phrona:それは……なんというか、Wikipedia側からすれば厚かましい話ですよね。ボランティアが時間をかけて書いた記事を、企業が黙って持っていく。
富良野:しかも、ボットのアクセスが2024年1月以降で50%増加して、コストのかかるメインデータセンターのトラフィックの65%がボット由来だという報告もあります。帯域幅はタダじゃない。寄付で運営している非営利団体にとっては、大きな負担になっていた。
Phrona:寄付してくれた人たちは、「みんなが知識にアクセスできるように」と思って払ったはずで、「巨大企業のAI開発を補助するため」ではないですよね。
人間の訪問者が8%減った理由
富良野:もう一つ深刻なのが、Wikipediaへの「人間の」訪問者が減っているという問題です。2025年の調査で、8%の減少が確認されました。
Phrona:8%というと、そこまで大きく聞こえないかもしれませんが……
富良野:いや、Wikipediaのスケールを考えると相当なインパクトですよ。月間150億近いページビューがあるプラットフォームで、それが継続的に減っている。しかもその原因が、AI自体なんです。
Phrona:どういうことですか?
富良野:検索エンジンがAI要約機能を搭載するようになって、Googleで何か調べると、もうその場で答えが出てくる。「AIオーバービュー」と呼ばれている機能です。ユーザーはリンクをクリックしてWikipediaに行く必要がなくなった。
Phrona:Wikipediaの情報を使って答えを生成しているのに、Wikipedia本体には来ないと。
富良野:Pew Researchの調査によると、GoogleのAI要約から元のサイトにクリックして遷移する人は1%しかいないそうです。「ゼロクリック検索」という言葉もありますね。
Phrona:皮肉ですよね。Wikipediaの知識があるからAIが賢くなったのに、その結果、Wikipediaへのトラフィックが減る。
富良野:Wikimedia財団のCEOだったマリアナ・イスカンダーが言っていた言葉が印象的です。「私たちのインフラはタダじゃないんです」と。
「知識は人間のもの」というメッセージ
Phrona:25周年の記念で「Knowledge is Human(知識は人間のもの)」というテーマを掲げていましたよね。これは単なるお祝いの言葉じゃなく、AIに対する一種のカウンターメッセージに聞こえました。
富良野:そうですね。財団のCPO/CTOであるセレナ・デッケルマンが言っていたのは、「AIの時代だからこそ、人間が作り、人間がキュレーションした知識であるWikipediaがより重要になる」ということです。
Phrona:AIは情報を統合することはできても、「知識」を生み出すことはできない——という哲学的な主張が含まれていますね。
富良野:その通りです。AIが出力するのは統計的にもっともらしい文章であって、判断、議論、検証を経た「知識」ではない。その違いを強調したかったんでしょう。
Phrona:25万人のボランティアが、互いに議論しながら記事を書き、直し、ソースを確認していく。その「人間的な乱雑さ」こそがWikipediaの強みだと。
富良野:創設者のジミー・ウェールズも言っていましたね。「LLM(大規模言語モデル)はWikipediaレベルのエントリーを書くには十分じゃない。マイナーなトピックになればなるほど、でたらめになる」と。
「応分の負担」を求める
Phrona:今回の契約で、企業は具体的に何を払うことになるんでしょう?
富良野:価格は公表されていないんですが、Wikimedia Enterpriseは複数の方法でデータを提供しています。「オンデマンドAPI」は最新版の記事をリアルタイムで取得できる。「スナップショットAPI」は1時間ごとに更新されるダウンロード可能なファイル。「リアルタイムAPI」は編集が行われるとすぐにストリーミングされる。
Phrona:企業向けに最適化されたパイプラインということですね。
富良野:サービスレベル契約もあって、99%以上の可用性を保証している。企業にとっては、自分たちでスクレイピング用のシステムを構築するより効率的という判断があるんでしょう。
Phrona:でも、Wikipediaはもともと無料で公開しているわけで……なんというか、微妙な立場ですよね。「払ってくれないと困る」と言いつつ、「払わなくても取れる」という。
富良野:ウェールズの言い方が面白かったですよ。「あなたたちは私たちのウェブサイトをぶっ壊すような使い方はできません。正しいやり方で来てください」と。
Phrona:「使いたいなら、応分の負担をしてね」という、ある意味すごくシンプルな話を、契約という形で成立させようとしている。
収益依存の罠を避ける
富良野:ただ、Wikimedia財団は商業収入に依存しすぎないよう、明確なルールを設けています。商業収入は総収入の30%を超えないという上限がある。
Phrona:それは賢明ですね。企業からの収入が増えすぎると、その企業の意向に左右されかねない。
富良野:Mozillaの事例が引き合いに出されることがあります。Googleからの検索契約収入に大きく依存していて、それが組織の独立性にどう影響するかという議論がずっとあった。
Phrona:寄付を中心とした資金モデルを維持することで、「利用者のための百科事典」という原点を守る、ということですね。
富良野:そうです。ただ、その寄付モデル自体が、ユーザーがWikipediaを直接訪問することに依存している面がある。サイトに来てくれなければ、寄付のバナーも見てもらえない。
Phrona:そこでAIが訪問者を減らしているとなると……循環的な問題ですね。
競合としてのGrokipedia
富良野:もう一つ興味深いのは、2025年10月にイーロン・マスクが立ち上げたGrokipediaの存在です。
Phrona:xAIのGrokというAIモデルを使った百科事典ですよね。
富良野:ええ。マスクはWikipediaを「Wokepedia」と呼んで、左派バイアスがあると批判してきました。Grokipediaは「よりバランスのとれた」代替として位置づけられている。
Phrona:でも、AIで生成された百科事典というのは……正確性の面で大丈夫なんでしょうか。
富良野:ウェールズは「信用できる百科事典には中立性が必要で、天秤に親指を載せているようなものを誰が信じるのか」と言っています。外部の分析では、Grokipediaは陰謀論や科学的コンセンサスに反する内容を含んでいるという指摘もある。
Phrona:ユーザーが直接編集できず、修正提案もAIが処理するんですよね。人間の編集者による相互チェックがないというのは、やはり大きな違いに感じます。
富良野:面白いのは、Grokipedia自体がWikipediaを情報源として使っているケースが確認されていることです。一部の記事にはクリエイティブ・コモンズのライセンス表記があった。
Phrona:Wikipediaを批判しながら、Wikipediaなしには成立しない……。
「コモンズの悲劇」はやってくるのか
富良野:あるメディアはこれを「新しいコモンズの悲劇」と呼んでいました。ボランティアが提供した知識が、それを収奪するシステムの原材料になり、しかもそのシステムが信頼性の低い情報を大量生産する可能性がある。
Phrona:共有地の過剰利用で資源が枯渇するという、あの「コモンズの悲劇」ですね。
富良野:Wikipediaのコンテンツ自体はなくならないですが、それを維持するエコシステム——編集者の参入、寄付者の支援——が細っていく可能性はある。
Phrona:新しい編集者がどうやってWikipediaを発見するかというと、検索で来る人が多いでしょうし。それがAI要約に取って代わられると、入り口が塞がれてしまう。
富良野:Wikimedia財団のデータでは、新規編集者の登録が36%減少しているという数字もあります。これは長期的に見ると深刻ですね。
人間の知識インフラをどう守るか
Phrona:今回のパートナーシップは、ある意味で「応急処置」なのかもしれませんね。根本的な問題——AIが無料で知識を吸い上げてユーザーを奪う——に対する解決策ではない。
富良野:そうですね。ただ、少なくともスクレイピングによるサーバー負荷は減らせるし、契約関係を持つことで、帰属表示や適切な使用についての交渉材料も得られる。
Phrona:Wikimedia財団自身もAI活用を検討しているようですね。編集者の負担を減らすツールとして。
富良野:ウェールズは、退屈な作業をAIに任せることで、編集者がより創造的な仕事に集中できる可能性に言及していました。敵視するのではなく、共存を模索する姿勢ですね。
Phrona:「知識は人間のもの」というメッセージと、「AIを道具として使う」ということは、矛盾しないわけですね。
富良野:判断と責任は人間が持つ。処理と補助はAIを使う。その線引きを明確にすることが重要なんでしょう。
25年目のWikipediaが問いかけるもの
Phrona:25年前、WikipediaはWeb 2.0の理想——参加と共有に基づく非階層的なインターネット——を体現していました。その理想は、今どうなっているんでしょう。
富良野:プラットフォームとしては健在ですし、6500万以上の記事を持つ世界最大の百科事典であることに変わりはない。ただ、その「配信チャネル」が変わってきている。AIのまとめ、音声アシスタント、検索結果の抜粋。直接サイトに来る人より、間接的に情報が流通するケースが増えている。
Phrona:それは、Wikipediaの価値が下がったというより、むしろ「あまりにも基盤的になった」ということかもしれません。
富良野:インフラとしての存在感は増している。でも、そのインフラを誰がどう維持するかという問題が、前面に出てきた。
Phrona:テック企業が払う料金は、持続可能性の一つの解ではあるけれど、「知識の共有地」という理念をどう守るかという問いへの完全な答えではない。
富良野:そうですね。今回の発表を見て僕が思ったのは、Wikipediaは25年かけて一つの実験を続けてきたということです。「みんなが少しずつ貢献すれば、信頼できる知識の集積ができる」という実験を。
Phrona:その実験が、AIという新しい変数を受け入れながら、どう続いていくのか。
富良野:たぶん正解は一つじゃないし、試行錯誤が続くんでしょう。でも、「人間が作った知識」であることの価値を手放さない限り、Wikipediaには存在意義がある。そこは変わらないと思います。
Phrona:次の25年に何が起こるか、まだ誰にもわからないですね。
富良野:ただ、「わからないから議論し続ける」というのが、まさにWikipediaのやり方でもありますよね。
ポイント整理
Wikimedia財団は25周年を機に、Microsoft、Meta、Amazon、Perplexity、Mistral AIなど大手テック企業とのAIデータ利用契約を発表した。これらの企業は「Wikimedia Enterprise」の有料顧客となり、Wikipediaのコンテンツを効率的に取得するための専用APIやデータフィードを利用できるようになる。Googleとは2022年から同様の契約があり、エコシステムが拡大した形となる。
AI企業によるWikipediaのスクレイピング(自動収集)がサーバーコストを押し上げていた。ボットによるアクセスは2024年1月以降50%増加し、データセンターのトラフィックの65%がボット由来となっていた。2025年5月にはブラジルから人間を装った大量のボットアクセスが検出され、検知システムの更新が必要になった。
Wikipediaへの「人間の」訪問者は8%減少している。原因は検索エンジンのAI要約機能(AIオーバービュー)で、ユーザーが検索結果ページ上で情報を得られるため、Wikipediaに直接アクセスする必要が減った。GoogleのAI要約から元のサイトにクリックする人は1%程度という調査もある。
Wikimedia Enterpriseは、企業向けに3種類のAPI(オンデマンド、スナップショット、リアルタイム)を提供し、サービスレベル契約で99%以上の可用性を保証する。これにより企業は自前でスクレイピングシステムを構築する必要がなくなり、財団側はサーバー負荷を管理できるようになる。
商業収入への過度の依存を避けるため、Wikimedia財団は商業収入を総収入の30%以下に制限するポリシーを設けている。これは組織の独立性を維持し、寄付者を主な資金源とする原則を守るためである。
創設者のジミー・ウェールズは、大規模言語モデル(LLM)がWikipedia品質の記事を書く能力に懐疑的である。「マイナーなトピックになるほど、LLMの出力は支離滅裂になる」と指摘し、人間による編集とファクトチェックの重要性を強調している。
Wikipediaは「Knowledge is Human(知識は人間のもの)」を25周年のテーマに掲げ、人間が作成しキュレーションした知識の価値を訴えた。これはAIが情報を統合できても「知識」を生成することはできないという哲学的メッセージを含んでいる。
新規編集者の登録は36%減少しており、長期的な持続可能性への懸念がある。ユーザーが直接サイトを訪問しなければ、新しい編集者の発掘や寄付の呼びかけも困難になるという循環的な問題が生じている。
キーワード解説
【Wikimedia Enterprise】
Wikimedia財団が提供する商業向けサービス。大規模な企業ユーザーにWikipediaコンテンツへの高速・高信頼性アクセスを有料で提供するAPIサービス
【スクレイピング】
ウェブサイトから自動的にデータを収集する行為。AI学習用にWikipediaのコンテンツを大量取得する企業が増加している
【AIオーバービュー】
Googleなどの検索エンジンがAIを使って検索結果を要約表示する機能。ユーザーがリンクをクリックせずに情報を得られるようになった
【ゼロクリック検索】
検索結果ページで情報が完結し、外部サイトへのクリックが発生しない検索のこと
【クリエイティブ・コモンズ(CC-BY-SA)】
Wikipediaが採用するライセンス。帰属表示を条件に自由に再利用・改変が可能
【大規模言語モデル(LLM)】
ChatGPTやGrok、Claudeなど、大量のテキストで訓練されたAIモデル。Wikipediaは主要な訓練データの一つとされる
【ボットトラフィック】
人間ではなくプログラムによるウェブサイトへのアクセス。AI学習用のデータ収集などに使用される
【コモンズの悲劇】
共有資源が適切な管理なく利用されると枯渇するという経済学的概念。Wikipediaの知識がAIに吸い上げられる状況に適用される比喩