あなたが書いたはずの文章が、あなたから離れていく――AIに均される声
- Seo Seungchul

- 4月29日
- 読了時間: 11分

シリーズ: 論文渉猟
◆今回の論文:Marwa Abdulhai et al., "How LLMs Distort Our Written Language" (arXiv, 2026年3月18日)
概要:大規模言語モデル(LLM)が人間の文章をどう変えるかを三つの方法で検証した研究。①100人を対象にAI使用群・非使用群に分けた実験、②2021年に収集された86本の学生小論文データセットを使ったAI編集の比較分析、③機械学習系国際会議ICLRの査読文書分析。主な発見として、AIを多用した参加者の小論文では「中立的立場」が約69%増加し、文法のみの修正を指示した場合でも文章の意味が大きく変化することが示された。また、学術査読においてAI生成の文書は「明確さ・重要性」よりも「再現性・スケーラビリティ」を重視する傾向があることが確認された。
AIに文章を直してもらったことがありますか? 誤字を修正してほしい、流れをよくしてほしい、そういうつもりで頼んだはずなのに、返ってきた文章がなんとなく違う——そう感じたことがある人は少なくないかもしれません。
2026年に発表されたGoogleDeepMindらの研究は、その違和感に実験的な根拠を与えるものでした。AIに文章の修正を依頼すると、表面的な語句の整理にとどまらず、書いた人の「立場」そのものが変わっていることが多いというのです。文法だけ直してほしいと明確に指示した場合でも、文章の結論が書き換えられることが確認されました。「お金が幸福につながるか」というテーマで書いた小論文が、AIの手を経ると「どちらとも言えます」という中立的な文章に変わっていた——そういう現象が、複数の実験を通じて統計的に示されました。
今回、富良野とPhronaはこの研究をもとに話し合います。「便利なツールのつもりが、自分の声を上書きされていたとしたら」という問いを出発点にしながら、なぜそのようなことが起きるのか、その構造的な理由まで掘り下げていきます。途中から話は、AIが「人類の平均的な好み」に最適化されているという、少し不思議な方向へ向かっていきます。2人の視点は同じ問いをめぐりながら、少しずつずれを保ったまま進みます。
「直してもらった」はずが、違う文章になっていた
富良野: 「文法だけ直して」という指示を出しても、文章の結論が書き換えられるって、そんなことあるんですね。校正と立場の書き換えはまったく別の作業だと思うんですが、AIにはその区別が機能していない。
Phrona: この論文を読みながら、自分の文章を人に直してもらった経験を思い出しました。指示した範囲を超えて、全体的に「まとまった文章」になっているんですよね。ある意味上手い。でも……私が書いた感じがしない、という感覚がある。
富良野: 研究では具体的に、「自動運転車に賛成か反対か」という立場を書いた小論文を、AIに一般的な修正をさせると、賛否が薄まって「どちらも言える点がある」という内容に変わっていく様子が示されています。書いた学生本人が明確に反対を主張していたのに。
Phrona: 整えられた、というより、丸められた、という感じがします。尖っているところが削られて、どこか見覚えのある形になっていく。
富良野: 実験では、文章が意味の空間の中でどの位置にあるかを数値的に表して可視化していて。人間が書いた文章はそれぞれ違う方向に散らばっているのに、AIが書いたり修正したりした文章は同じ方向に——しかも人間が書いたものとは異なる領域に——集まっていくんです。
Phrona: バラバラが減っていく……地図の上で、個人の居場所が全部ゆっくり引き寄せられていくような話ですね。
富良野: 別の言い方をすると、人間の文章が持っている「バリエーションの幅」が、AIを通ることで圧縮される。単語の使われ方の多様性という指標でも、AIが書き直した文章は元の文章から大きく離れていました。
Phrona: でも書いた本人たちは、満足しているんですよね、論文の結果だと。
富良野: そうなんです。自分の声じゃないと感じながら、満足度は変わらない。そこが一番引っかかる部分で。
立場が「消える」とはどういうことか
Phrona: じわじわ気になっているのは、「中立化」という現象の中身で。「賛否どちらも言える」という文章って、別の言い方をすると、何も言っていないですよね。
富良野: 実験では、「お金は幸福につながるか」というテーマで小論文を書いてもらって、AIをほとんど使わなかった人の文章では賛成か反対か何らかの立場をとっているものが約60%あった。それがAIに多くを書かせたグループでは、中立的な文章が統計的に有意に増えた。
Phrona: 言葉は丁寧で、筋道は通っていて、でも「私はこう思う」がない文章。
富良野: そう。しかも同時に、AIが書いた文章は感情的な言語も分析的な言語も増えているという結果がある。ポジティブな表現も、ネガティブな表現も、論理的な言い回しも全部増える。それなのに、結論としての立場は消える。
Phrona: 感情も論理もあるのに、意見がない。コーヒーからカフェインだけ抜いたみたいな話ですね。飲めるんだけど、何のために飲んでるんだろう、って。
富良野: その「何のために」が問題で。強い主張は誰かに嫌われる。中立は嫌われない。「受け取られやすい文章」の条件を最大化すると、立場そのものが邪魔になってくるのかもしれない。
Phrona: 受け取られやすさのために、核が溶けていく。
富良野: そういうことだと思います。
Phrona: ……それって、ある意味よくできた文章の定義になってしまっていますよね。誰にも不快感を与えない、論理的で感情的で、立場がない文章。
富良野: 「よい文章」と「誰にも嫌われない文章」が、ここでは重なってしまっている。
なぜAIは「平均的に心地よい」方向に動くのか
富良野: ここで少し構造的な話をしたくて。いまのAIは、人間のフィードバックから好まれる応答を学ぶという訓練方法を使っています。ざっくり言うと、多くの人が「良い」と評価した応答をたくさん見せることで、好まれる文章を生成するモデルを作る、という仕組みです。
Phrona: それが「声の消去」とどうつながるんですか。
富良野: AIは特定の個人の好みを学習するようには設計されていないんです。「この人はこういう論述スタイルをする」「この人は断定的な書き方が好き」という情報を持続的に保持して、それに沿って書き直すという仕組みではない。代わりに、不特定多数の人から「良い」と評価されたパターンに向かって収束する。
Phrona: 特定の誰かに合わせるんじゃなくて、多数の人が受け入れやすいものに向かっていく。
富良野: 論文はここで、動画プラットフォームで視聴時間を最大化するよう最適化したら、過激なコンテンツを推薦するようになったという事例を引いていて。同じ構造で、AIも「多くの人に好まれる文章」を最大化しようとすると、個人の癖や立場よりも、広く受け入れられるトーンに向かって収束するかもしれない、という話をしています。
Phrona: クリックベイト、か。「どちらとも言えます」という文章が、最も多くの人に受け入れられる。
富良野: 受け流されやすいとも言えますが。感情的でもあり、論理的でもあり、でも誰かを怒らせない。それが訓練の結果として選ばれていく。
Phrona: でも、誰かが怒るくらいの主張に、実は大事なものが入っていることがある。
富良野: うん、それはそうだと思う。特定の個人が「私はこう思う」と書くときの頑固さみたいなものを、AIは再現する動機を持っていない。
制度は、文章でできている
Phrona: 論文の後半、査読の話が気になっていて。学術論文を評価する査読文書の21%がAI生成で、しかもその評価の重点が人間と違うという話。
富良野: 人間の査読者は「論文が読みやすいか」「研究テーマが重要か」を評価に組み込む傾向がある。AIが書いた査読は「再現性があるか」「スケールできるか」を重視する。どちらが正しいかという話ではなくて、評価の基準が静かに変わっていっているということです。
Phrona: 科学の価値観が、AIの文章観に引き寄せられていく。
富良野: 論文はここで「制度は文章でできている」という方向で論じていて。政治、科学、法律——こういった制度は最終的には文書として形をとる。その文書がAIの言語パターンに均されていくとしたら、制度そのものが少しずつ変容していくかもしれない、という問いかけです。
Phrona: それを変容と呼ぶか劣化と呼ぶかは、立場によって違うかもしれないですが。
富良野: そうですね。「再現性を重視する」こと自体が悪い評価基準かというと、そうとは言えない。ただ、人間が自然に重視していたものが気づかないうちに薄くなっていく、という点は考える価値があると思っています。
Phrona: 何かが足されているんじゃなくて、何かが引かれていく変化だから気づきにくい。
富良野: 論文が最後に言っているのは、「AIが便利に使えることと、その影響が見えやすいことは別問題だ」という話で。満足度と声の消去が同時に起きる。それは検知されにくいリスクの典型例だなと思いました。
Phrona: 私はやっぱり、「中立化」という現象が一番引っかかっているんですよね。「どちらとも言えます」が増えることが、知的に誠実なのか、何かの回避なのか。AIの場合は構造的に後者だとして……でも人間だって同じことをやることがあるじゃないですか。
富良野: ……それは少し別の話になりますね。
Phrona: そうかもしれない。でも気になる。どこからが「調整」で、どこからが「声の消去」なのか。
富良野: 線引きは難しいですよね。ただ、AIの場合は、その線引きを判断する動機自体がないというところが、人間の場合とは少し違う気がしています。
ポイント整理
「賛否」が消えて「中立」になる
AIを多用して書かれた文章では、テーマに対して明確な立場をとるものが統計的に減少し、「どちらとも言えます」式の中立的な文章が約70%増加することが実験で示された。これは「バランスのとれた文章」ではなく、立場そのものの消去に近い。
「文法だけ」と言っても意味は変わる
最小限の校正を指示した場合でも、AIは文章全体を「好まれる方向」に書き換える傾向がある。これはAIの能力不足ではなく、特定の個人の意図を推測・保持する仕組みをそもそも持っていないという構造的な問題。
語彙と文体が「AI的な領域」に収束する
AI編集後の文章は、元の人間が書いた文章のどれとも異なる意味空間に集まっていく。個人差を反映したバリエーションが圧縮され、多くの文章が同じ方向に向かう均質化が起きている。
「多くの人に好まれる」最適化が個人の声を消す
現在のAIは、不特定多数の人間のフィードバックから「好まれる応答」を学習している。特定の個人のスタイルや立場に合わせる機能は持っていないため、多数に受け入れられやすい「尖っていない文章」に自然に収束する。動画プラットフォームが視聴時間を最大化するうちに過激なコンテンツを推薦するようになったのと、同じ構造的なメカニズムが働いている可能性がある。
学術査読の評価基準が静かに変化している
ある国際的なAI学会の査読文書の21%がAI生成とされ、AI生成の査読は「明確さ・重要性」よりも「再現性・スケーラビリティ」を重視する傾向が確認された。科学制度の評価軸そのものが、AIの言語パターンによって書き換えられていくリスクを示している。
満足度と声の消去は同時に起きる
AIを多用した参加者は、自分の声ではないと感じながらも、最終的な文章への満足度は変わらなかった。この「気づかないまま満足している」という状態が、変化の検知を難しくする。
キーワード解説
【RLHF(人間のフィードバックからの強化学習 / Reinforcement Learning from Human Feedback)】
AIを「人間が良いと評価した応答」から学ばせる訓練手法。多くの人にとって好ましい応答を選ぶよう学習するため、特定の個人のスタイルや意見に沿うのではなく、不特定多数にとって受け入れやすい文章に収束しやすい構造を持つ。
【意味的埋め込み(semantic embedding)】
文章の意味を数値のリストとして表現する技術。意味が近い文章は数値空間の中で近い場所に配置される。この論文では、人間が書いた文章とAIが修正した文章がどれだけ離れた場所に移動したかを、矢印の方向と長さで可視化している。
【均質化(homogenization)】
多様だったものが似たり寄ったりになっていく現象。この論文では、さまざまな個性を持っていた人間の文章が、AIを経ることで同じ方向・同じ領域に収束していくことをさす。言語の多様性の喪失とも言い換えられる。
【LLM-as-a-Judge(審判としてのAI)】
人間の代わりにAIが文章やコンテンツを評価・分類する手法。大量のデータを自動処理できる利点がある一方で、AIが持つ評価の偏りがそのまま分析結果に反映されるリスクもある。この論文では査読文書の強み・弱みの分類に使用されている。
【中立化(neutralization)】
もともと何らかの立場(賛成・反対・批判など)を持っていた文章が、AIの修正を経て「どちらとも言えます」式の内容に変わっていく現象。言葉は整っていても、主張としての核が失われた状態。
【語彙発散(Jensen-Shannon Divergence / JSD)】
二つの文章がどれだけ異なる単語分布を持つかを測る指標。値が高いほど、使われている語彙が大きく変わっていることを示す。この論文では、人間が修正した文章と比べて、AIが修正した文章のJSD値が平均で2〜3倍大きかったことが報告されている。