「批判的思考力は教えられるのか」──341件の研究が示す、対話・実践・伴走の効果
- Seo Seungchul

- 2月11日
- 読了時間: 18分

シリーズ: 論文渉猟
◆今回の論文:Philip C. Abrami et al., "Strategies for Teaching Students to Think Critically: A Meta-Analysis" (Review of Educational Research, 2015年6月)
概要: 批判的思考(Critical Thinking)の教育介入効果に関するメタ分析。2009年までに発表された準実験・真実験研究を対象に、341件の効果量を統合。加重平均効果量は0.30(p < .001)で、批判的思考スキルと傾向性の両方を向上させる有効な教育戦略が存在することを実証。特に「対話」「本物の問題への取り組み」「メンタリング」の3要素が、組み合わせて用いられた場合に最も効果的であることを明らかにした。
「批判的思考力を鍛えましょう」というフレーズは、大学の授業や企業研修でよく耳にします。でも、そもそも批判的思考って、本当に教えることができるのでしょうか。生まれ持った才能の問題なのか、それとも訓練で伸ばせるスキルなのか。「考える力」という曖昧なものを、教育でどこまで変えられるのかという疑問は、実は教育研究者たちが何十年も取り組んできたテーマです。
今回取り上げるのは、カナダ・コンコルディア大学のAbrami教授らによるメタ分析。341件もの効果量を統合し、どんな教え方が批判的思考力を伸ばすのかを検証した大規模研究です。結論を先に言えば、批判的思考は「教えられる」──しかもその効果は、小学生から大学院生まで、理系文系を問わず、短期講座でも長期プログラムでも確認されています。富良野は「効果量0.30って、どのくらいの意味があるの?」と数字の解釈に関心を示し、Phronaは「でも『批判的思考力が上がった』って、人生の何が変わるんだろう」と、測定の外側にある問いを持ち込みます。二人の対話を通じて、「教えられる思考」の可能性と限界を探っていきます。
なぜ今、批判的思考なのか
富良野:この論文、冒頭がジョン・デューイから始まるんですよ。1920年代後半、ハーディング政権やクーリッジ政権の知的空虚さと腐敗に失望して、デューイは批判の重要性を繰り返し強調するようになった、と。
Phrona:政治への失望から「批判的に考える市民の育成」が必要だ、という流れですね。
富良野:ええ。デューイは「知性とは、信念・評価・行為に批判的方法を適用して、より自由でより確かな善を構築することだ」と書いている。批判的思考は、すべての市民が日常的に行うべきものであり、哲学者の役割は永遠の真理を打ち立てることではなく、日常の思考を体系的に批判することだ、と。
Phrona:それが1925年の話で、今でも同じ問題意識が続いているわけですね。
富良野:そう。1941年にエドワード・グレイザーが「批判的思考の発達に関する実験」という博士論文を書いていて、その冒頭でこう言っているんです。「アメリカの公教育は150年間で、ほぼ読み書きができる有権者を生み出した。しかし、読んだものを批判的に評価できる市民を十分に育てることには成功していない」と。
Phrona:70年以上前の指摘が、そのまま今にも当てはまりそうで、少し怖いですね。
批判的思考は「教えられる」のか
富良野:で、この研究の核心なんですが、867件の効果量から出発して、方法論的に厳密な341件に絞り込んだ上で、教育介入によって批判的思考を伸ばせるかを検証している。結果は、加重平均効果量0.30で統計的に有意。
Phrona:0.30というのは、どのくらいの効果なんでしょう?
富良野:コーエンの基準では、0.2が小さい効果、0.5が中程度、0.8が大きい効果。だから0.30は「小から中の間」。でも教育研究では、これは決して小さくない数字なんです。
Phrona:実際の意味で言うと?
富良野:「改善指数」という指標で見ると、約12%の改善になる。つまり、批判的思考の教育を受けた学生は、受けなかった学生の中で、平均して上位38%くらいの位置に来る計算です。
Phrona:なるほど。薬の効果みたいに劇的ではないけど、集団で見れば確実に差が出るレベルですね。
富良野:しかも興味深いのは、この効果が教育レベルによって変わらないこと。小学生でも、中学生でも、高校生でも、大学生でも、大学院生でも、統計的に有意な差がない。
Phrona:それは意外ですね。発達心理学的には、幼い子どもは抽象的な推論が難しいはずでは?
富良野:そこは論文でも「outstanding question」として残されていて、標準化テストの限界かもしれないし、子どもの能力が過小評価されてきたのかもしれない、と。
教科も期間も関係ない
Phrona:教育レベルだけじゃなく、教科による差もなかったんですか?
富良野:そう。STEM(理系)と非STEM(文系)で比較しても、健康・医療教育と比較しても、効果量に統計的な差はなかった。信頼区間がほぼ完全に重なっている。
Phrona:批判的思考は「汎用スキル」だという証拠になりますね。
富良野:ただ、これには長い論争があって。哲学者のジョン・マクペックは「批判的思考を特定の教科から切り離して教えることには意味がない。思考は常に何かについての思考だから」と主張していた。
Phrona:でもこのメタ分析の結果は、教科を問わず効果があると示している。
富良野:少なくとも測定可能な範囲では、そうですね。あと、介入の期間も関係なかった。数時間の短期ワークショップでも、1学期以上の長期プログラムでも、効果量に有意差がない。
Phrona:それも意外。長くやれば効果が高いわけではない?
富良野:短期でも効果があるというのは朗報ですが、長期でも劇的に伸びないというのは、何か天井があるのかもしれない。この辺りは、さらなる研究が必要とされています。
「対話」の力──ソクラテスから現代の教室へ
富良野:さて、どんな教え方が効くのかという話に入ると、この研究では3つの要素を特定しています。一つ目が「対話」。
Phrona:対話って、議論させるということですか?
富良野:それだけじゃない。問題について一緒に考える、という構造が重要。ソクラテス式の問答法がルーツにあって、対立的な討論でも協調的な議論でも、口頭でも書面でも効果がある。
Phrona:下位カテゴリでは、どんなものが特に効果的だったんですか?
富良野:教師が質問を投げかける方式、教師主導の全体討論、教師主導の小グループ討論。この3つが特に効果量が高かった。
Phrona:「教師主導」というのがポイントですね。学生だけで議論させるより。
富良野:放任ではなく、教師が問いを立て、議論を方向づける。デューイのシカゴ実験学校でも、毎日の授業が「今日何をするか、昨日と何がつながるか」を話し合うところから始まったそうです。
Phrona:答えを教わるんじゃなくて、問いの立て方を一緒に作っていく。
富良野:そう。で、その学校の卒業生の証言が論文に引用されていて、これが印象的なんですよ。「デューイ・スクールの子どもたちの人生を見てきて、いつも驚くのは、どんな状況にも適応できる柔軟さです。不安定な感情に振り回されず、目の前の問題に取り組む。その働く習慣が、自信に基づく勇気を生み、達成につながる」と。
Phrona:「どんな状況にも適応できる柔軟さ」。それこそが、テストでは測りにくい批判的思考の本質かもしれませんね。
「本物の問題」に向き合わせる
富良野:二つ目の要素が「本物の問題への取り組み」、英語ではanchored instructionと呼ばれるもの。
Phrona:アンカーって錨ですよね。何に錨を下ろすんですか?
富良野:学習者にとって意味のある、実際の状況に根ざした問題です。抽象的な論理パズルじゃなくて、「この患者にどう対応すべきか」とか「この環境問題をどう解決するか」みたいな。
Phrona:ルソーの『エミール』にも通じる発想ですよね。
富良野:まさにそう。論文でもルソーが引用されていて、事実の暗記に頼る教育を批判して、子どもが解きたいと思う問題を解かせるべきだと主張した、と。デューイも「知識の論理的側面」と「心理的側面」を区別していて、教科書に書かれた完成品としての知識を「地図」に喩えた。
Phrona:完成した地図を見せるんじゃなくて、探検家として未知の土地を歩かせる。
富良野:そう。「何か言わなければならない」のと「言いたいことがある」のは全然違う、とデューイは皮肉っぽく書いている。
Phrona:下位カテゴリでは何が効果的でしたか?
富良野:応用的な問題解決とロールプレイ。特にロールプレイの効果量は0.61で、かなり高い。
Phrona:役割を演じることで、他者の視点に立って考えざるを得なくなる。
富良野:そうですね。シミュレーションやケーススタディも含まれますが、いずれも「自分ごと」として考えさせる仕掛けがある。
「伴走者」としてのメンタリング
富良野:三つ目がメンタリング。これは一対一の関係で、より専門性のある人が、より少ない人と関わるというもの。
Phrona:家庭教師とか、指導教官とか、インターンの先輩みたいな関係ですね。
富良野:そう。この研究では3つのタイプを区別していて、教師と学生の一対一、学生同士のペア学習、それからインターンシップ。
Phrona:で、メンタリング単独だとそこまで効果が出なかったんですよね?
富良野:そう、ここが面白いところで。メンタリングだけを見ると、実験群と統制群の差が統計的に有意じゃなかった。でも、対話や本物の問題と組み合わさると、効果が跳ね上がる。
Phrona:どのくらい?
富良野:対話だけだと0.23、本物の問題だけだと0.25、両方組み合わせると0.32。そこにメンタリングが加わると0.57まで上がる。この差は統計的に有意。
Phrona:メンタリングは「触媒」のような役割を果たしている?
富良野:論文でもまさにそう表現されています。単独では弱いけど、他の要素と組み合わさると強力に効果を増幅する。
3要素がすべて揃った研究事例
Phrona:具体的に、3つの要素がすべて高く評価された研究ってどんなものがあるんですか?
富良野:論文では3つの事例が詳しく紹介されています。一つ目は、Yang, Newby, & Bill (2008)による、獣医学の遠隔教育での研究。構造化されたWeb掲示板ディスカッションを使って、学生に授業内容について批判的に考えさせた。
Phrona:オンラインでも効果があった?
富良野:ええ。学生同士と教師からの質問やフィードバックに応答する形式で、3要素すべてが実験群で高く、効果量は0.53だった。
Phrona:二つ目は?
富良野:Arrufat (1997)の研究で、心理学の学部生を対象に、アイデンティティ発達を促す介入をした。人生の選択について批判的に問題解決する方法を教えて、教師が個別にも全体討論でも指導した。対話が+3、本物の問題が+3、メンタリングが+2で、効果量は0.64。
Phrona:三つ目は?
富良野:Pellegrino (2007)の高校アメリカ史の研究。「歴史的思考」活動を系統的に取り入れて、学生に歴史的時代についての見解を発表させ、さまざまな情報源と照らし合わせて、矛盾する視点の信頼性を判断させた。
Phrona:まさに批判的思考の実践ですね。
富良野:ロールプレイや討論も多く含まれていて、効果量は1.13。これはかなり大きい。
Phrona:3つの事例に共通するのは、長期間で、多面的な介入をしているということですね。
教え方のタイプ──一般型、注入型、浸透型、混合型
富良野:この研究ではもう一つ、教え方のタイプも比較しています。哲学者のエニスが提唱した4分類。
Phrona:どんな分類ですか?
富良野:まず「一般型」。批判的思考を、特定の教科内容と切り離して、独立した科目として教える方法。論理学の授業とか、クリティカルシンキングの専門コースとか。
Phrona:思考法だけを取り出して練習する感じですね。
富良野:次に「注入型」。教科の深い学びの中で、批判的思考の原則を明示的に教える。たとえば歴史の授業で「この史料の信頼性をどう評価するか」を、批判的思考のスキルとして名前をつけて教える。
Phrona:内容を学びながら、思考法も意識させる、と。
富良野:そして「浸透型」。深い教科学習はさせるけど、批判的思考の原則は明示しない。良い授業に浸っていれば自然と身につく、という発想。
Phrona:暗黙知として伝わることを期待するわけですね。
富良野:最後が「混合型」。一般型と注入型か浸透型を組み合わせる。専門の批判的思考コースを取りながら、同時に各教科でも応用する。
Phrona:で、どれが一番効果があったんですか?
富良野:平均で見ると混合型が0.38で一番高く、次いで注入型が0.29、一般型が0.26、浸透型が0.23。ただし、統計的に有意な差は出なかった。
Phrona:それぞれに一長一短がある、と。
富良野:そう。ただ、後続の研究では浸透型が最も効果が低いという結果が複数出ていて、「明示しない」やり方の限界が指摘されています。
批判的思考の「定義」をめぐる哲学的議論
Phrona:ここまでの話、全部「APAの定義」に基づいているんですよね。でも、その定義自体に異論はないんですか?
富良野:そこ、論文でもかなり紙幅を割いて議論されています。APAの定義は「目的意識を持った自己調整的な判断であり、解釈・分析・評価・推論、およびその判断の根拠の説明を含む」というもの。
Phrona:かなり認知スキルに寄った定義ですね。
富良野:そう。で、これに対して少なくとも3つの反論が紹介されている。一つ目がバーバラ・セイヤー=ベーコンの「建設的思考」。伝統的な理性のツールだけでなく、直感、感情、想像力も重要な役割を果たすと主張している。
Phrona:それは納得できます。冷徹な論理だけで良い判断ができるわけじゃない。
富良野:しかも彼女は、批判的思考を個人のスキルというより「社会的実践」として捉えている。キルティング・ビー(共同でキルトを縫う会)のように、多様な背景と志向を持つ参加者が、さまざまなツールを使って一緒に作り上げるもの、と。
Phrona:二つ目の反論は?
富良野:ビースタとスタムスによるデリダ的脱構築の立場。APAの定義は「批判的ドグマティズム」だと批判していて、自分自身の方法の妥当性を不当に信じ込んでいる、と。基準を適用して評価するというやり方自体を、さらに批判する視点が必要だ、という話。
Phrona:批判の方法を批判する。メタ批判ですね。
富良野:三つ目がジェームズ・マーシャルによるフーコー的なアプローチ。伝統的な批判的思考は「中立的な概念的ツール」に見えるけど、フランクフルト学派のような「批判」の力を欠いている、と。フーコーの言う「自己への配慮」、つまり自分自身を発展させ変容させる反省的な実践が重要だ、と。
Phrona:論文の著者たちは、これらの反論にどう応答しているんですか?
富良野:正直に限界を認めた上で、3つの応答をしている。一つ目は、メタ分析という方法の限界として、これらの新しいアプローチは量的研究では捉えられない。二つ目は、たとえ広い定義を採用しても、メタ分析で捉えられる研究の結果は変わらないだろう。三つ目が面白くて、パラダイムが違うように見えても、共通の地盤がある、と。
Phrona:どういうことですか?
富良野:フーコーは「批判的態度」の始まりを、聖書の一貫性と真理を確立しようとした初期の努力に求めている。権威だけに基づく正当化を疑い、それを超えていこうとする姿勢。短い介入で批判的思考スキルを高めることは、これらの哲学者が望むものではないかもしれないけど、「それほど支配されないこと」への開放性を高めるかもしれない、と。
Phrona:スキルの訓練が、より深い批判性への入り口になりうる、という希望的な見方ですね。
教師の訓練という盲点
Phrona:ここまで聞いてきて、対話を促すにも、本物の問題を設計するにも、メンタリングするにも、教える側にかなりの力量が求められますよね?
富良野:そこ、この研究でも強調されていて。教師が批判的思考の指導について事前に訓練を受けている場合、あるいは授業の運営や指導実践について詳細な観察が報告されている場合、介入効果が最も高くなる。
Phrona:逆に言うと?
富良野:シラバスに「批判的思考を育てます」と書いてあるだけで、専門性開発の努力もカリキュラム設計の精緻化もない場合、効果は最も低い。
Phrona:形式的な宣言だけでは意味がない。
富良野:1997年の調査では、カリフォルニアの38の公立大学と28の私立大学で、89%の教員が批判的思考の教育は重要だと答えたのに、定期的に教えていると感じているのは9%だけだった。
Phrona:価値観と実践の間に大きなギャップがある。
富良野:この論文の著者たちは、「批判的思考の改善は暗黙の期待の問題ではありえない」と強調しています。教育者は、批判的思考の目標をコースで明示的にし、教員養成や専門性開発にも含める必要がある、と。
測定の外側にあるもの
Phrona:最後に、最初に感じた疑問に戻りたいんですが。テストの点数が上がることと、実際に人生で良い判断ができるようになることは、どこまで重なるんでしょう?
富良野:正直、そこはまだ分かっていない。論文でも「outstanding question」として残されています。デューイの実験学校の卒業生たちの証言は印象的だけど、統計的な証拠じゃない。
Phrona:でも、こういう証言があるんですよね。「デューイ・スクールの子どもたちを見ていると、どんな状況にも適応できる柔軟さに驚く。問題に直面しても落ち着いて取り組み、達成感を得る」と。
富良野:その卒業生はこうも言っている。「落胆というものが、ほとんど不合理なほどに、彼らには存在しない。まさにそのために、日々の生活での達成が確実なものになる。問題に取り組むという働く型を与えられた人は誰でも、自信に基づく勇気を持ち、達成する」と。
Phrona:それこそが私たちが本当に知りたいことですよね。テストで論理的な誤りを見抜けることと、人生の選択で後悔しないことは、同じじゃない気がする。
富良野:論文の著者たちも認めていて、感情や直感や想像力を含む、より広い意味での「批判性」は、メタ分析という方法では捉えられない、と。
Phrona:でも、だからといって「測れないからやらなくていい」にはならない。
富良野:もちろん。むしろ、「測れる部分では効果がある」ということが分かったのは大きい。対話、本物の問題、メンタリング。これらを意識的に取り入れれば、少なくとも測定可能な批判的思考スキルは伸ばせる。
Phrona:そして、測定の外側にある部分は、私たちが日々の実践の中で探っていくしかない。
富良野:この論文の最後に、こんな比喩があるんです。「メタ分析は、すでに何度も訪れた土地を描いた、粗い初期の地図のようなものだ。将来の訪問者にささやかな案内を提供する。ただし、空白の部分や『ここにドラゴンあり』という警告も多く残っている」と。
Phrona:ドラゴンがいるかもしれない場所を、探検していくのは私たちの仕事ですね。
富良野:そうですね。研究が示してくれるのは「ここまでは言える」という線引きで、その先は一人一人が引き受けていく領域なんだと思います。
ポイント整理
批判的思考(Critical Thinking)とは、解釈・分析・評価・推論を伴う目的意識を持った自己調整的な判断であり、その基盤となる認知スキルと傾向性(ディスポジション)の両面を含む概念である
341件の効果量を統合したメタ分析の結果、教育介入によって批判的思考を向上させることが可能であることが実証された(加重平均効果量g+ = 0.30, p < .001、改善指数約12%)
批判的思考の教育効果は、教育レベル(小学生から大学院生まで)、教科領域(STEM・非STEM・健康医療)、介入期間(数時間から1学期以上まで)によって統計的に有意な差がなく、広範な一般化可能性が示された
批判的思考の向上に最も効果的な教育戦略として、「対話」「本物の問題への取り組み(アンカード・インストラクション)」「メンタリング」の3要素が特定された
これら3要素は単独でも効果があるが、組み合わせて用いた場合に最も高い効果を示した(対話+本物の問題:0.32、3要素すべて:0.57)
「対話」の下位カテゴリでは、教師が質問を投げかける方式、教師主導の全体討論、教師主導の小グループ討論が特に効果的だった
「本物の問題」の下位カテゴリでは、応用的な問題解決(g+ = 0.35)とロールプレイ(g+ = 0.61)が特に効果的だった
メンタリングは単独では統計的に有意な効果を示さなかったが、他の要素と組み合わさると「触媒」として効果を増幅させた
エニスの4分類(一般型・注入型・浸透型・混合型)で比較した結果、混合型の平均効果量が最も高かったが(0.38)、統計的に有意な差は検出されなかった
教師が批判的思考の指導法について事前訓練を受けている場合、教育介入の効果が顕著に高まった
APAの定義に対しては、直感・感情・想像力の役割(Thayer-Bacon)、脱構築的批判(Biesta & Stams)、フーコー的自己配慮(Marshall)など、複数の哲学的反論が提起されている
メタ分析の限界として、標準化テストでは測定できない批判的思考の側面(社会的実践としての批判性、より深い批判的態度など)が存在することが認められている
キーワード解説
【批判的思考(Critical Thinking)】
解釈・分析・評価・推論を伴う、目的意識を持った自己調整的な判断。アメリカ哲学会(APA)のデルファイ合意による定義が広く用いられる
【効果量(Effect Size)】
教育介入の効果の大きさを示す統計指標。コーエンの基準では0.2が小、0.5が中、0.8が大
【メタ分析(Meta-Analysis)】
複数の研究結果を統計的に統合し、全体的な傾向を明らかにする研究手法
【対話(Dialogue)】
問題について複数人で一緒に考えるプロセス。ソクラテス式問答法がルーツで、口頭・書面、協調的・対立的を問わない
【アンカード・インストラクション(Anchored Instruction)】
学習者にとって意味のある実際の状況に根ざした問題を通じて学ぶ教育方法。ルソーやデューイの教育思想に由来
【メンタリング(Mentoring)】
より専門性のある者が、より少ない者と一対一で関わり、モデルを示し、誤りを修正する関係
【一般型アプローチ(General Approach)】
批判的思考を特定の教科内容と切り離し、独立した科目として教える方法
【注入型アプローチ(Infusion Approach)】
教科の深い学びの中で、批判的思考の原則を明示的に教える方法
【浸透型アプローチ(Immersion Approach)】
深い教科学習の中で批判的思考を促すが、原則は明示しない方法
【混合型アプローチ(Mixed Approach)】
一般型と注入型または浸透型を組み合わせる方法
【ディスポジション(Disposition)】
批判的に考えようとする傾向性・態度。真理探究、開放性、体系性、分析性などを含む
【建設的思考(Constructive Thinking)】
Thayer-Baconが提唱した概念。伝統的な理性だけでなく直感・感情・想像力も含み、社会的実践として批判的思考を捉える
【デューイの実験学校(Laboratory School)】
ジョン・デューイがシカゴ大学で1896年に設立した実験的な学校。探究の共同体としての教育を実践