コンテンツにスキップ

Module 1-2 - Section 5: 知覚の理論的枠組み

セクション情報

項目 内容
モジュール Module 1-2: 知覚心理学
前提セクション Section 2(視覚), Section 3(聴覚)
想定学習時間 3.5時間

導入

Section 1 から Section 4 にかけて、精神物理学の基礎から始まり、視覚・聴覚・体性感覚・化学感覚・前庭感覚・多感覚統合に至るまで、個々の感覚モダリティの構造と機能を概観してきた。Section 2 では、網膜からV1への階層的処理、Hubel & Wiesel の特徴検出器、ゲシュタルト原理による知覚体制化、奥行き・運動知覚のメカニズム、そして視覚的錯覚を学んだ。Section 3 では、蝸牛における周波数分析から聴覚的情景分析(Bregman)に至る聴覚処理の全体像を扱った。

しかし、これらの各論的知識だけでは、「知覚とはそもそも何をしているのか」「なぜ脳は物理的刺激から安定した知覚経験を構成できるのか」という根本的な問いに答えることはできない。本セクションでは、知覚の本質を説明しようとする4つの主要な理論的枠組み——構成主義、生態学的アプローチ、計算論的アプローチ、予測符号化——を取り上げる。これらの理論は歴史的に順次発展してきたが、それぞれが知覚の異なる側面を照射するものであり、相互排他的というよりも補完的な関係にある。


構成主義的アプローチ

Helmholtz の無意識的推論

Key Concept: 無意識的推論(unconscious inference) Hermann von Helmholtz(1867)が提唱した概念。知覚は網膜像などの感覚データのみからでは一義的に決定されず、過去経験に基づく無意識的な推論過程を経て構成されるとする立場。知覚が意識的な思考を介さず瞬時に成立することから「無意識的」と呼ばれる。

Hermann von Helmholtz は19世紀を代表する生理学者・物理学者であり、知覚心理学の礎を築いた人物である。彼は、網膜に投影される二次元像は本質的に曖昧であり(逆光学問題: inverse optics problem)、同一の網膜像を生じうる外界の三次元配置は無限に存在すると指摘した。にもかかわらず知覚が通常は正確で安定しているのは、脳が過去経験から獲得した確率的知識を用いて、最も蓋然性の高い解釈を推論として選択しているためであるとした。

この考え方は、知覚を受動的な「記録」ではなく、能動的な「構成」として捉える点に核心がある。Section 2 で扱った奥行き手がかり(両眼視差、テクスチャ勾配、線遠近法など)は、構成主義の立場からは、脳が三次元構造を推論するために利用する手がかり(cue)として位置づけられる。

錯覚の構成主義的説明

構成主義の重要な経験的支持は、視覚的錯覚に対する説明から得られる。Section 2 で学んだ錯覚——たとえばミュラー・リヤー錯視(Müller-Lyer illusion)やポンゾ錯視(Ponzo illusion)——は、この枠組みでは推論の「誤り」として説明される。

Richard Langton Gregory(1966)は、ミュラー・リヤー錯視を「不適切な恒常性スケーリング(misapplied constancy scaling)」として説明した。矢羽の方向が奥行き手がかりとして機能し、大きさ恒常性の機構が不適切に適用されることで、等しい長さの線分が異なる長さに知覚されるとする。この説明は、錯覚が知覚システムの欠陥ではなく、通常は適応的に機能する推論メカニズムが特殊な条件下で誤った結論を導く結果であることを示唆する。

Gregory の知覚仮説検証理論

Key Concept: 知覚仮説検証理論(perceptual hypothesis testing) Richard Langton Gregory が提唱した理論。知覚は感覚データに基づく仮説の生成と検証の循環的過程であるとする。知覚者は外界に関する仮説を能動的に生成し、新たな感覚入力によってその仮説を検証・修正し続ける。

Gregory は Helmholtz の無意識的推論をさらに発展させ、知覚を科学的仮説検証になぞらえた。多義図形(例: Necker キューブ、ルビンの壺)における知覚の交替は、同一の感覚データに対して複数の仮説が競合し、いずれか一方が優勢になる過程として解釈される。知覚的交替が観察者の意図や注意によって部分的に制御可能であるという事実は、知覚がボトムアップ処理のみでは説明できないことを示す。

構成主義的アプローチの強みは、錯覚・多義図形・文脈効果・知覚学習など、トップダウン処理が関与する広範な現象を統一的に説明できる点にある。一方で、「過去経験」や「推論」の具体的な計算メカニズムが十分に明示されていない点、また知覚が常に推論を必要とするのかという問題が批判されてきた。後者の批判は、次に扱う生態学的アプローチの核心的主張と直結する。


生態学的アプローチ

Gibson の直接知覚論

Key Concept: 直接知覚(direct perception) James Jerome Gibson(1904-1979)が提唱した理論的立場。知覚に内的な推論や表象は不要であり、環境が提供する情報(光配列中の不変項)は知覚を一義的に特定するのに十分であるとする。知覚は環境の情報を直接的に「ピックアップ」する過程である。

Gibson は構成主義に対する最も根本的な批判者であった。彼の出発点は、構成主義が「貧弱な刺激(impoverished stimulus)」を前提としている点への異議である。Helmholtz や Gregory は、網膜像が本質的に曖昧であるためにトップダウンの推論が必要であると論じたが、Gibson はこの前提自体を退けた。Gibson によれば、知覚者が実際に利用する情報は静止した網膜像ではなく、能動的に環境中を移動し探索する知覚者に利用可能な包囲光配列(ambient optic array)全体である。この配列には、知覚を一義的に決定するのに十分な情報が含まれている。

不変項とオプティカルフロー

Key Concept: 不変項(invariant) 観察者の運動や視点の変化にもかかわらず包囲光配列中に保存される構造的特徴。Gibson は、知覚系はこの不変項を抽出することで、変化の中にある恒常的な環境特性を直接知覚するとした。テクスチャ勾配の比率、地平線と対象の関係などが例である。

Key Concept: オプティカルフロー(optic flow) 観察者が環境中を移動する際に生じる、包囲光配列全体にわたる体系的な変化パターン。前進運動時には拡大流(expansion pattern)が生じ、その拡大の中心(focus of expansion)が移動方向を特定する。

Gibson は第二次世界大戦中のパイロット訓練プログラムに携わった経験から、着陸時のオプティカルフローパターンが地面への接近速度や接触予測時間を直接的に指定することに着目した。この知見は後に τ(タウ)理論として David Lee(1976)により定式化された。τ は対象の視覚的サイズとその変化率の比であり、衝突までの時間(time-to-contact)を光学的変数から直接導出できることを示す。鳥が着地する際の翼の制動タイミングや、バッティングにおけるスイング開始タイミングの制御にτが利用されていることが実証されている。

アフォーダンス

Key Concept: アフォーダンス(affordance) Gibson が導入した概念。環境の事物や表面が知覚者に対して提供する行為の可能性を指す。アフォーダンスは環境の物理的特性と知覚者の身体的能力(体格・運動能力等)との関係として規定される。例えば、ある表面が「歩行可能である」というアフォーダンスは、その表面の物理的特性(硬さ、傾斜、面積等)と知覚者の脚の長さや運動能力との関係性によって決まる。

アフォーダンスの概念は、知覚と行為の不可分性を強調する点で革新的であった。構成主義では知覚は外界の「表象」の構成として捉えられるが、Gibson にとって知覚は行為のための情報の直接的取得であり、知覚と行為は循環的に結合している。

Mark L. Braunstein や William H. Warren Jr. の研究(1984)は、階段の蹴上げ高さが行為者の脚長に対する比率として知覚されることを示した。被験者は、蹴上げ高さが脚長の約0.88倍を超えると「登れない」と判断し、この臨界比率は体格の異なる個人間で一貫していた。これは、知覚が物理的単位(cm)ではなく、行為者の身体を基準とした相対的単位で成立していることを示唆し、アフォーダンスの実証的支持となった。

構成主義との対比

graph LR
    subgraph C ["構成主義的アプローチ"]
        C1["貧弱な刺激"] --> C2["内的推論・表象"]
        C2 --> C3["知覚経験の構成"]
        C4["過去経験"] --> C2
    end
    subgraph E ["生態学的アプローチ"]
        E1["豊富な刺激<br/>(包囲光配列)"] --> E2["不変項の直接抽出"]
        E2 --> E3["知覚 = 行為のための<br/>情報ピックアップ"]
    end
    style C fill:#fff3e0,stroke:#F57C00
    style E fill:#e8f5e9,stroke:#388E3C

両アプローチの対立は、知覚心理学における最も根本的な理論的論争の一つであった。構成主義は錯覚・文脈効果・知覚学習など「知覚が刺激から乖離する」現象を得意とするが、日常的な知覚の正確性と迅速性の説明にはやや困難を伴う。生態学的アプローチは、実世界における知覚と行為の効率的な結合を説明するが、錯覚や貧弱な条件下での知覚をどう扱うかが課題となる。Gibson 自身は錯覚を「生態学的に無効な(non-ecological)」人工的条件の産物として退けたが、この対応は批判者にとって不十分なものであった。現代の知覚研究は、これらのアプローチを対立的というよりも相補的に位置づける傾向が強まっている。


計算論的アプローチ

Marr の3水準

Key Concept: Marrの3水準(Marr's three levels of analysis) David Marr(1982)が提唱した、情報処理システムの分析に必要な3つの水準。(1) 計算理論(computational theory): システムが何を計算し、なぜそれが適切か、(2) アルゴリズムと表現(algorithm and representation): どのような表現とアルゴリズムで計算を実現するか、(3) 実装(implementation): アルゴリズムが物理的にどう実現されるか。

David Marr は英国の神経科学者であり、計算論的神経科学の創始者の一人である。わずか35歳で白血病により死去したが、遺著『Vision』(1982)は知覚研究に決定的な影響を与えた。

Marr は、情報処理システムの完全な理解には3つの水準が必要であり、各水準は独立に分析可能であると主張した。この枠組みは、構成主義と生態学的アプローチの論争に対する重要な処方箋を提供した。すなわち、構成主義が主にアルゴリズム水準の問題(どのような表象と推論過程が知覚を実現するか)を扱い、Gibson の生態学的アプローチが主に計算理論水準の問題(知覚系はどのような環境情報を利用すべきか)を扱っていると整理できるのである。両者の論争が容易に解消しなかったのは、異なる水準の議論を混同していたためだという見方を可能にした。

graph TD
    subgraph L1 ["計算理論水準(computational theory)"]
        L1A["問い: 何を計算するのか、なぜか"]
        L1B["例: ステレオ視の目標は<br/>両眼視差から奥行きを復元すること"]
    end
    subgraph L2 ["アルゴリズムと表現の水準(algorithm & representation)"]
        L2A["問い: どのような表現と<br/>アルゴリズムで実現するか"]
        L2B["例: 対応点マッチングアルゴリズム<br/>と視差マップ表現"]
    end
    subgraph L3 ["実装水準(implementation)"]
        L3A["問い: 物理的にどう実現されるか"]
        L3B["例: V1の両眼性ニューロンの<br/>視差選択性"]
    end
    L1 --> L2
    L2 --> L3
    style L1 fill:#e3f2fd,stroke:#1565C0
    style L2 fill:#fff3e0,stroke:#EF6C00
    style L3 fill:#fce4ec,stroke:#C62828

視覚表象の3段階

Marr は視覚系の情報処理を、網膜像から三次元物体の認知に至る段階的な表象構築の過程として定式化した。

  1. 初期スケッチ(primal sketch): 画像中の輝度変化(エッジ、バー、ブロブ、端点等)を検出し、それらの空間的配置を表現する。Section 2 で扱った V1 の方位選択性ニューロンや側方抑制によるエッジ検出は、この段階の神経基盤に対応する。
  2. 2.5次元スケッチ(2½-D sketch): 観察者中心の座標系(viewer-centered)で、可視面の奥行き・方位・輪郭等を表現する。「2.5次元」と呼ばれるのは、観察者から見える面の情報のみが含まれ、遮蔽された裏面の情報は含まれないためである。ステレオ視、運動視差、テクスチャ、陰影などの奥行き手がかりがこの段階で統合される。
  3. 3次元モデル表現(3-D model representation): 対象中心の座標系(object-centered)で物体の三次元構造を表現する。視点に依存しないため、物体の同定や認知が可能となる。

計算論的アプローチの貢献と限界

Marr の計算論的アプローチは、知覚研究に対して複数の重要な貢献をもたらした。第一に、3水準の区別は知覚理論を整理する強力な枠組みを提供し、異なる水準の説明を混同することなく議論を進めることを可能にした。第二に、知覚のアルゴリズム的記述は、コンピュータビジョン研究との直接的な接続を確立し、知覚理論の厳密な検証を可能にした。

一方で、Marr のモデルには限界も認められる。3段階の表象構築が厳密に直列的・ボトムアップ的であり、トップダウンの影響(文脈効果、期待、注意など)が十分に組み込まれていない。3次元モデル表現の具体的なアルゴリズムは未完のまま残された。また、知覚と行為の結合というGibson の洞察がこの枠組みでは捉えにくい。とはいえ、Marr の枠組みは人工知能・計算論的神経科学を含む広い領域に持続的な影響を与えており、現代の知覚研究の基盤の一つであり続けている。


予測符号化

脳は予測マシンである

Key Concept: 予測符号化(predictive coding) 脳が外界のモデルに基づくトップダウン予測を常時生成し、実際の感覚入力との差分(予測誤差)のみをボトムアップに伝達するという情報処理の枠組み。Rajesh Rao と Dana Ballard(1999)が視覚野の文脈で定式化し、Karl Friston により自由エネルギー原理として包括的に展開された。

予測符号化は、20世紀後半から21世紀にかけて急速に発展した知覚の理論的枠組みであり、構成主義・生態学的アプローチ・計算論的アプローチを統合しうるメタ理論的位置づけを持つ。

この枠組みの核心は、脳の主要な機能を「外界の予測」に置く点にある。脳は感覚入力を受動的に処理するのではなく、外界の構造に関する生成モデル(generative model)を維持し、次に到来する感覚入力を絶えず予測している。トップダウンの予測信号は皮質の上位階層から下位階層へ送られ、ボトムアップに伝達されるのは実際の入力と予測の差分、すなわち予測誤差(prediction error)のみである。予測が正確であれば予測誤差は小さく、少ない神経活動で効率的に処理される。予測が外れた場合のみ大きな予測誤差が生じ、内部モデルの更新を促す。

graph TD
    subgraph HC ["上位皮質階層"]
        M["内部モデル<br/>(外界の因果構造)"]
    end
    subgraph LC ["下位皮質階層"]
        S["感覚入力"]
        PE["予測誤差<br/>の計算"]
    end
    M -->|"トップダウン予測"| PE
    S -->|"実際の感覚入力"| PE
    PE -->|"ボトムアップ<br/>(予測誤差のみ伝達)"| M
    M -->|"モデル更新"| M
    style HC fill:#e3f2fd,stroke:#1565C0
    style LC fill:#fff3e0,stroke:#EF6C00

ベイズ推論との関連

予測符号化は、ベイズ推論(Bayesian inference)の神経実装として理解できる。ベイズの定理において、事後確率は事前確率(prior、過去経験に基づく予測)と尤度(likelihood、感覚データ)の積に比例する。予測符号化における「予測」は事前確率に、「感覚入力」は尤度に、「予測誤差に基づくモデル更新」は事後確率の計算に対応する。

Key Concept: ベイズ脳仮説(Bayesian brain hypothesis) 脳がベイズ推論の原理に従って感覚情報を処理し、知覚・行為・学習を実現しているとする仮説。知覚は事前確率(期待・文脈)と尤度(感覚データ)を最適に統合した事後確率として記述される。

この枠組みは Helmholtz の無意識的推論を現代的に再定式化したものとみなせる。Helmholtz が「過去経験に基づく推論」として直観的に捉えていたものを、ベイズ確率として形式化し、その神経実装メカニズムを予測符号化として具体化したのである。

能動的推論

Key Concept: 能動的推論(active inference) Karl Friston が提唱した枠組み。予測誤差の最小化は、(1) 内部モデルの更新(知覚)だけでなく、(2) 環境への能動的な働きかけ(行為)によっても達成されるとする。行為は「予測に合致するように感覚入力を変化させる」過程として再記述される。

Karl Friston は予測符号化を自由エネルギー原理(free energy principle)として一般化し、知覚・行為・学習・注意を統一的に説明する枠組みへと拡張した。能動的推論はこの枠組みの中核的概念であり、知覚者は単に入力を受動的に処理するのではなく、予測を確認・修正するために能動的に環境を探索する。これは Gibson が強調した知覚と行為の循環的結合と深い親和性を持つ。

錯覚・多感覚統合への統一的説明

予測符号化は、先行するアプローチが個別に扱ってきた現象に対して統一的な説明を提供する。

錯覚の説明: 構成主義が「推論の誤り」として説明した錯覚は、予測符号化では「強い事前確率が感覚データを圧倒する」状況として再記述される。例えばホロウフェイス錯覚(hollow face illusion)——凹面の顔型マスクが凸面に知覚される現象——は、「顔は凸面である」という極めて強い事前確率が、奥行き手がかりからの矛盾する感覚データを上書きすることで生じる。

多感覚統合の説明: Section 4 で扱った多感覚統合は、予測符号化では各モダリティの信号の精度(precision、予測誤差の信頼度)に基づく最適な重み付けとして記述される。精度の高いモダリティの信号がより大きな重みを持ち、これはベイズ推論における最適カルマン統合と形式的に等価である。腹話術効果(視覚が聴覚的空間定位を引き寄せる現象)は、空間定位において視覚の精度が聴覚より高いため、視覚信号に大きな重みが与えられる結果として説明される。

従来のアプローチとの関連

予測符号化は、それ以前の3つのアプローチを否定するものではなく、それらを包含し統合する位置にある。Helmholtz の無意識的推論はベイズ推論として形式化された。Gibson が強調した環境情報の豊富さは、予測誤差を最小化する内部モデルの学習がそもそも環境の統計的構造に依拠している点で取り込まれている。Marr の3水準は依然として有用であり、予測符号化自体が計算理論水準(予測誤差の最小化)とアルゴリズム水準(階層的予測と予測誤差の伝搬)の双方にまたがる理論として位置づけられる。


4つのアプローチの比較と統合

graph TD
    subgraph TL ["知覚の理論的枠組み"]
        CON["構成主義<br/>(Helmholtz, Gregory)<br/>知覚 = 推論"]
        ECO["生態学的アプローチ<br/>(Gibson)<br/>知覚 = 直接抽出"]
        COM["計算論的アプローチ<br/>(Marr)<br/>知覚 = 情報処理"]
        PRE["予測符号化<br/>(Friston)<br/>知覚 = 予測誤差最小化"]
    end
    CON -->|"推論をベイズ的に形式化"| PRE
    ECO -->|"環境構造の重視を継承"| PRE
    COM -->|"計算論的枠組みを提供"| PRE
    style CON fill:#fff3e0,stroke:#F57C00
    style ECO fill:#e8f5e9,stroke:#388E3C
    style COM fill:#e3f2fd,stroke:#1565C0
    style PRE fill:#f3e5f5,stroke:#7B1FA2
観点 構成主義 生態学的アプローチ 計算論的アプローチ 予測符号化
中心的メタファー 科学者(仮説検証) 探索者(情報ピックアップ) コンピュータ(情報処理) 予測マシン(誤差最小化)
知覚の本質 感覚データ+推論 環境情報の直接抽出 段階的な表象構築 トップダウン予測とボトムアップ誤差の循環
内的表象の必要性 必要(推論の基盤) 不要(直接知覚) 必要(表象の段階的構築) 必要(生成モデル)
トップダウン処理 中心的役割 否定的 限定的 中核的(予測信号)
錯覚の説明 推論の誤り 非生態学的条件の産物 アルゴリズムの限界 強い事前確率による上書き
行為との関係 間接的 中心的(知覚-行為循環) 限定的 中心的(能動的推論)
主な強み 錯覚・文脈効果 日常知覚・行為の結合 形式的厳密性 統一的説明力

まとめ

  • 構成主義的アプローチ(Helmholtz, Gregory)は、知覚を感覚データと過去経験に基づく無意識的推論として捉え、錯覚や文脈効果をその枠組みで説明する。
  • 生態学的アプローチ(Gibson)は、環境が提供する情報の豊富さを強調し、不変項の直接抽出・アフォーダンス・知覚と行為の不可分性を主張する。
  • 計算論的アプローチ(Marr)は、知覚の分析に3水準の区別を導入し、段階的な表象構築としての視覚処理を定式化した。Marr の枠組みは異なるアプローチ間の論争を整理する概念的道具としても機能する。
  • 予測符号化(Friston ら)は、脳を予測誤差最小化マシンとして捉え、ベイズ推論の神経実装として構成主義を形式化するとともに、能動的推論を通じて生態学的アプローチの知見をも統合しうる枠組みを提供する。
  • これらの理論は相互排他的ではなく、知覚の異なる側面・異なる分析水準を照射する補完的な枠組みである。
  • 本セクションをもって Module 1-2(知覚心理学)は完結する。感覚の基礎的メカニズム(Section 1)から、視覚(Section 2)・聴覚(Section 3)という主要モダリティの詳細、その他の感覚と多感覚統合(Section 4)を経て、本セクションで知覚全体を貫く理論的枠組みを概観した。個々の感覚モダリティの「仕組み」を知ることと、「知覚とは何か」という理論的問いに取り組むことは、車の両輪として知覚心理学の理解を支える。

用語集(Glossary)

用語 英語表記 定義
無意識的推論 unconscious inference Helmholtz が提唱。知覚は感覚データと過去経験に基づく、意識を介さない推論過程であるとする考え
知覚仮説検証理論 perceptual hypothesis testing Gregory が提唱。知覚を感覚データに基づく仮説の生成と検証の循環的過程として捉える理論
直接知覚 direct perception Gibson が提唱。知覚に内的推論や表象は不要であり、環境の情報を直接ピックアップするとする立場
不変項 invariant 観察者の運動や視点変化にかかわらず包囲光配列中に保存される構造的特徴
オプティカルフロー optic flow 観察者の移動に伴い包囲光配列全体に生じる体系的な変化パターン
アフォーダンス affordance 環境の事物が知覚者に提供する行為の可能性。環境特性と知覚者の身体能力の関係として規定される
Marrの3水準 Marr's three levels of analysis 情報処理システムの分析に必要な3水準: 計算理論、アルゴリズムと表現、実装
初期スケッチ primal sketch Marr の視覚処理モデルにおける第1段階。画像中のエッジ・バー等の輝度変化を表現する
2.5次元スケッチ 2½-D sketch 観察者中心座標系で可視面の奥行き・方位を表現する、Marr モデルの第2段階
3次元モデル表現 3-D model representation 対象中心座標系で物体の三次元構造を表現する、Marr モデルの第3段階
予測符号化 predictive coding 脳がトップダウン予測を生成し、感覚入力との差分(予測誤差)のみをボトムアップ伝達する情報処理の枠組み
予測誤差 prediction error トップダウン予測と実際の感覚入力との差分。予測符号化においてボトムアップに伝達される信号
ベイズ脳仮説 Bayesian brain hypothesis 脳がベイズ推論の原理に従い知覚・行為・学習を実現しているとする仮説
能動的推論 active inference Friston が提唱。予測誤差の最小化を内部モデル更新(知覚)と環境への働きかけ(行為)の双方で達成するとする枠組み
生成モデル generative model 外界の因果構造を内的に表現し、感覚入力を予測するために脳が維持するモデル
自由エネルギー原理 free energy principle Friston が提唱した包括的原理。生物システムは変分自由エネルギーを最小化するように知覚・行為・学習を行うとする

確認問題

Q1: Helmholtz の無意識的推論と Gregory の知覚仮説検証理論はどのような関係にあるか。両者の共通点と Gregory による発展的要素を説明せよ。 A1: 両者は知覚を感覚データに基づく推論過程として捉える点で共通する。Helmholtz は知覚が過去経験に基づく無意識的推論であることを提唱したが、その推論の具体的プロセスの記述は限定的であった。Gregory はこれを発展させ、知覚を科学的方法になぞらえた仮説の生成と検証の循環的過程として定式化した。多義図形における知覚交替を「複数の仮説間の競合」として説明し、知覚がボトムアップ処理のみでは説明できず能動的な仮説構築を伴うことを強調した点が Gregory の発展的貢献である。

Q2: Gibson の直接知覚論が構成主義を批判する主たる論点は何か。また、Gibson の立場に対する批判として最も有力なものを一つ挙げ、説明せよ。 A2: Gibson の構成主義批判の核心は、構成主義が「貧弱な刺激」を前提としている点への異議である。構成主義は網膜像が本質的に曖昧であるために推論が必要とするが、Gibson は能動的に環境を探索する知覚者にとっての包囲光配列には、知覚を一義的に決定する十分な情報(不変項)が含まれており、内的推論は不要であると主張した。Gibson に対する最も有力な批判は、視覚的錯覚の扱いに関するものである。Gibson は錯覚を「非生態学的」な人工条件の産物として退けたが、錯覚は通常は適応的な知覚メカニズムの特性を明らかにする現象であり、知覚理論はこれを説明できなければならないという反論がある。

Q3: Marr の3水準の枠組みが、構成主義と生態学的アプローチの論争をどのように整理したかを説明せよ。 A3: Marr の3水準は、構成主義と生態学的アプローチが異なる分析水準で議論を展開していたことを明示した。Gibson の生態学的アプローチは主に計算理論水準——知覚系が何を計算すべきか、環境のどのような情報を利用すべきか——に関する議論であり、構成主義はアルゴリズムと表現の水準——どのような内的表象と推論過程によって知覚が実現されるか——に関する議論であったと整理できる。両アプローチの論争が解消困難であったのは、異なる水準の議論を混同していたためであり、Marr の枠組みはこの混同を解きほぐす概念的道具を提供した。

Q4: 予測符号化の枠組みにおいて、ホロウフェイス錯覚(凹面の顔マスクが凸面に知覚される現象)はどのように説明されるか。また、この説明が構成主義的説明とどう関連するかを述べよ。 A4: 予測符号化の枠組みでは、ホロウフェイス錯覚は「顔は凸面である」という極めて強い事前確率(prior)が、凹面であることを示す奥行き手がかりからのボトムアップ感覚データ(予測誤差)を上書きすることで生じると説明される。事前確率の強さが感覚データの精度を圧倒するため、実際の奥行き構造と矛盾する知覚が成立する。この説明は構成主義の「推論の誤り」という説明をベイズ確率の言語で形式化したものであり、Helmholtz の無意識的推論を事前確率と尤度の統合というメカニズムとして具体化したものといえる。

Q5: 能動的推論(active inference)の概念が、Gibson のアフォーダンス理論とどのような接点を持つかを論じよ。 A5: 能動的推論は、予測誤差の最小化が内部モデルの更新(知覚)のみならず、環境への能動的な働きかけ(行為)によっても達成されるとする。すなわち、行為は予測に合致するよう感覚入力を変化させる過程として捉えられる。この知覚と行為の不可分性は、Gibson が一貫して主張した知覚-行為循環と深い親和性を持つ。Gibson のアフォーダンスが環境特性と知覚者の行為能力の関係として定義されたように、能動的推論においても知覚は行為から切り離された受動的な情報処理ではなく、環境との能動的な相互作用の中で成立する。ただし、Gibson が内的表象を否定したのに対し、能動的推論は生成モデルという内的表象を前提とする点で本質的に異なる。能動的推論は Gibson の洞察の核心——知覚と行為の結合、環境との相互作用の重視——を、構成主義的な内的モデルの枠組みの中に取り込んだ理論として位置づけられる。