Module 1-2 - Section 2: 視覚¶
セクション情報¶
| 項目 | 内容 |
|---|---|
| モジュール | Module 1-2: 知覚心理学 |
| 前提セクション | Section 1(感覚の基礎) |
| 想定学習時間 | 4.5時間 |
導入¶
Section 1 では精神物理学、信号検出理論、感覚系の一般原理(変換・受容野・感覚適応など)を概観した。本セクションでは、これらの一般原理が視覚系においてどのように具体化されるかを詳述する。視覚は人間が外界から得る情報の大部分を担う感覚モダリティであり、大脳皮質の約30%が視覚関連の情報処理に関与するとされる。本セクションでは、網膜における光の変換から始め、初期視覚処理、色覚、形態知覚、奥行き知覚、運動知覚、物体認知、そして視覚的錯覚に至るまで、視覚系の処理階層を段階的にたどる。
眼球と網膜の構造¶
眼球の光学系¶
眼球は光学装置として機能する。角膜(cornea)と水晶体(lens)が協働して光を網膜(retina)上に結像する。水晶体は毛様体筋(ciliary muscle)の収縮・弛緩により曲率を変化させ、異なる距離の対象に焦点を合わせる。この過程を調節(accommodation)と呼ぶ。虹彩(iris)は瞳孔(pupil)の大きさを調節し、網膜に到達する光量を制御する。
網膜の細胞構成¶
Key Concept: 網膜(retina) 眼球後壁に位置する神経組織であり、光受容器(視細胞)を含む。光の変換、初期的な信号処理を行い、その結果を視神経を介して脳に伝達する。
網膜は逆転した構造を持つ。光は神経節細胞層、内網状層、双極細胞層を透過してから視細胞層に到達する。網膜の神経回路は主に5種類の細胞で構成される。光受容器(桿体・錐体)、水平細胞(horizontal cell)、双極細胞(bipolar cell)、アマクリン細胞(amacrine cell)、網膜神経節細胞(retinal ganglion cell)である。
錐体と桿体¶
Key Concept: 錐体(cone) 明所視(photopic vision)を担う光受容器。高い空間解像度と色覚を提供する。中心窩に密集し、約600万個が存在する。3種類(L錐体・M錐体・S錐体)があり、それぞれ異なる波長に最大感度を持つ。
Key Concept: 桿体(rod) 暗所視(scotopic vision)を担う光受容器。高い光感度を持つが、空間解像度は低く色覚に寄与しない。網膜周辺部に多く分布し、約1億2,000万個が存在する。
錐体と桿体は相補的に機能する。中心窩(fovea)は錐体のみで構成され、最も高い視力を提供する。中心窩には桿体が存在せず、逆に中心窩外の周辺部には桿体が高密度で分布する。暗所での光感度が周辺視で高いのはこのためであり、夜空の暗い星を直視するより少し視線をずらした方がよく見えるという日常的経験と一致する。
受容野の構造¶
Section 1 で導入した受容野の概念は、網膜神経節細胞において同心円状の中心-周辺拮抗型構造として具体化される。
Key Concept: ON中心型受容野(ON-center receptive field) 受容野の中心領域に光が当たると興奮(発火頻度の増大)し、周辺領域に光が当たると抑制される。受容野全体に一様な照明を当てると応答は弱い。
Key Concept: OFF中心型受容野(OFF-center receptive field) ON中心型と逆の応答パターンを示す。中心領域への光で抑制、周辺領域への光で興奮する。
この中心-周辺拮抗構造は、一様な照明に対してはほとんど応答せず、輝度の空間的変化(コントラスト)に選択的に応答する。すなわち、網膜は既に像そのものではなく、像の中のエッジやコントラスト情報を抽出し始めている。
初期視覚処理¶
側方抑制とMach帯¶
Key Concept: 側方抑制(lateral inhibition) 隣接する神経細胞が互いの活動を抑制し合う機構。コントラストの増強に寄与し、エッジ検出の神経基盤となる。
Haldan Keffer Hartline はカブトガニ(Limulus)の複眼を用いた研究(1949)で側方抑制の存在を実証し、ノーベル賞を受賞した。側方抑制は、明暗の境界部分でコントラストを知覚的に増強する。具体的には、明るい領域の境界付近がより明るく、暗い領域の境界付近がより暗く知覚される。この現象は Mach 帯(Mach bands)と呼ばれ、Ernst Mach が19世紀に記述した。Mach 帯は物理的には存在しない輝度変化であり、側方抑制に基づく神経処理の産物である。
視覚経路¶
網膜神経節細胞の軸索は視神経(optic nerve)を形成し、視交叉(optic chiasm)で部分的に交差した後、外側膝状体(Lateral Geniculate Nucleus: LGN)を経由して一次視覚野(V1、有線皮質とも呼ばれる)に投射する。
graph LR
R["網膜<br/>(錐体・桿体)"] --> RGC["網膜神経節細胞<br/>(P細胞・M細胞)"]
RGC --> LGN["外側膝状体<br/>(LGN)"]
LGN --> V1["一次視覚野<br/>(V1)"]
V1 --> V2["V2"]
V2 --> VP["腹側経路<br/>(What経路)<br/>V4 → IT"]
V2 --> DP["背側経路<br/>(Where経路)<br/>MT → MST → 頭頂葉"]
style R fill:#e8f4fd,stroke:#2196F3
style V1 fill:#e8f4fd,stroke:#2196F3
style VP fill:#fff9c4,stroke:#FFC107
style DP fill:#c8e6c9,stroke:#4CAF50
網膜神経節細胞には機能的に異なる2つの主要クラスがある。P細胞(parvocellular)は小さな受容野を持ち、色と形態の詳細処理に関与する。M細胞(magnocellular)は大きな受容野を持ち、運動と空間的位置の処理に優れる。この機能的分離は LGN を経て皮質まで維持され、腹側経路(ventral pathway、「What」経路)と背側経路(dorsal pathway、「Where」経路)の解剖学的・機能的二重分離の基盤となる(Mishkin & Ungerleider, 1982)。
Hubel と Wiesel の発見¶
Key Concept: 単純細胞(simple cell) 一次視覚野(V1)に存在し、特定の方位(orientation)を持つ線分やエッジに選択的に応答する細胞。受容野内に興奮領域と抑制領域が並列に配置される。
Key Concept: 複雑細胞(complex cell) 特定の方位に応答するが、受容野内での刺激の正確な位置に依存しない。位置不変性を示し、運動する線分にも良好に応答する。
David Hubel と Torsten Wiesel(1959, 1962)は、麻酔下のネコの一次視覚野からの単一ニューロン記録により、皮質ニューロンが網膜神経節細胞や LGN ニューロンとは質的に異なる刺激特徴に応答することを発見した。単純細胞は、特定の方位を持つ線分やエッジが受容野の特定の位置に提示されたときに最大応答を示す。複雑細胞は方位選択性を維持しつつ、受容野内の位置には依存しない。さらに超複雑細胞(hypercomplex cell、端点抑制細胞とも呼ばれる)は、特定の長さの線分に選択的に応答し、それより長い線分には応答が抑制される。
Hubel と Wiesel はこの階層的処理構造を提案し、視覚処理が単純な特徴から段階的に複雑な特徴の表現へと進む階層的モデルを確立した。この業績により彼らは1981年にノーベル生理学・医学賞を受賞した。
色覚¶
三色説¶
Key Concept: 三色説(trichromatic theory) Thomas Young(1802)が提唱し Hermann von Helmholtz(1850s)が精緻化した色覚理論。網膜に3種類の光受容器(錐体)が存在し、それぞれ異なる波長帯域に最大感度を持つとする。全ての色覚経験はこれら3種類の受容器活動の組み合わせとして生じる。
三色説は、3つの適切に選ばれた単色光の混合により任意の色を等色できるという色彩混合の実験事実に基づく。現在、3種類の錐体が同定されている。S錐体(短波長、青感受性、最大感度約420 nm)、M錐体(中波長、緑感受性、約530 nm)、L錐体(長波長、赤感受性、約560 nm)である。
反対色説¶
Key Concept: 反対色説(opponent-process theory) Ewald Hering(1878)が提唱した色覚理論。色覚は赤-緑、青-黄、白-黒の3つの対立チャネルによって処理されるとする。各チャネル内の2色は同時に知覚されることがない。
反対色説は、三色説では説明困難な現象を説明する。補色残像(赤い面を見つめた後に緑の残像が生じる)、特定の色の組み合わせが存在しないこと(赤みがかった緑や、青みがかった黄色は知覚不可能)、色覚異常が対になって生じること(赤緑色覚異常、青黄色覚異常)などである。
二段階理論¶
Key Concept: 二段階理論(dual-process theory / stage theory) 三色説と反対色説を統合する現代的理論。第1段階(網膜レベル)で3種類の錐体が独立に光を受容し、第2段階(網膜神経節細胞以降)でこれらの信号が反対色チャネルに再編成される。
graph TD
subgraph "第1段階: 三色受容"
S["S錐体<br/>(短波長)"]
M["M錐体<br/>(中波長)"]
L["L錐体<br/>(長波長)"]
end
subgraph "第2段階: 反対色処理"
RG["赤-緑チャネル<br/>(L - M)"]
BY["青-黄チャネル<br/>(S - (L+M))"]
BW["明度チャネル<br/>(L + M)"]
end
L --> RG
M --> RG
S --> BY
L --> BY
M --> BY
L --> BW
M --> BW
style S fill:#bbdefb,stroke:#1976D2
style M fill:#c8e6c9,stroke:#388E3C
style L fill:#ffcdd2,stroke:#D32F2F
赤-緑チャネルはL錐体とM錐体の出力差(L - M)に基づき、青-黄チャネルはS錐体の出力と L+M の差に基づく。明度チャネルは主に L+M の加算出力に対応する。この二段階理論は、Leo Hurvich と Dorothea Jameson(1957)の色相相殺実験によって心理物理学的に支持され、さらに網膜神経節細胞レベルで色反対性ニューロンが発見されたことで生理学的にも裏付けられた。
色覚異常¶
色覚異常(color vision deficiency)は、錐体の欠損または機能異常に起因する。最も多いのは赤緑色覚異常であり、L錐体またはM錐体の光色素遺伝子の変異による。L錐体・M錐体の遺伝子はX染色体上に位置するため、赤緑色覚異常は男性に多い(男性の約8%、女性の約0.5%)。S錐体に関する青黄色覚異常は常染色体上の遺伝子に起因し、極めて稀である。3種類の錐体のうち1種が完全に欠損する場合を二色型色覚(dichromacy)、1種が異常な分光感度を持つ場合を異常三色型色覚(anomalous trichromacy)と呼ぶ。
形態知覚¶
ゲシュタルト原理¶
Key Concept: ゲシュタルト原理(Gestalt principles) 知覚的体制化(perceptual organization)を支配する法則群。個々の要素がいかにして統合的なまとまり(群)として知覚されるかを記述する。20世紀初頭のゲシュタルト心理学者(Max Wertheimer, Kurt Koffka, Wolfgang Kohler)によって体系化された。
主要なゲシュタルト原理は以下のとおりである。
| 原理 | 説明 |
|---|---|
| 近接(proximity) | 空間的に近い要素が群として知覚される |
| 類同(similarity) | 色・形・大きさなどが類似した要素が群として知覚される |
| 閉合(closure) | 不完全な図形が完結したものとして知覚される |
| 良い連続(good continuation) | 要素が滑らかに連続する方向にまとまって知覚される |
| 共通運命(common fate) | 同一方向に同一速度で運動する要素が群として知覚される |
これらの原理の上位に位置するのがプレグナンツの法則(law of Pragnanz)であり、知覚はつねに可能な限り「良い」(規則的・対称的・単純な)形態に向かう傾向があるとする。
図と地の分離¶
Key Concept: 図と地の分離(figure-ground segregation) 視覚場を前景(図、figure)と背景(地、ground)に二分する知覚過程。図は形を持ち前方に位置するように知覚され、地は形のない背景として図の背後に広がるように知覚される。
Edgar Rubin(1915)のルビンの盃に代表される多義図形は、同一の視覚入力から図と地の割り当てが反転しうることを示す。図地分離に影響する要因として、閉じた領域、小さい領域、対称な領域、凸性を持つ領域は図として知覚されやすいことが知られている。
奥行き知覚¶
視覚系は本質的に二次元の網膜像から三次元の空間表現を構築する必要がある。この課題に対して、視覚系は複数の奥行き手がかり(depth cue)を利用する。
単眼手がかり¶
Key Concept: 単眼手がかり(monocular cue) 片眼のみで利用可能な奥行き情報。絵画的手がかり(pictorial cue)とも呼ばれ、二次元画像から奥行きを知覚させる。
主な単眼手がかりを以下に示す。
| 手がかり | 説明 |
|---|---|
| きめの勾配(texture gradient) | 表面のテクスチャが遠方ほど密になる。James Jerome Gibson が重視 |
| 線遠近法(linear perspective) | 平行線が遠方で収束する |
| 遮蔽(occlusion / interposition) | 近い物体が遠い物体の一部を隠す |
| 運動視差(motion parallax) | 観察者の移動時に、近い物体は大きく速く動き、遠い物体は小さく遅く動く |
| 大気遠近法(aerial perspective) | 遠方の物体ほど霞んで青みがかって見える |
| 相対的大きさ(relative size) | 同種の物体では、網膜像が小さいものが遠くに知覚される |
両眼手がかり¶
Key Concept: 両眼視差(binocular disparity) 左右の眼の水平方向の間隔(約6.5 cm)に起因して、同一対象の網膜像が左右眼で微妙に異なること。この差異から奥行きが計算される。Charles Wheatstone(1838)がステレオスコープを用いて実証した。
Key Concept: 輻輳(convergence) 近い対象を注視するとき両眼が内側に回転する運動。輻輳角の大きさが対象までの距離の手がかりとなる。ただし有効範囲は比較的近距離に限られる。
両眼視差は、注視点からの相対的な距離差に対応する。注視点より近い対象は交差性視差(crossed disparity)を、遠い対象は非交差性視差(uncrossed disparity)を生じる。Bela Julesz(1971)はランダムドットステレオグラム(random-dot stereogram)を用いて、単眼では形態を認知できない刺激からも両眼視差のみで奥行きが知覚されることを示し、立体視が形態認知に先行する初期過程であることを実証した。
大きさの恒常性¶
Key Concept: 大きさの恒常性(size constancy) 対象の網膜像の大きさが距離によって変化しても、知覚される大きさはほぼ一定に保たれる現象。奥行き情報を用いた補正機構に基づく。
大きさの恒常性は、網膜像の大きさと知覚された距離を統合する過程に依拠する。この関係は大きさ-距離スケーリング(size-distance scaling)として定式化され、知覚された大きさ = 網膜像の大きさ × 知覚された距離、で近似される。大きさの恒常性の不適切な適用が一部の視覚的錯覚を生じさせると考えられている(後述)。
運動知覚¶
仮現運動¶
Key Concept: 仮現運動(apparent motion) 空間的に離れた位置に交互に提示される静止刺激が、一つの物体が移動しているように知覚される現象。Max Wertheimer(1912)の研究がゲシュタルト心理学の出発点となった。
仮現運動は、実際には運動が存在しないにもかかわらず運動が知覚される点で、視覚系が時間・空間的に分離した事象間の対応関係を能動的に構築していることを示す。映画やテレビのディスプレイは仮現運動の原理に依拠している。
オプティカルフロー¶
Key Concept: オプティカルフロー(optic flow) 観察者の移動に伴って網膜像全体に生じる体系的な光学的変化のパターン。James Jerome Gibson(1950, 1979)が生態学的視覚論において中心的概念として提唱した。
観察者が前進するとき、視覚場の中心(前進方向)から周辺に向かって放射状に拡大するフローパターンが生じる(拡大のフロー)。この拡大の中心(Focus of Expansion: FOE)は移動方向を特定する。オプティカルフローは自己運動の知覚(vection)、姿勢制御、進行方向の知覚に重要な役割を果たす。背側経路のMST野(medial superior temporal area)のニューロンがオプティカルフローの処理に関与することが示されている。
運動残効¶
Key Concept: 運動残効(motion aftereffect) 一方向に動く刺激を一定時間観察した後、静止パターンが逆方向に動いて見える錯覚現象。滝の錯覚(waterfall illusion)とも呼ばれる。
運動残効は、方向選択性を持つ運動検出ニューロンの適応によって説明される。特定方向の運動に長時間さらされると、その方向に応答するニューロンが適応(疲弊)し、反対方向に応答するニューロンとの均衡が崩れ、結果として逆方向の運動が知覚される。この現象は Section 1 で学んだ感覚適応の具体例であり、運動知覚が方向選択性ニューロン間のバランスに依存していることを示す。
物体認知¶
ビューベース理論¶
Key Concept: ビューベース理論(view-based theory) 物体認知は記憶に蓄積された複数の視点固有の二次元表現(ビュー)との照合により行われるとする理論。物体を多数の角度から見た経験が蓄積され、新たな視点からの入力は最も類似した記憶表現と照合される。
ビューベース理論は、物体認知に視点依存性(viewpoint dependence)が認められるという実験的知見に基づく。すなわち、馴染みのある視点からの方が馴染みのない視点からよりも物体の認知が速く正確である。Heinrich Bulthoff らの心理物理学的研究がこのアプローチを支持している。
構造記述理論¶
Key Concept: 構造記述理論(structural description theory) 物体を三次元的な構成要素の空間的配置として表現する理論。視点に依存しない(viewpoint-invariant)構造的記述に基づいて物体認知を行う。
David Marr と Keith Nishihara(1978)は、物体表現を座標系に基づく三次元的記述として定式化した。彼らのモデルでは、物体の主軸を特定し、その軸に沿った部品の配置を記述する階層的表現を構築する。
Irving Biederman(1987)はこのアプローチをさらに発展させ、認知によるコンポーネント理論(Recognition-by-Components: RBC理論)を提唱した。RBC理論では、全ての物体は約36種類のジオン(geon、幾何学的イオン)と呼ばれる基本立体(円柱、円錐、直方体など)の組み合わせとして記述される。ジオンは非偶然的性質(non-accidental properties)、すなわち視点が変化しても保存される幾何学的特性(直線性、曲率、対称性など)によって同定される。
graph TD
subgraph "ビューベース理論"
VB1["入力画像"] --> VB2["記憶された<br/>複数ビューと照合"]
VB2 --> VB3["最類似ビューに<br/>基づき認知"]
end
subgraph "構造記述理論(RBC)"
SD1["入力画像"] --> SD2["エッジ抽出"]
SD2 --> SD3["ジオン(基本立体)<br/>の同定"]
SD3 --> SD4["ジオンの空間配置<br/>の記述"]
SD4 --> SD5["記憶された構造<br/>記述と照合"]
end
style VB1 fill:#e8f4fd,stroke:#2196F3
style SD1 fill:#e8f4fd,stroke:#2196F3
style VB3 fill:#fff9c4,stroke:#FFC107
style SD5 fill:#fff9c4,stroke:#FFC107
両理論はそれぞれ異なる実験的支持を受けており、現在のところ統一的な物体認知理論には至っていない。視点依存性の効果はビューベース理論に有利であるが、部分的に遮蔽された物体の認知や新奇な視点からの汎化は構造記述理論の方が説明しやすい。実際の物体認知は両方の処理方略を課題や状況に応じて併用している可能性が高い。
視覚的錯覚とその理論的意義¶
代表的な錯覚¶
Key Concept: 視覚的錯覚(visual illusion) 物理的刺激の客観的特性と知覚経験が系統的に乖離する現象。知覚系の処理原理を解明するための重要な手がかりを提供する。
| 錯覚名 | 現象 | 主な説明 |
|---|---|---|
| ミュラー・リヤー錯視(Muller-Lyer illusion) | 同じ長さの線分が、矢羽の向きにより異なる長さに見える | 大きさ-距離スケーリングの誤適用(Gregory)、重心間距離の差異 |
| ポンゾ錯視(Ponzo illusion) | 収束する2本の線の間に置かれた同じ長さの線分のうち、上方(遠方側)が長く見える | 線遠近法による奥行き手がかりに基づく大きさの恒常性の誤適用 |
| エビングハウス錯視(Ebbinghaus illusion) | 同じ大きさの円が、周囲の円の大きさにより異なる大きさに見える | 文脈効果、サイズコントラスト |
| カニッツァの三角形(Kanizsa triangle) | 存在しない輪郭線(主観的輪郭、illusory contour)が知覚される | 閉合原理、モーダル補完 |
錯覚の理論的意義¶
錯覚は知覚系の「誤り」ではなく、通常は適応的に機能する処理原理が特殊な条件下で生み出す副産物である。Richard Langton Gregory(1966)の誤った恒常性スケーリング理論(misapplied constancy scaling theory)は、ミュラー・リヤー錯視やポンゾ錯視を、三次元空間の解釈に最適化された大きさ-距離スケーリング機構が二次元図形に不適切に適用された結果として説明する。
錯覚の研究は、知覚が刺激の受動的な写しではなく、仮説検証・推論・補完を含む能動的な構成過程であることを繰り返し示してきた。この観点はHermann von Helmholtz の「無意識的推論(unconscious inference)」の概念に遡り、現代の計算論的アプローチにおけるベイズ的知覚理論(Bayesian perception)にまで通じる。知覚系が事前知識(prior)と感覚入力(likelihood)を統合して最適な推定を行うという枠組みは、錯覚の多くを自然に説明する。
まとめ¶
- 網膜は錐体(明所視・色覚・高解像度)と桿体(暗所視・高感度)という相補的な光受容器を持ち、中心-周辺拮抗型受容野によりコントラスト情報を抽出する
- 初期視覚処理では、側方抑制によるエッジ増強を経て、一次視覚野の単純細胞・複雑細胞が方位選択性を示す。処理は腹側経路(形態・色)と背側経路(運動・空間)に分岐する
- 色覚は三色説(錐体レベルの受容)と反対色説(神経回路レベルの処理)を統合した二段階理論で説明される
- 形態知覚にはゲシュタルト原理による体制化と図地分離が関与する
- 奥行き知覚は単眼手がかりと両眼手がかりを統合し、大きさの恒常性を支える
- 物体認知にはビューベース理論と構造記述理論の二つのアプローチがあり、両者は相補的に機能する可能性が高い
- 視覚的錯覚は知覚系の能動的・構成的性質を示す重要な証拠である
- 次の Section 3(聴覚)では、視覚とは異なるモダリティにおける感覚処理の原理を学ぶ。また、Section 5(知覚の理論的枠組み)では、本セクションで触れた Helmholtz の無意識的推論や Gibson の生態学的アプローチを含む知覚理論を体系的に比較検討する
用語集(Glossary)¶
| 用語 | 英語表記 | 定義 |
|---|---|---|
| 網膜 | retina | 眼球後壁に位置し、光受容器を含む神経組織 |
| 錐体 | cone | 明所視・色覚・高解像度を担う光受容器。3種類(L, M, S)が存在 |
| 桿体 | rod | 暗所視を担う高感度の光受容器 |
| 中心窩 | fovea | 網膜中央の錐体のみで構成される高解像度領域 |
| ON中心型受容野 | ON-center receptive field | 中心への光で興奮、周辺への光で抑制される受容野 |
| OFF中心型受容野 | OFF-center receptive field | 中心への光で抑制、周辺への光で興奮される受容野 |
| 側方抑制 | lateral inhibition | 隣接ニューロン間の相互抑制。コントラスト増強に寄与 |
| Mach帯 | Mach bands | 側方抑制に起因する、明暗境界でのコントラスト増強現象 |
| 外側膝状体 | Lateral Geniculate Nucleus (LGN) | 視覚情報の中継核。網膜と一次視覚野を結ぶ |
| 単純細胞 | simple cell | V1に存在し、特定方位のエッジに位置特異的に応答する細胞 |
| 複雑細胞 | complex cell | 方位選択性を持つが位置不変性を示す皮質細胞 |
| 腹側経路 | ventral pathway | 形態・色の認知を担う「What」経路。V1→V2→V4→IT |
| 背側経路 | dorsal pathway | 運動・空間の処理を担う「Where」経路。V1→V2→MT→頭頂葉 |
| 三色説 | trichromatic theory | 3種類の錐体の活動の組み合わせで色覚が生じるとする理論 |
| 反対色説 | opponent-process theory | 赤-緑、青-黄、白-黒の対立チャネルで色が処理されるとする理論 |
| 二段階理論 | dual-process theory | 三色説と反対色説を統合した現代的色覚理論 |
| ゲシュタルト原理 | Gestalt principles | 知覚的体制化を支配する法則群(近接、類同、閉合等) |
| 図と地の分離 | figure-ground segregation | 視覚場を前景(図)と背景(地)に分ける知覚過程 |
| 単眼手がかり | monocular cue | 片眼で利用可能な奥行き手がかり |
| 両眼視差 | binocular disparity | 左右眼の網膜像の差異。奥行き知覚の両眼手がかり |
| 輻輳 | convergence | 近い対象の注視時に両眼が内転する運動 |
| 大きさの恒常性 | size constancy | 距離が変わっても知覚される大きさが一定に保たれる現象 |
| 仮現運動 | apparent motion | 交互提示される静止刺激が運動して見える現象 |
| オプティカルフロー | optic flow | 観察者の移動に伴う網膜像全体の体系的変化パターン |
| 運動残効 | motion aftereffect | 一方向運動への順応後に逆方向運動が知覚される錯覚 |
| ビューベース理論 | view-based theory | 視点固有のビュー照合に基づく物体認知理論 |
| 構造記述理論 | structural description theory | 三次元構成要素の空間配置に基づく物体認知理論 |
| ジオン | geon | RBC理論における基本立体(幾何学的イオン) |
| 視覚的錯覚 | visual illusion | 物理的特性と知覚が系統的に乖離する現象 |
確認問題¶
Q1: 錐体と桿体の機能的差異を4つの観点(感度、解像度、色覚、分布)から比較し、それぞれの特性が暗所視と明所視にどのように適応しているか説明せよ。 A1: 桿体は高感度(1個の光子にも応答可能)で暗所視に適しているが、空間解像度は低く色覚に関与しない。網膜周辺部に多く分布し、複数の桿体が1つの神経節細胞に収束するため感度は高いが解像度は犠牲になる。錐体は感度は低いが高い空間解像度を持ち、3種類(L, M, S)が異なる波長に応答して色覚を提供する。中心窩に密集し、1対1に近い比率で神経節細胞に接続するため高い空間解像度が実現される。このように、桿体は微弱光の検出に最適化され、錐体は明所での詳細な色彩・形態の弁別に最適化された相補的システムである。
Q2: 三色説と反対色説はかつて対立する理論と見なされていたが、二段階理論によりどのように統合されたか。各理論が説明できる現象と説明困難な現象を挙げて論じよ。 A2: 三色説は色彩混合の法則性(3つの原色から任意の色を等色できること)や色覚異常のパターン(錐体の欠損・変異との対応)をよく説明するが、補色残像や赤みがかった緑が知覚不可能であることは説明困難である。反対色説は補色残像、色の組み合わせの制約、色覚異常の対的な発生パターンを説明できるが、等色実験における3原色の必要十分性を直接説明しない。二段階理論はこれらを統合し、第1段階で3種類の錐体が独立に光を受容し(三色説の正当性)、第2段階で錐体信号が反対色チャネル(L-M、S-(L+M)、L+M)に再編成される(反対色説の正当性)とする。網膜神経節細胞レベルで色反対性ニューロンが発見されたことが生理学的裏付けとなっている。
Q3: Hubel と Wiesel が発見した単純細胞と複雑細胞の応答特性の違いを述べ、これらがどのように視覚情報の階層的処理を示しているか説明せよ。 A3: 単純細胞は特定の方位を持つ線分やエッジに選択的に応答するが、その応答は受容野内の刺激の正確な位置に依存する。受容野内に興奮領域と抑制領域が並列に配置されている。複雑細胞も方位選択性を持つが、受容野内での刺激位置に依存しない位置不変性を示し、移動する線分にもよく応答する。この段階的な抽象化は、網膜神経節細胞のスポット状受容野→単純細胞の方位選択性→複雑細胞の位置不変性→超複雑細胞の長さ選択性、という階層的処理を示す。各段階で下位レベルの出力を統合し、より複雑で抽象的な刺激特徴を表現する。
Q4: ポンゾ錯視をGregoryの誤った恒常性スケーリング理論で説明し、この理論が知覚の能動的・構成的性質についてどのような示唆を与えるか論じよ。 A4: ポンゾ錯視では、収束する2本の線(線遠近法の手がかり)の間に置かれた同じ長さの2本の水平線のうち、上方(収束点に近い側、すなわち「遠方」と解釈される側)の線分が長く見える。Gregoryの理論によれば、視覚系は収束する線を奥行き手がかりとして解釈し、無意識的に大きさ-距離スケーリングを適用する。「遠くにある」と解釈された上方の線分に対して、同一の網膜像サイズにもかかわらず恒常性スケーリングにより拡大補正が適用され、より大きく知覚される。この錯覚は、知覚が刺激の受動的な受容ではなく、事前知識や文脈に基づく推論を伴う能動的な構成過程であることを示している。通常は適応的に機能する処理が、二次元図形という本来の適用範囲外の状況で不適切に作動した結果として錯覚が生じる。
Q5: 物体認知におけるビューベース理論と構造記述理論(Biedermanの RBC理論)それぞれの主張と、各理論を支持する実験的証拠を述べよ。 A5: ビューベース理論は、物体認知が記憶に蓄積された視点固有の二次元表現との照合により行われるとする。支持する証拠として、物体認知に視点依存性が認められること(馴染みのある視点からの方が認知が速く正確であること)がある。構造記述理論(RBC理論)は、物体が約36種類のジオン(基本立体)の空間配置として表現され、非偶然的性質により視点に依存しない認知が可能とする。支持する証拠として、部分的に遮蔽された物体でもジオンレベルの情報が保存されていれば認知可能であること、新奇な視点からの汎化が可能であること、エッジ情報(ジオンの同定に必要)が除去されると認知が著しく障害されることなどがある。現在は両理論が排他的ではなく、課題や状況に応じて両方の処理方略が併用されている可能性が議論されている。