コンテンツにスキップ

Module 1-3 - Section 1: 古典的条件づけ

セクション情報

項目 内容
モジュール Module 1-3: 学習・記憶の心理学
前提セクション なし
想定学習時間 4時間

導入

学習(learning)とは、経験によって行動や知識が比較的永続的に変化する過程である。心理学における学習研究の出発点となったのが、Ivan Petrovich Pavlov(1849-1936)による古典的条件づけ(classical conditioning)の発見である。Pavlovはもともと消化生理学の研究でノーベル生理学・医学賞(1904)を受賞した生理学者であったが、実験中にイヌが食物そのものではなく実験者の足音や器具の音に反応して唾液を分泌する現象を観察し、この「精神的分泌(psychic secretion)」の体系的研究に転じた。

古典的条件づけは、もともと反応を引き起こさなかった中性刺激が、生得的に反応を引き起こす刺激と繰り返し対提示されることで、その中性刺激単独でも反応を誘発するようになる学習過程である。この原理は、恐怖症の形成、広告効果、薬物耐性の獲得など、広範な心理現象の理解に不可欠な基盤理論として位置づけられる。


Pavlovの実験と基本概念

唾液条件づけ実験

Pavlovの基本的な実験手続きは以下の通りである。イヌを実験装置に固定し、唾液の分泌量を正確に測定できるようにカニューレを挿入する。まず、メトロノームの音(中性刺激)を提示した直後に食物(肉粉末)を与える。これを繰り返すと、やがてメトロノームの音だけでイヌが唾液を分泌するようになる。

Key Concept: 無条件刺激(unconditioned stimulus; US) 学習を必要とせず、生得的に特定の反応を自動的に誘発する刺激。Pavlovの実験における食物がこれにあたる。

Key Concept: 無条件反応(unconditioned response; UR) 無条件刺激によって生得的に引き起こされる反応。食物に対する唾液分泌がこれにあたる。

Key Concept: 条件刺激(conditioned stimulus; CS) もともと当該反応を引き起こさなかった中性刺激が、USとの対提示を経て反応を誘発するようになったもの。メトロノームの音がこれにあたる。

Key Concept: 条件反応(conditioned response; CR) 条件刺激によって引き起こされる学習された反応。CSに対する唾液分泌がこれにあたる。CRはURと類似するが、必ずしも同一ではなく、一般にURより反応強度が小さい。

graph LR
  subgraph "条件づけ前"
    US1["US(食物)"] --> UR1["UR(唾液分泌)"]
    NS["中性刺激(メトロノーム音)"] -.->|"反応なし"| X["(唾液分泌なし)"]
  end
  subgraph "条件づけ中"
    NS2["CS(メトロノーム音)"] -->|"対提示"| US2["US(食物)"]
    US2 --> UR2["UR(唾液分泌)"]
  end
  subgraph "条件づけ後"
    CS3["CS(メトロノーム音)"] --> CR3["CR(唾液分泌)"]
  end

基本的手続きの分類

CS-US間の時間的関係によって、条件づけの効率は大きく変動する。主要な手続きは以下の4種である。

手続き CS-USの時間関係 条件づけの効率
遅延条件づけ(delay conditioning) CSが先行し、CS提示中にUSが提示される 最も効率的
痕跡条件づけ(trace conditioning) CS終了後、一定の空白期間を経てUSが提示される 空白が長いほど困難
同時条件づけ(simultaneous conditioning) CSとUSが同時に提示される 一般に弱い
逆行条件づけ(backward conditioning) USが先に提示され、その後にCSが提示される ほとんど成立しない(一部例外あり)

遅延条件づけが最も効率的であるという事実は、条件づけの本質が単なるCS-USの接近性(contiguity)だけでは説明できないことを示唆しており、後述する情報価の議論への伏線となる。


獲得、消去、自発的回復、般化、弁別

獲得と獲得曲線

Key Concept: 獲得(acquisition) CS-USの対提示を繰り返すことでCRが形成・強化される過程。CRの強度は試行を重ねるにつれて増大し、やがて漸近値(asymptote)に達する。

獲得曲線は典型的にはネガティブ加速曲線(負の加速度曲線)を描く。すなわち、初期の試行では急速にCRが強まるが、漸近値に近づくにつれて増加率は低下する。漸近値はUSの強度に依存し、強いUSほど高い漸近値をもたらす。

消去と自発的回復

Key Concept: 消去(extinction) USを伴わずにCSのみを繰り返し提示すると、CRが徐々に減弱・消失する過程。ただし、消去は条件づけの「解消」ではなく、新たな抑制的学習の重畳であると現在では理解されている。

消去が条件づけの完全な消滅ではないことを示す最も明確な証拠が、自発的回復(spontaneous recovery)である。消去手続きの後、一定の休止期間を置いてCSを再提示すると、一度消えたはずのCRが再び出現する。この現象は、条件づけの記憶痕跡そのものは消去によって除去されるのではなく、消去によって形成された抑制が時間経過とともに減衰するために条件づけが「復活」すると解釈される。

さらに、消去後の再条件づけ(reacquisition)は初回の条件づけよりも速やかに進行する。これも元の学習が保持されていることの傍証である。

graph LR
  subgraph "学習過程の推移"
    A["獲得(CS+US対提示)"] -->|"CR増大"| B["漸近"]
    B -->|"CS単独提示"| C["消去(CR減弱)"]
    C -->|"休止期間"| D["自発的回復(CR再出現)"]
    D -->|"CS単独提示"| E["再消去"]
  end

刺激般化と般化勾配

Key Concept: 刺激般化(stimulus generalization) 条件づけされたCSと物理的に類似した刺激に対してもCRが出現する現象。CSとの類似度が高いほどCRは強く、類似度が低下するにつれてCRは弱まる。

この関係を図示したものが般化勾配(generalization gradient)であり、CSを中心とした逆U字型(ベル型)の曲線を描く。般化勾配の幅は条件づけの強度や弁別訓練の有無によって変化する。

般化は適応的な意味を持つ。自然環境では、危険を知らせる刺激が常に全く同一の物理的特徴を持つとは限らない。類似した刺激にも防御反応を示すことは生存上有利である。一方で、過度の般化は不適応にもつながりうる。たとえば、John Broadus Watson & Rosalie Raynerによるリトル・アルバート実験(1920)では、白ネズミに対して条件づけられた恐怖反応がウサギ、毛皮、サンタクロースのマスクなど類似刺激へ般化した事例が報告されている。

刺激弁別

Key Concept: 刺激弁別(stimulus discrimination) 特定のCS(CS+)にはUSを対提示し、類似した別の刺激(CS-)にはUSを対提示しない弁別訓練を行うと、CS+にのみCRが生じ、CS-にはCRが生じなくなる過程。

弁別訓練は般化勾配を狭める効果を持つ。すなわち、CS+に対するCRは維持されるが、CS-およびCS-に類似した刺激に対するCRは抑制される。Pavlovは弁別訓練を極端に困難にすると(円と楕円の弁別で楕円を徐々に円に近づける)、イヌが激しい情動反応を示す「実験神経症(experimental neurosis)」を報告している。


Rescorla-Wagnerモデル

モデルの定式化

Key Concept: Rescorla-Wagnerモデル(Rescorla-Wagner model) Robert Rescorla & Allan Wagnerが1972年に提唱した、古典的条件づけにおける連合学習の数理モデル。試行ごとの連合強度(associative strength)の変化量を予測誤差(prediction error)に基づいて定式化する。

モデルの核心は以下の式で表される。

ΔV = αβ(λ - ΣV)

各項の意味は以下の通りである。

記号 意味
ΔV 当該試行におけるCSの連合強度の変化量
α(アルファ) CSの顕著性パラメータ(0 < α ≤ 1)。CSがどれだけ注意を引くか
β(ベータ) USの学習率パラメータ(0 < β ≤ 1)。USがどれだけ効果的に学習を駆動するか
λ(ラムダ) USが支持しうる最大連合強度(漸近値)
ΣV その試行で提示されている全CSの連合強度の総和

このモデルの要点は、学習の駆動力が「予測誤差(prediction error)」すなわち(λ - ΣV)であるという点にある。USが十分に予測されている場合(ΣVがλに近い場合)、学習はほとんど生じない。USが予測されていない場合(ΣVがλより小さい場合)に学習が大きく進む。

graph TD
  A["試行開始: CS提示"] --> B["現在の連合強度 ΣV を計算"]
  B --> C{"US提示?"}
  C -->|"あり(λ > 0)"| D["予測誤差 = λ - ΣV"]
  C -->|"なし(λ = 0)"| E["予測誤差 = 0 - ΣV"]
  D --> F["ΔV = αβ × 予測誤差"]
  E --> F
  F --> G["連合強度を更新: V_new = V_old + ΔV"]

ブロッキング効果

Rescorla-Wagnerモデルの最大の成功は、Leon Kaminが1969年に報告したブロッキング効果(blocking effect)を説明できた点にある。

ブロッキングとは以下の現象である。まず刺激A単独とUSの対提示で条件づけを行い、AのCRを十分に確立する(Phase 1: A→US)。次に、AとBの複合刺激とUSの対提示を行う(Phase 2: AB→US)。この場合、Bに対するCRはほとんど形成されない。AがすでにUSを十分に予測しているため、Phase 2では予測誤差(λ - ΣV)がほぼゼロとなり、Bの連合強度はほとんど増加しないのである。

この結果は、単なるCS-USの接近性だけでは条件づけの成立を説明できないことを示している。CSが「情報価」を持つ場合、すなわちUSの予測に新たな情報を付加する場合にのみ条件づけが成立するのである。

過剰期待効果

過剰期待効果(overexpectation effect)もRescorla-Wagnerモデルから導かれる重要な予測である。刺激AとUSの対提示で条件づけを行い(V_A ≈ λ)、同様に刺激BとUSの対提示でも条件づけを行う(V_B ≈ λ)。次に、AとBの複合刺激に同じUSを対提示すると、ΣV = V_A + V_B ≈ 2λ であるため、予測誤差(λ - ΣV)は負の値をとる。その結果、AとBの両方の連合強度が減少する。これは直感に反するが、実験的に確認されている。

モデルの限界

Rescorla-Wagnerモデルはブロッキングや過剰期待を見事に説明するが、以下の現象は説明が困難である。

  • 潜在制止(latent inhibition): CSを単独で繰り返し提示した後にCS-US対提示を行うと、条件づけが遅延する現象。モデルではCSの事前提示は連合強度に影響しないため説明できない。
  • 感性予備条件づけ(sensory preconditioning): CS1-CS2の対提示の後にCS2-USの対提示を行うと、CS1にもCRが形成される現象。モデルはUSが存在しない試行での学習を想定していない。
  • CSの顕著性変化: α値を固定値として扱っているが、実際には注意の変化によってCSの処理が動的に変化する。この点はNicolaus Mackintosh(1975)やJohn Pearce & Geoffrey Hall(1980)の注意モデルによって修正が試みられている。

条件刺激の情報価

随伴性 vs 接近性

条件づけの成立に必要な条件について、伝統的にはCS-USの時空間的接近性(contiguity)が重要であると考えられてきた。しかし、Robert Rescorlaは1968年の一連の実験により、接近性よりも随伴性(contingency)が本質的であることを示した。

Key Concept: 随伴性(contingency) CSの存在がUSの発生確率に関する情報を提供する度合い。P(US|CS) > P(US|no CS) のとき正の随伴性、P(US|CS) = P(US|no CS) のとき随伴性ゼロ、P(US|CS) < P(US|no CS) のとき負の随伴性が存在する。

真に無作為統制手続き

Rescorlaは「真に無作為統制手続き(truly random control procedure)」を考案した。この手続きでは、CSとUSの対提示の回数は実験群と統制群で同一に保ちつつ、統制群ではCS非提示時にもUSを同じ確率で提示する。すなわち、統制群ではP(US|CS) = P(US|no CS) であり、CS-USの接近性は実験群と同等に存在するにもかかわらず、条件づけはほとんど成立しない。

この結果は、条件づけの本質が単なるCS-USの時間的接近ではなく、CSがUSの発生を予測するという情報的関係にあることを示している。Rescorla(1988)は「Pavlovian conditioning: It's not what you think it is」という論文タイトルでこの立場を端的に表現している。


評価条件づけとその応用

Key Concept: 評価条件づけ(evaluative conditioning) 中性刺激が感情的に価値のある刺激(快または不快)と繰り返し対提示されることにより、中性刺激自体の感情的評価が変化する現象。古典的条件づけの一形態であるが、消去に対して抵抗性が高い点、参加者のCS-US関係の意識的認知が必ずしも必要でない可能性がある点など、標準的な古典的条件づけとは異なる特徴も指摘されている。

評価条件づけは広告・マーケティング領域で広く応用されている。ブランド名(CS)と快感情を喚起する映像や音楽(US)を繰り返し対提示することで、ブランドに対する好意的態度(CR)を形成するという手法は、テレビCMの基本的メカニズムの一つである。Michael Olson & Russell Fazio(2001)は、架空のブランド名と快・不快な画像の対提示によってブランド態度が変化することを実験的に示している。

ただし、評価条件づけの理論的位置づけについては議論が続いている。通常の古典的条件づけとは異なり消去に対して頑健であるという知見は、連合学習とは異なるメカニズム(帰属の変化やミス帰属など)が関与している可能性を示唆する。


味覚嫌悪学習と生物学的制約

Garcia効果

Key Concept: 味覚嫌悪学習(conditioned taste aversion) 特定の味覚刺激(CS)の摂取後に内臓不快感(US)を経験すると、その味覚に対する嫌悪(CR)が形成される学習。John Garcia & Robert Koellingが1966年に報告し、Garcia効果とも呼ばれる。

味覚嫌悪学習には、古典的条件づけの一般法則からの重要な逸脱が2点ある。

第一に、長時間遅延でも成立する。通常の古典的条件づけではCS-US間隔が数秒を超えると条件づけが困難になるが、味覚嫌悪学習ではCS(味覚)とUS(内臓不快感)の間隔が数時間に及んでも強固な条件づけが成立する。これは消化・代謝という生理過程の時間経過を反映した適応的特性であると解釈される。

第二に、CS-US対提示の選択性がある。Garciaらの「明るく騒がしい水(bright noisy water)」実験では、味覚CSは内臓不快感USとは容易に連合するが外的苦痛(電撃)USとは連合しにくく、逆に音光CSは電撃USとは容易に連合するが内臓不快感USとは連合しにくいことが示された。

CS US: 内臓不快感 US: 電撃
味覚 容易に条件づけ成立 困難
音光 困難 容易に条件づけ成立

準備性と生物学的制約

Key Concept: 準備性(preparedness) Martin Seligmanが1970年に提唱した概念。生物は進化の歴史を通じて、特定のCS-US連合を形成しやすい(prepared)、あるいは形成しにくい(contraprepared)生得的傾向を持つという考え方。

Seligmanの準備性の概念は、古典的条件づけを含む連合学習が完全に汎用的な(general-purpose)メカニズムであるという従来の前提に根本的な修正を迫るものであった。学習は「白紙(tabula rasa)」の上に任意の連合を等しく形成するのではなく、種の進化史によって方向づけられた制約のもとで生じる。

この知見はヒトの恐怖症の理解にも貢献している。Arne Ohman & Susan Mineka(2001)は、ヒトがヘビやクモに対して恐怖の条件づけを特に容易に獲得すること、そしてそのような条件づけが消去に対して抵抗性を示すことを実験的に示している。銃や自動車など客観的により危険な対象より、ヘビやクモへの恐怖症が圧倒的に多いという疫学的事実は、準備性の概念と整合的である。

graph TD
  subgraph "生物学的制約の概念構造"
    A["汎用的連合学習の仮定"] -->|"Garcia効果による修正"| B["CS-US連合の選択性"]
    B --> C["準備性(Seligman)"]
    C --> D["進化的に関連するCS-US対は学習が容易"]
    C --> E["進化的に無関連なCS-US対は学習が困難"]
    D --> F["恐怖症の理解への応用"]
    E --> F
  end

まとめ

  • 古典的条件づけは、中性刺激(CS)がUSと繰り返し対提示されることでCRを獲得する学習過程である。
  • CRの獲得、消去、自発的回復、般化、弁別という一連の現象が条件づけの基本特性を構成する。消去は学習の消滅ではなく、抑制的学習の重畳である。
  • Rescorla-Wagnerモデルは予測誤差に基づく数理モデルであり、ブロッキングや過剰期待を説明するが、潜在制止や感性予備条件づけなどには限界がある。
  • 条件づけの本質は単なるCS-USの接近性ではなく、CSがUSの発生に関する情報を提供するという随伴性の関係にある。
  • 味覚嫌悪学習の発見は、連合学習が進化的制約を受けることを示し、準備性の概念を生んだ。
  • 次のSection 2「オペラント条件づけ」では、行動の結果(強化・罰)による学習を扱う。古典的条件づけが刺激間の関係の学習であるのに対し、オペラント条件づけは行動と結果の関係の学習である。Section 3「学習の認知的理論」では、潜在学習や観察学習など、刺激-反応の枠組みを超えた認知的学習理論を扱い、Section 1・2で学んだ連合学習理論の拡張と限界を検討する。

用語集(Glossary)

用語 英語表記 定義
古典的条件づけ classical conditioning 中性刺激がUSとの対提示を通じてCRを誘発するようになる学習過程
無条件刺激 unconditioned stimulus; US 学習なしに生得的に反応を誘発する刺激
無条件反応 unconditioned response; UR USによって生得的に誘発される反応
条件刺激 conditioned stimulus; CS USとの対提示を経て反応を誘発するようになった刺激
条件反応 conditioned response; CR CSによって誘発される学習された反応
獲得 acquisition CS-US対提示の反復によりCRが形成される過程
消去 extinction USなしのCS単独提示によりCRが減弱する過程
自発的回復 spontaneous recovery 消去後の休止期間を経てCRが再出現する現象
刺激般化 stimulus generalization CSに類似した刺激にもCRが出現する現象
刺激弁別 stimulus discrimination CS+にのみCRが生じ、CS-には生じなくなる過程
Rescorla-Wagnerモデル Rescorla-Wagner model 予測誤差に基づく連合学習の数理モデル
ブロッキング効果 blocking effect 既に条件づけられたCSの存在が新たなCSの条件づけを妨げる現象
過剰期待効果 overexpectation effect 各々条件づけられた複合CSに対し、各CSの連合強度が低下する現象
随伴性 contingency CSの有無がUSの発生確率に影響する度合い
評価条件づけ evaluative conditioning 感情価を持つUSとの対提示でCSの感情的評価が変化する現象
味覚嫌悪学習 conditioned taste aversion 味覚CSと内臓不快感USの連合による嫌悪の学習
準備性 preparedness 特定のCS-US連合が進化的に形成されやすい生得的傾向

確認問題

Q1: 古典的条件づけにおいて、消去が条件づけの「解消」ではなく「抑制」であることを示す実験的証拠を2つ挙げ、それぞれ説明せよ。

A1: 第一に、自発的回復がある。消去手続きの後に休止期間を置くと、消去されたはずのCRが再び出現する。これは元の条件づけの記憶痕跡が保持されており、消去による抑制が時間経過とともに減衰することを示す。第二に、再条件づけの促進(rapid reacquisition)がある。消去後にCS-USの対提示を再開すると、初回の条件づけよりも速やかにCRが再獲得される。これも元の連合が完全には消失していないことの証拠である。

Q2: Rescorla-WagnerモデルのΔV = αβ(λ - ΣV) を用いて、ブロッキング効果がなぜ生じるかを説明せよ。

A2: Phase 1でCSa単独とUSの対提示を繰り返すと、V_Aはλに近づく。Phase 2でCSa+CSbの複合刺激とUSを対提示すると、ΣV = V_A + V_B ≈ λ + 0 = λ であるため、予測誤差(λ - ΣV)はほぼゼロとなる。したがってΔV_B = αβ(λ - ΣV) ≈ 0 となり、CSbの連合強度はほとんど増加しない。すなわち、CSaがすでにUSを十分に予測しているため、CSbは「冗長な」情報しか提供せず、新たな条件づけが成立しないのである。

Q3: GarciaとKoellingの実験結果は、連合学習の「等ポテンシャル性の仮定」にどのような挑戦を突きつけたか。準備性の概念と関連づけて論じよ。

A3: 等ポテンシャル性の仮定とは、任意のCSと任意のUSの間に等しく連合が形成されうるという、行動主義的学習理論の前提である。Garcia & Koellingの実験では、味覚CSは内臓不快感USとは容易に連合するが電撃USとは連合しにくく、音光CSは電撃USとは連合するが内臓不快感USとは連合しにくいことが示された。これはCS-US連合の選択性を意味し、等ポテンシャル性の仮定を直接反証する。Seligmanの準備性の概念はこの知見を進化的観点から説明する。自然環境では味覚と消化器系の不調には因果関係がある場合が多く、このCS-US対の連合を速やかに形成する個体が生存上有利であったと考えられる。したがって、進化の過程で特定のCS-US連合が形成されやすい(prepared)生得的傾向が選択されてきたのである。

Q4: Rescorlaの「真に無作為統制手続き」はどのような手続きであり、そこから条件づけの本質について何が結論されるか。

A4: 真に無作為統制手続きでは、統制群においてCSとUSの対提示の回数を実験群と同一に保ちつつ、CS非提示時にもUSを同確率で提示する。その結果、統制群ではP(US|CS) = P(US|no CS) となり、CS-USの時間的接近性は実験群と同等に存在するにもかかわらず、条件づけはほとんど成立しない。この結果から、条件づけの成立に必要なのはCS-USの単なる時間的接近(contiguity)ではなく、CSがUSの発生を予測するという随伴性(contingency)の関係、すなわちCSの情報価であることが結論される。

Q5: 評価条件づけが通常の古典的条件づけと異なるとされる特徴を述べ、その理論的含意を論じよ。

A5: 評価条件づけの主な特異的特徴として、消去に対する抵抗性が挙げられる。通常の古典的条件づけではCS単独提示によりCRが減弱するが、評価条件づけで形成された感情的評価はCS単独提示を繰り返してもなかなか消去されない。また、CS-US関係の意識的認知が必ずしも必要でない可能性も指摘されているが、この点については議論が続いている。これらの特徴は、評価条件づけが標準的な連合学習メカニズムとは異なるプロセス(例えば、帰属の変化やミス帰属)を含む可能性を示唆しており、古典的条件づけの理論的枠組みの拡張が求められることを意味している。