Module 2-4 - Section 1: 分散分析の発展¶

セクション情報¶

項目	内容
モジュール	Module 2-4: 心理統計法 II・研究法
前提セクション	なし（Module 0-2の知識を前提）
想定学習時間	4〜5時間

導入¶

Module 0-2では、一元配置分散分析（one-way ANOVA）を通じて「3群以上の平均値差を単一のF検定で評価する」という枠組みを学んだ。しかし、実際の心理学研究では、1つの独立変数のみを扱う単純な実験デザインは少ない。多くの研究は複数の独立変数を同時に操作し、それらの変数が単独で及ぼす効果（主効果）だけでなく、変数間の組み合わせによって生じる効果（交互作用）に関心を寄せる。また、同一参加者に対して繰り返し測定を行うデザインは心理学実験で極めて一般的であり、このようなデザインに対応する統計手法が必要となる。

本セクションでは、一元配置分散分析を拡張し、(1) 二元配置分散分析、(2) 反復測定分散分析、(3) 混合計画分散分析を扱う。さらに、統計的有意性のみに依存しない結果の解釈として (4) 効果量の体系的な理解を深め、最後に (5) 多重比較（事後検定）の主要な手法とその使い分けを詳述する。

二元配置分散分析¶

二要因デザインの必要性¶

心理学研究において、従属変数に対する影響を検討すべき独立変数が複数存在することは珍しくない。例えば、「教授法（講義型 vs. 対話型）」と「学習者の不安水準（低・中・高）」が試験成績に及ぼす効果を同時に検討したい場合がある。こうした場合、各要因について別々に一元配置分散分析を行うのでは不十分である。なぜなら、一方の要因の効果が他方の水準によって異なる可能性――すなわち交互作用――を検出できないためである。

Key Concept: 二元配置分散分析（two-way ANOVA） 2つの独立変数（要因）が従属変数に及ぼす効果を同時に検定する手法。各要因の主効果と、2要因間の交互作用を分離して評価できる。

二元配置分散分析では、要因A（a水準）と要因B（b水準）を組み合わせた a × b のセル構造を持つデザインを分析する。例えば、教授法（2水準）× 不安水準（3水準）であれば、2 × 3 = 6 セルとなる。

主効果と交互作用¶

二元配置分散分析では、3つのF検定が実施される。

Key Concept: 主効果（main effect） ある要因が、他の要因の水準を無視して（全水準にわたって平均して）従属変数に及ぼす効果。二元配置分散分析では要因Aの主効果と要因Bの主効果の2つが検定される。

Key Concept: 交互作用（interaction） ある要因の効果が、もう一方の要因の水準によって異なること。交互作用が有意である場合、主効果の解釈には慎重さが求められる。

検定対象	帰無仮説	意味
要因Aの主効果	要因Aの各水準の母平均が等しい	要因Bの水準を無視したとき、要因Aの効果はあるか
要因Bの主効果	要因Bの各水準の母平均が等しい	要因Aの水準を無視したとき、要因Bの効果はあるか
A × B 交互作用	要因Aの効果が要因Bの水準によって変わらない	2要因の組み合わせ効果はあるか

交互作用の有無は結果の解釈に大きく影響する。交互作用が有意でない場合、各主効果はそのまま解釈できる。しかし交互作用が有意である場合、主効果だけを見ると誤った結論に至る可能性がある。

交互作用の解釈と交互作用プロット¶

交互作用を視覚的に理解するには、交互作用プロット（interaction plot）が有用である。横軸に一方の要因の水準、縦軸に従属変数の平均値をとり、もう一方の要因の各水準を別々の線で描く。

交互作用なし: 2本（以上）の線がほぼ平行 → 一方の要因の効果は他方の水準によらず一定
交互作用あり: 線が交差する、あるいは傾きが大きく異なる → 一方の要因の効果が他方の水準によって変化

graph LR
    subgraph "交互作用なし"
        A1["要因B: 低"] --- A2["平行な線"]
        A3["要因B: 高"] --- A2
    end
    subgraph "交互作用あり"
        B1["要因B: 低"] --- B2["交差する線"]
        B3["要因B: 高"] --- B2
    end

具体例として、Eysenck（1974）の有名な実験を考える。若年群と高齢群に対して5種類の符号化条件（カウント、韻判断、形容詞判断、イメージ、意図的学習）で単語を提示し、自由再生数を測定した。この実験では年齢 × 符号化条件の交互作用が有意であり、処理水準が深い条件（イメージ、意図的学習）では若年群と高齢群の差が小さいが、浅い処理条件では高齢群の成績がより低いという結果が得られた。このような場合、「高齢群は記憶成績が低い」という主効果のみの解釈は、条件によって差の大きさが異なるという重要な情報を見落とすことになる。

単純主効果の検定¶

交互作用が有意であった場合、各要因の主効果をそのまま解釈するのではなく、単純主効果（simple main effect）の検定を行う。これは、一方の要因の特定の水準に固定したうえで、もう一方の要因の効果を検定するものである。

Key Concept: 単純主効果（simple main effect） 一方の要因の特定の水準において、もう一方の要因が従属変数に及ぼす効果。交互作用が有意な場合に、効果の所在を具体的に特定するために検定される。

例えば、教授法 × 不安水準の分析で交互作用が有意であった場合、「低不安群における教授法の効果」「中不安群における教授法の効果」「高不安群における教授法の効果」をそれぞれ検定する。これにより、交互作用の具体的なパターン（例: 対話型は低不安群では講義型より有効だが、高不安群ではその差がない）を明確にできる。

二元配置分散分析の分散の分解¶

一元配置分散分析では全変動を群間変動と群内変動に二分したが、二元配置では群間変動をさらに分解する。

graph TD
    SS["SS_total<br/>全変動"]
    SS --> SSbet["SS_between<br/>群間変動"]
    SS --> SSw["SS_within<br/>群内変動（誤差）"]
    SSbet --> SSA["SS_A<br/>要因Aの主効果"]
    SSbet --> SSB["SS_B<br/>要因Bの主効果"]
    SSbet --> SSAB["SS_A×B<br/>交互作用"]

SS_total = SS_A + SS_B + SS_A×B + SS_within

各成分の自由度は以下の通りである。

成分	自由度
要因A	a - 1
要因B	b - 1
A × B 交互作用	(a - 1)(b - 1)
誤差（群内）	ab(n - 1)（各セルn名の場合）
全体	N - 1

各F比は、対応する平均平方を誤差の平均平方で割って算出する。

反復測定分散分析¶

反復測定デザインの特徴¶

心理学実験では、同一の参加者に複数の条件を経験させる反復測定デザイン（repeated measures design）が頻繁に用いられる。例えば、同一参加者に3種類の課題条件（統制条件・干渉条件・促進条件）を全て経験させ、各条件での反応時間を測定するような場合である。

Key Concept: 反復測定分散分析（repeated measures ANOVA） 同一の参加者が複数の条件すべてに参加する対応ありデザインに適用される分散分析。被験者間分散を除去できるため、検定力が高い。

反復測定デザインの最大の利点は、被験者間変動（individual differences）を誤差項から分離・除去できる点である。一元配置分散分析（対応なしデザイン）では、群内変動にはランダム誤差と個人差の両方が含まれていた。反復測定デザインでは、同じ参加者が全条件に参加するため、条件間の差に個人差が混入しない。これにより誤差分散が小さくなり、同じ効果量でもF比が大きくなる（すなわち検定力が向上する）。

graph TD
    subgraph "対応なしデザイン"
        T1["SS_total"] --> B1["SS_between<br/>条件効果"]
        T1 --> W1["SS_within<br/>個人差 + 誤差"]
    end
    subgraph "反復測定デザイン"
        T2["SS_total"] --> B2["SS_条件<br/>条件効果"]
        T2 --> S2["SS_被験者<br/>個人差"]
        T2 --> E2["SS_誤差<br/>純粋な誤差"]
    end

反復測定デザインでは、全変動が「条件の効果」「被験者の個人差」「残差（条件×被験者の交互作用）」に分解される。この残差が誤差項として用いられるため、対応なしデザインよりも誤差が小さくなる。

球面性の仮定¶

反復測定分散分析を適用する際には、対応なしデザインの等分散性に代わる、より厳しい仮定が課される。

Key Concept: 球面性（sphericity） 反復測定分散分析において、すべての条件ペア間の差分スコアの分散が等しいという仮定。等分散性と複合対称性（compound symmetry）を一般化した条件であり、反復測定分散分析のF検定が正確であるための前提条件である。

球面性の仮定は、条件が3水準以上ある場合に問題となる（2水準の場合は自動的に満たされる）。直観的には、「どの2条件の組み合わせをとっても、それらの差分スコアのばらつきが同程度である」ことを要求する。

Mauchlyの球面性検定¶

球面性が成立しているかを検定するのがMauchlyの球面性検定（Mauchly's test of sphericity）である。

H₀: 球面性の仮定が成立している
H₁: 球面性の仮定が成立していない

ここで注意すべきは、帰無仮説が「仮定が成立している」であるため、検定が有意（p < .05）の場合に球面性の仮定が棄却される、という点である。しかし、Mauchlyの検定はサンプルサイズに敏感であり、大標本では些細な逸脱でも有意になりやすく、小標本では検定力が低い。そのため、球面性の仮定に依存しない修正法をデフォルトで適用することを推奨する研究者もいる。

球面性違反時の修正法¶

球面性の仮定が満たされない場合、F検定の自由度を下方修正して保守的な検定を行う。修正の度合いはイプシロン（ε）と呼ばれる係数で表される。εの範囲は 1/(k-1) ≦ ε ≦ 1（kは条件数）であり、ε = 1 のとき球面性が完全に成立している。

修正法	特徴
Greenhouse-Geisser（GG）補正	εを保守的に推定する。球面性からの逸脱が大きい場合に適する。サンプルサイズが小さい場合にも推奨される
Huynh-Feldt（HF）補正	GG補正よりも自由（リベラル）な推定を行う。GG補正のεが .75 以上の場合に推奨されることがある

修正の手順は、元の自由度にεを乗じることで修正自由度を算出し、その修正自由度でF値のp値を再計算するというものである。例えば、条件の自由度が df = 3、誤差の自由度が df = 45 で、ε = .72 の場合、修正後の自由度は df = 3 × .72 = 2.16、df = 45 × .72 = 32.4 となる。

実務上の指針として、GG補正のεが .75未満であればGG補正を、.75以上であればHF補正を用いるという基準がMaxwell & Delaney（2004）によって提案されている。ただし、近年では一貫してGG補正を用いることも広く許容されている。

混合計画分散分析¶

被験者間要因と被験者内要因の組み合わせ¶

実際の心理学研究では、一部の要因が被験者間（参加者ごとに異なる水準に割り当て）、他の要因が被験者内（同一参加者が全水準を経験）というデザインが多い。

Key Concept: 混合計画（mixed design / split-plot design） 少なくとも1つの被験者間要因と少なくとも1つの被験者内要因を含む実験デザイン。混合計画分散分析では、被験者間効果と被験者内効果で異なる誤差項を用いる。

典型的な例として、「治療法（薬物療法 vs. 心理療法：被験者間）× 測定時点（ベースライン・1か月後・3か月後：被験者内）」のデザインがある。各参加者はいずれかの治療法に割り当てられ（被験者間）、3つの時点で繰り返し測定される（被験者内）。

graph TD
    A["混合計画の効果"] --> B["被験者間効果"]
    A --> C["被験者内効果"]
    B --> B1["要因A の主効果<br/>（被験者間）"]
    B --> B2["誤差: 被験者間誤差"]
    C --> C1["要因B の主効果<br/>（被験者内）"]
    C --> C2["A × B 交互作用"]
    C --> C3["誤差: 被験者内誤差"]

混合計画分散分析では、被験者間効果と被験者内効果で異なる誤差項が使用される点が重要である。被験者間要因のF検定には被験者間誤差を、被験者内要因のF検定および交互作用のF検定には被験者内誤差を用いる。

混合計画における交互作用の解釈¶

混合計画でとりわけ重要なのは交互作用の解釈である。上記の治療法 × 測定時点の例では、交互作用が有意であれば「治療法による改善のパターン（時間経過に伴う変化の仕方）が治療法によって異なる」ことを意味する。例えば、薬物療法は1か月後に急速に改善するがその後は横ばい、心理療法は緩やかだが3か月後まで持続的に改善する、というパターンが考えられる。

このように、混合計画における交互作用は「群間差の時間的変化」あるいは「時間変化パターンの群間差」として解釈され、縦断研究・介入研究において臨床的に最も意味のある情報を提供することが多い。

被験者内要因に対しては球面性の仮定が適用されるため、条件が3水準以上の場合にはMauchlyの検定とGG補正/HF補正を考慮する必要がある。

効果量¶

統計的有意性と実質的有意性¶

分散分析のF検定で有意な結果が得られたとしても、それは「効果がゼロでない」ことを示すに過ぎない。サンプルサイズが十分に大きければ、実質的に無意味な微小な差であっても統計的に有意となりうる。逆に、サンプルサイズが小さければ、重要な効果が検出されない可能性もある。このため、p値に加えて効果の大きさを定量化する指標――効果量（effect size）――を報告することが、APA（アメリカ心理学会）の出版マニュアルでも強く推奨されている。

Cohen's d¶

Key Concept: Cohen's d 2群の平均値差を標準偏差で割って標準化した効果量指標。サンプルサイズに依存しないため、研究間の比較やメタ分析に適する。

Cohen's d = (M₁ - M₂) / SD_pooled

ここで SD_pooled はプールされた標準偏差である。Cohen's d は主にt検定の文脈で用いられ、平均値差が何標準偏差分に相当するかを表す。

η²（イータ二乗）¶

Key Concept: η²（eta-squared） 従属変数の全変動のうち、独立変数によって説明される割合。分散分析における効果量指標であり、η² = SS_effect / SS_total で算出される。

η²は直観的にわかりやすく、「この要因は全変動の何%を説明するか」と解釈できる。しかし、二元配置以上のデザインでは重大な問題がある。η²は全変動に対する比率であるため、他の要因や交互作用が大きな変動を占めると、着目する要因のη²が相対的に小さくなってしまう。

Partial η²（偏イータ二乗）¶

この問題に対処するのがpartial η²（偏イータ二乗）である。

Key Concept: Partial η²（partial eta-squared） 着目する効果の変動を、その効果の変動と誤差変動の和で割った値。他の要因の効果を除外して評価するため、多要因デザインではη²より適切な効果量指標とされる。partial η² = SS_effect / (SS_effect + SS_error)

SPSSやR等の統計ソフトでは、分散分析の効果量としてpartial η²がデフォルトで出力されることが多い。partial η²はη²以上の値をとり、一元配置分散分析ではη² = partial η²となる。

ω²（オメガ二乗）¶

Key Concept: ω²（omega-squared） 母集団における効果量の不偏推定量。η²やpartial η²がサンプルの効果量を過大推定する傾向があるのに対し、ω²は自由度に基づく補正を行うことでバイアスを軽減する。

η²は正のバイアスを持ち、母集団の効果量を過大推定する傾向がある。これはR²が調整済みR²より大きくなるのと同じ原理である。ω²はこのバイアスを補正するため、報告する効果量としてはより正確である。ただし実務上は、partial η²の報告が最も一般的であり、多くのジャーナルで標準的な指標となっている。

効果量の目安¶

Jacob Cohen（1988）は効果量の解釈の目安として以下の基準を提案した。

指標	Small	Medium	Large
Cohen's d	0.2	0.5	0.8
η² / partial η²	.01	.06	.14
r	.10	.30	.50

ただし、この基準は絶対的なものではなく、Cohen自身も分野や文脈に応じた解釈の重要性を強調している。心理学研究の実際の効果量分布を大規模にメタ分析したRichard, Bond, & Stokes-Zoota（2003）によれば、社会心理学領域の平均的な効果量はr = .21であり、Cohenの基準ではsmallとmediumの中間に位置する。効果量の大きさは、理論的意義、実践的影響、測定の信頼性、先行研究との比較を踏まえて総合的に評価すべきである。

信頼区間の重要性¶

効果量の点推定値だけでなく、その信頼区間（confidence interval, CI）を報告することも重要である。効果量の95% CIは「真の効果量がこの範囲に含まれる手続きを95%の確率で生成している」ことを意味し、推定の精度を示す。CIが広い場合はサンプルサイズが不十分で推定が不安定であることを示唆し、CIがゼロを含む場合は効果の方向すら確定できないことを意味する。

事後検定（多重比較）¶

ファミリーワイズエラー率¶

Module 0-2で触れたように、分散分析のF検定が有意であっても、どの群間に差があるかは特定されない。複数のペア比較を実施する必要があるが、個々の比較で有意水準α = .05を用いると、全体としての第一種の過誤率が膨張する。

Key Concept: ファミリーワイズエラー率（familywise error rate, FWER） 一連の多重比較（ファミリー）全体で、少なくとも1つの偽陽性が生じる確率。比較回数をcとすると、個々にα = .05で検定した場合の FWERは最大で 1 - (1 - α)^c に達する。

例えば、4群の全ペア比較（6組）では、FWER = 1 - (1 - .05)^6 ≒ .265 となり、26.5%の確率でいずれかの比較が偽陽性を示す。多重比較法はこのFWERをα以下に統制するための手法である。

主要な多重比較法¶

graph LR
    subgraph "保守性: 高"
        A["Bonferroni"]
    end
    subgraph "保守性: 中"
        B["Holm法"]
        C["Ryan法"]
    end
    subgraph "保守性: 低"
        D["Tukey HSD"]
    end
    A --> B
    B --> D
    C --> D

Tukey HSD¶

Tukey HSD（Honestly Significant Difference）は、すべてのペア比較を行う場合に最も広く用いられる方法である。スチューデント化された範囲（studentized range）分布に基づき、すべてのペア間の差を同時に評価する。

全ペア比較に特化しており、比較の数を前提としてFWERを正確にαに制御する
各群のサンプルサイズが等しい場合に最も効率的（不等の場合はTukey-Kramer法に拡張される）
事前に特定のペアに絞った仮説がない場合のデフォルト選択肢として適切

Bonferroni補正¶

有意水準αを比較回数cで割る（α/c を各比較の有意水準とする）最も単純な補正法である。

任意の比較セット（全ペア比較でなくても、事前に選択した一部の比較でも）に適用可能
比較回数が多いと極めて保守的（検定力が大幅に低下）になる
比較回数が少ない場合（2〜3組程度）や、不等間隔の対比を検定する場合に有用

Holm法（Holm-Bonferroni法）¶

Bonferroni補正の改良版であり、逐次的な手順を用いることで検定力を向上させつつFWERをα以下に制御する。

手順: 1. c個のペア比較のp値を昇順に並べる: p₁ ≦ p₂ ≦ ... ≦ p_c 2. p₁ を α/c と比較する。有意であれば次へ 3. p₂ を α/(c-1) と比較する。有意であれば次へ 4. p_k を α/(c-k+1) と比較する。有意でなければ、それ以降の全比較を有意でないとする

Holm法はBonferroni補正より常に検定力が高く（あるいは等しく）、FWERの制御も同等であるため、Bonferroniを用いる場面ではHolm法が上位互換として推奨される。

Ryan法（REGWQ法）¶

Ryan法（Ryan-Einot-Gabriel-Welsch Q法, REGWQ法）は、比較する群の範囲に応じて有意水準を調整する逐次的方法である。まず全群の範囲でのオムニバス検定を行い、有意であれば順次狭い範囲の部分集合に対して検定を進める。Tukey HSDと同程度のFWER制御を維持しつつ、やや高い検定力を示すことが知られている。

多重比較法の使い分け¶

手法	FWER制御	検定力	適用場面
Tukey HSD	正確	中	全ペア比較のデフォルト
Bonferroni	保守的	低	少数の事前指定された比較
Holm法	正確	中〜高	Bonferroniの代替として汎用的
Ryan法（REGWQ）	正確	中〜高	全ペア比較でやや高い検定力が必要な場合

一般的な指針として、全ペア比較にはTukey HSDを第一選択とし、少数の理論的に重要な比較に限定する場合にはHolm法（またはBonferroni補正）を用いるのがよい。

まとめ¶

二元配置分散分析は2つの独立変数の主効果と交互作用を同時に検定する。交互作用が有意な場合は単純主効果の検定で効果の所在を特定する
反復測定分散分析は同一参加者の繰り返し測定に適用され、個人差を除去することで検定力が向上する。3水準以上の場合は球面性の仮定に注意が必要であり、Greenhouse-Geisser補正またはHuynh-Feldt補正を用いる
混合計画分散分析は被験者間要因と被験者内要因を組み合わせたデザインに対応し、異なる誤差項を用いて各効果を検定する
効果量（Cohen's d, η², partial η², ω²）はp値を補完し、効果の実質的な大きさを定量化する。点推定値とともに信頼区間を報告することが望ましい
事後検定（多重比較）はFWERの膨張を統制しつつ、具体的な群間差の所在を特定する。Tukey HSD、Holm法が汎用的な選択肢である
次のSection 2では、回帰分析の枠組みを拡張し、重回帰分析・媒介分析・調整分析を扱う

用語集（Glossary）¶

用語	英語表記	定義
二元配置分散分析	two-way ANOVA	2つの独立変数の主効果と交互作用を同時に検定する分散分析
主効果	main effect	他の要因の水準を無視して、ある要因が従属変数に及ぼす効果
交互作用	interaction	ある要因の効果が他の要因の水準によって異なること
単純主効果	simple main effect	一方の要因を固定した上での他方の要因の効果
交互作用プロット	interaction plot	2要因の組み合わせによる平均値パターンを可視化するグラフ
反復測定分散分析	repeated measures ANOVA	同一参加者の繰り返し測定に適用する分散分析
球面性	sphericity	全条件ペアの差分スコアの分散が等しいという仮定
Mauchlyの球面性検定	Mauchly's test of sphericity	球面性の仮定が成立するかを検定する手法
Greenhouse-Geisser補正	Greenhouse-Geisser correction	球面性違反時にεで自由度を下方修正する保守的補正法
Huynh-Feldt補正	Huynh-Feldt correction	GG補正よりリベラルな自由度の補正法
混合計画	mixed design / split-plot design	被験者間要因と被験者内要因を組み合わせた実験デザイン
Cohen's d	Cohen's d	2群の平均値差を標準偏差で標準化した効果量指標
η²（イータ二乗）	eta-squared	SS_effect / SS_total で算出される分散分析の効果量指標
Partial η²	partial eta-squared	SS_effect / (SS_effect + SS_error) で算出される効果量指標
ω²（オメガ二乗）	omega-squared	母集団効果量の不偏推定量。η²のバイアスを補正する
ファミリーワイズエラー率	familywise error rate (FWER)	多重比較全体で少なくとも1つの偽陽性が生じる確率
Tukey HSD	Tukey's honestly significant difference	全ペア比較に特化した多重比較法。スチューデント化範囲分布に基づく
Bonferroni補正	Bonferroni correction	有意水準αを比較回数で除して補正する多重比較法
Holm法	Holm-Bonferroni method	逐次的手順でBonferroniより検定力を向上させた多重比較法
Ryan法	Ryan-Einot-Gabriel-Welsch Q (REGWQ)	比較範囲に応じて有意水準を調整する逐次的多重比較法

確認問題¶

Q1: 二元配置分散分析において交互作用が有意であった場合、主効果の解釈をそのまま行うことが不適切な理由を説明し、代わりにどのような分析を行うべきかを述べよ。

A1: 交互作用が有意であるということは、一方の要因の効果が他方の要因の水準によって異なることを意味する。この場合、主効果（他方の要因を無視した全体的な効果）を解釈しても、条件の組み合わせによる効果パターンの違いという重要な情報が失われる。例えば、ある水準では正の効果、別の水準では負の効果があり、全体として平均すると効果がゼロに見えるという場合もありうる。交互作用が有意な場合には単純主効果の検定を行い、一方の要因を特定の水準に固定したうえで他方の要因の効果を個別に検定することで、交互作用の具体的なパターンを明らかにする。

Q2: 反復測定分散分析が対応なしの一元配置分散分析よりも検定力が高い理由を、分散の分解の観点から説明せよ。

A2: 対応なしの一元配置分散分析では、誤差項（SS_within）に個人差とランダム誤差の両方が含まれる。一方、反復測定分散分析では、同一参加者が全条件に参加するため、参加者間の個人差（SS_被験者）を全変動から分離できる。これにより誤差項（SS_残差）にはランダム誤差のみが残り、誤差分散が小さくなる。F比 = MS_条件 / MS_誤差において、分母が小さくなるためF値が大きくなり、同じ条件間差であっても有意になりやすくなる。

Q3: 球面性の仮定とは何か、どのように検定するか、そして違反した場合の対処法を説明せよ。

A3: 球面性の仮定とは、反復測定のすべての条件ペア間について差分スコアの分散が等しいという仮定である。Mauchlyの球面性検定によって検定され、帰無仮説は「球面性が成立する」である。この検定が有意（p < .05）であれば球面性の仮定が棄却される。違反時には自由度の修正法を適用する。Greenhouse-Geisser（GG）補正は保守的な推定を行い、Huynh-Feldt（HF）補正はGGよりリベラルである。一般にGGのε < .75であればGG補正を、ε ≧ .75であればHF補正を用いるとされるが、一貫してGG補正を用いる方針も広く採用されている。

Q4: η²、partial η²、ω²の違いを、それぞれの算出式の特徴と使い分けの観点から説明せよ。

A4: η² = SS_effect / SS_total であり、全変動に対する効果の割合を示す。多要因デザインでは他の要因の影響で値が変動するという問題がある。partial η² = SS_effect / (SS_effect + SS_error) であり、着目する効果と誤差のみを考慮するため、他の要因の影響を受けにくく、多要因デザインでは η² より適切とされる。ω²は自由度に基づく補正により母集団効果量の不偏推定を行い、η² の正のバイアスを軽減する。実務上はpartial η²が最も広く報告されている。ω²はより正確な推定値を提供するが、報告頻度はやや低い。

Q5: Bonferroni補正とHolm法を比較し、Holm法が「上位互換」と呼ばれる理由を、具体的な手順の違いに基づいて説明せよ。

A5: Bonferroni補正は全比較のp値を一律に α/c（cは比較回数）と比較する。Holm法は逐次的手順をとり、p値を昇順に並べて最小のp値を α/c と比較し、有意であれば次のp値を α/(c-1) と比較し、以降 α/(c-k+1) と順に比較する。非有意になった時点で残りの比較も全て非有意とする。Holm法が上位互換である理由は、p値が小さい比較から順に評価する際、まだ棄却されていない仮説の数に応じて基準を緩めていくため、Bonferroniと同等のFWER制御を維持しつつ、常にBonferroni以上の検定力を持つからである。特にBonferroniでは有意にならないがHolm法では有意になる比較が存在しうる。

Q6: 混合計画分散分析において、被験者間効果と被験者内効果でそれぞれ異なる誤差項が用いられる理由を説明せよ。

A6: 被験者間要因は異なる参加者群の間の比較であるため、その変動を評価する際の誤差は参加者間の個人差を含む被験者間誤差である。一方、被験者内要因は同一参加者の条件間比較であるため、個人差が相殺された被験者内誤差（条件 × 被験者の交互作用）を用いる。同一参加者内の変動は参加者間の変動より通常小さいため、被験者内効果のF検定には異なる（より小さい）誤差項が適切である。もし共通の誤差項を用いると、被験者内効果の検定力が低下するか、被験者間効果の第一種の過誤率が膨張する恐れがある。