Module 0-2 - Section 4: 基本的な検定手法¶
セクション情報¶
| 項目 | 内容 |
|---|---|
| モジュール | Module 0-2: 心理統計法 I |
| 前提セクション | Section 1(記述統計)、Section 2(確率と確率分布)、Section 3(推測統計の基礎) |
| 想定学習時間 | 4〜5時間 |
導入¶
Section 3では、統計的仮説検定の一般的枠組み――帰無仮説と対立仮説、有意水準、p値、第一種・第二種の過誤、効果量、信頼区間――を学んだ。本セクションでは、この枠組みを具体的な検定手法として実装する。すなわち、研究デザインやデータの性質に応じてどの検定統計量を用い、どの確率分布を参照するかという実践的な手続きを扱う。
心理学研究では、扱うデータの種類(連続変数かカテゴリカル変数か)、比較する群の数(2群か3群以上か)、対応の有無(独立標本か反復測定か)などに応じて、適切な検定手法を選択する必要がある。本セクションで扱う手法は以下の5つである。
- t検定: 2群の平均値差の検定
- 一元配置分散分析(ANOVA): 3群以上の平均値差の検定
- カイ二乗検定: カテゴリカルデータの分析
- 相関分析: 2変数間の直線的関連の検定
- 単回帰分析: 1つの説明変数による予測
これらは心理学研究で最も頻繁に用いられる基本的手法であり、より高度な多変量解析の基礎となる。
検定手法の選択¶
具体的な検定手法に入る前に、研究デザインとデータの性質から適切な検定を選択する枠組みを整理する。
graph TD
A["データの種類は?"] --> B{"連続変数"}
A --> C{"カテゴリカル変数"}
B --> D["群間比較か?"]
B --> E["変数間の関連か?"]
D --> F{"2群"}
D --> G{"3群以上"}
F --> H["対応なしt検定 / 対応ありt検定"]
G --> I["一元配置分散分析"]
E --> J["相関分析 / 回帰分析"]
C --> K["カイ二乗検定"]
この選択フローは単純化されたものであり、実際の研究では前提条件の確認や分析の目的に応じた判断が必要となる。各手法の詳細を以下で順に扱う。
t検定¶
t検定の概要¶
Key Concept: t検定(t-test) 2つの平均値の差が統計的に有意であるかを検定する手法。検定統計量としてt値を算出し、t分布を参照してp値を求める。対応なしt検定と対応ありt検定の2種類がある。
t検定は、ウィリアム・ゴセット(William Sealy Gosset)が「Student」のペンネームで1908年に発表した手法に基づく。小標本において母分散が未知の場合に正規分布の代わりに用いるべき確率分布として、t分布を導入した。
Key Concept: t分布(t-distribution) 母分散が未知で標本サイズが小さい場合に、標本平均の分布を記述する確率分布。自由度をパラメータとして持ち、自由度が小さいほど裾が厚く(極端な値が生じやすく)、自由度が大きくなるにつれて標準正規分布に近づく。
t分布の形状は自由度(degrees of freedom, df)によって決定される。自由度が30程度を超えると標準正規分布との差はほぼ無視できるが、自由度が小さい場合には裾の厚さが検定結果に実質的な影響を及ぼす。
対応なしt検定(独立標本t検定)¶
対応なしt検定(independent samples t-test)は、独立な2群の母平均が等しいかを検定する。例えば、「認知行動療法群と統制群の抑うつ得点に差があるか」「男性と女性の空間認知課題の成績に差があるか」といった場面で用いられる。
検定統計量:
t = (M₁ - M₂) / SE(M₁ - M₂)
ここで、M₁, M₂は各群の標本平均、SE(M₁ - M₂)は平均値差の標準誤差である。分母の標準誤差は、2群の分散を合併(pooling)して算出する。
自由度:
df = n₁ + n₂ - 2
ここで、n₁, n₂は各群の標本サイズである。自由度は、データから独立に推定できる情報の数を反映しており、各群で平均値を推定するために1つずつ(計2つ)の自由度が失われる。
前提条件:
- 各群が独立に抽出されている(独立性)
- 各群の母集団が正規分布に従う(正規性)
- 各群の母分散が等しい(等分散性)
等分散性が満たされない場合は、ウェルチのt検定(Welch's t-test)を用いる。ウェルチのt検定では合併分散を使わず、自由度をサタスウェイト(Satterthwaite)の近似式で補正する。近年の統計実務では、等分散性の仮定に依存しないウェルチのt検定をデフォルトとして用いることが推奨される傾向にある。
対応ありt検定(対応標本t検定)¶
対応ありt検定(paired samples t-test)は、同一の対象に対する2つの測定値の母平均差が0であるかを検定する。例えば、「介入前後での不安得点に変化があるか」「同一参加者の右手と左手の反応時間に差があるか」といった反復測定デザインで用いられる。
対応ありt検定では、各ペアの差分スコア(d_i = X_1i - X_2i)を算出し、その平均が0と異なるかを検定する。すなわち、差分スコアに対する1標本t検定と等価である。
検定統計量:
t = M_d / SE(M_d)
ここで、M_dは差分スコアの平均、SE(M_d) = SD_d / √n は差分スコアの標準誤差である。
自由度:
df = n - 1
ここで、nはペアの数である。
対応ありt検定は、個人差の変動を統制できるため、同じ効果量であれば対応なしt検定より検定力が高い。これは、差分スコアを用いることで個人差に起因する変動が相殺されるためである。
対応なしと対応ありの使い分け¶
| 基準 | 対応なしt検定 | 対応ありt検定 |
|---|---|---|
| データ構造 | 独立した2群 | 同一対象の2回測定またはマッチングペア |
| 研究デザイン例 | 実験群 vs. 統制群 | 介入前 vs. 介入後 |
| 自由度 | n₁ + n₂ - 2 | n - 1 |
| 個人差の統制 | 不可 | 可能(差分スコアにより相殺) |
| 検定力 | 相対的に低い | 相対的に高い |
一元配置分散分析¶
分散分析の概要¶
Key Concept: 分散分析(ANOVA; analysis of variance) 3群以上の平均値の差を同時に検定する手法。データの全変動を群間変動と群内変動に分解し、その比(F比)が有意であるかを判定する。ロナルド・フィッシャーが農業実験の解析のために開発した。
2群の平均値比較であればt検定で対処できるが、3群以上を比較する場合にt検定を繰り返し適用すると、多重比較の問題が生じる。すなわち、比較の回数が増えるほど第一種の過誤(偽陽性)の確率が累積的に増大する。例えば3群の場合、すべてのペア(3組)にt検定を行うと、全体としての第一種の過誤率は α = .05 のもとでも 1 - (1 - .05)³ ≒ .143 にまで上昇する。
分散分析はこの問題を回避し、「3群以上の母平均のうち、少なくとも1つの組み合わせに差があるか」を単一の検定で評価する。
分散の分解とF比¶
分散分析の中核的なアイデアは、データの全変動(全平方和 SS_total)を2つの成分に分解することである。
- 群間変動(SS_between): 各群の平均値と全体平均との差に起因する変動。独立変数(群分け要因)の効果を反映する
- 群内変動(SS_within): 各群内における個々の測定値と群平均との差に起因する変動。誤差(個人差やランダムな変動)を反映する
SS_total = SS_between + SS_within
それぞれの平方和を対応する自由度で割ることで平均平方(mean square, MS)を算出する。
- MS_between = SS_between / df_between(df_between = k - 1、kは群の数)
- MS_within = SS_within / df_within(df_within = N - k、Nは全標本サイズ)
Key Concept: F比(F-ratio) 群間分散(MS_between)を群内分散(MS_within)で割った値。帰無仮説が真であれば(すべての母平均が等しければ)F比は1付近の値をとり、群間に差があるほどF比は1より大きくなる。F比はF分布に従う。
F = MS_between / MS_within
帰無仮説のもとでは、群間変動は群内変動と同程度の大きさにとどまるため、F比は1に近い値をとる。群間に実質的な差があれば、群間変動が群内変動を上回り、F比は1より大きくなる。このF比がF分布(自由度 df_between, df_within)のもとでどの程度極端かを評価し、p値を算出する。
なお、2群の場合の一元配置分散分析はt検定と数学的に等価であり、F = t² の関係が成立する。
分散分析の前提条件¶
一元配置分散分析の前提条件はt検定と類似している。
- 独立性: 各観測値が独立に得られている
- 正規性: 各群の母集団が正規分布に従う
- 等分散性: 各群の母分散が等しい(分散の均一性)
分散分析は正規性からの逸脱に対して比較的頑健(robust)であるが、等分散性の違反、特に群間でサンプルサイズが不均等な場合には結果が歪む可能性がある。等分散性の検定としてレーヴィン検定(Levene's test)がしばしば用いられる。
事後検定¶
分散分析のF検定が有意であった場合、「少なくともいずれかの群間に差がある」ことは判明するが、具体的にどの群間に差があるかは特定されない。この具体的な差の所在を特定するために事後検定(post hoc test)を実施する。
主な事後検定には以下のものがある。
| 事後検定 | 特徴 |
|---|---|
| テューキーのHSD検定(Tukey's HSD) | すべてのペア比較を行う。群数が多い場合に適しており、最も広く使用される |
| ボンフェローニ補正(Bonferroni correction) | 有意水準αを比較回数で除して補正する。保守的(検定力が低い)だが汎用性が高い |
| シェフェ検定(Scheffé's test) | 任意の線形対比に対応可能。最も保守的だが、最も柔軟性が高い |
いずれの事後検定も、多重比較に伴う第一種の過誤率の膨張を統制することを目的としている。
分散分析の適用例¶
ある研究者が、3種類の学習方略(視覚的イメージ、音読、精緻化)の記憶成績への効果を比較するとする。90名の参加者を3群(各30名)にランダムに割り当て、単語リストの再生数を測定する。
- H₀: μ_視覚 = μ_音読 = μ_精緻化
- H₁: 少なくとも1つの組み合わせで μ_i ≠ μ_j
F検定が有意(例: F(2, 87) = 8.45, p < .001, η² = .16)であれば、3群の母平均はすべて等しいとはいえない。テューキーのHSD検定で各ペアを比較し、どの方略間に有意差があるかを特定する。
カイ二乗検定¶
カイ二乗検定の概要¶
Key Concept: カイ二乗検定(chi-square test, χ² test) 名義尺度や順序尺度で測定されたカテゴリカルデータについて、観測度数と期待度数の差が偶然の範囲を超えるかを検定する手法。検定統計量χ²はカイ二乗分布に従う。
これまでのt検定やANOVAは連続変数(間隔尺度・比率尺度)の平均値を扱う手法であったが、心理学研究ではカテゴリカルデータ(名義尺度・順序尺度)を分析する場面も多い。例えば、「男女で好む学習スタイルの分布に差があるか」「治療群と統制群で回復/非回復の割合に差があるか」といった問いには、カイ二乗検定が適切である。
カイ二乗検定の検定統計量は以下の式で算出される。
χ² = Σ (O_i - E_i)² / E_i
ここで、O_iは各カテゴリの観測度数、E_iは帰無仮説のもとでの期待度数である。観測度数と期待度数の乖離が大きいほどχ²は大きくなる。
適合度検定¶
適合度検定(goodness-of-fit test)は、1つのカテゴリカル変数の分布が理論上の分布と一致するかを検定する。
例えば、ある性格類型の分類において、4類型(A, B, C, D)が均等に分布するという理論的予測を検証する場合、200名のデータについて次のように検定する。
- H₀: 4類型の出現率は均等(各25%)である
- H₁: 4類型の出現率は均等でない
期待度数は各類型50名(200 × 0.25)であり、観測度数との乖離に基づいてχ²を算出する。
自由度: df = k - 1(kはカテゴリ数)
上の例では df = 4 - 1 = 3 となる。
独立性検定¶
独立性検定(test of independence)は、2つのカテゴリカル変数間に関連があるかを検定する。データはクロス集計表(分割表)として整理される。
例えば、療法の種類(認知行動療法/薬物療法)と治療結果(改善/非改善)の関連を調べる場合、2×2のクロス集計表を作成し検定する。
- H₀: 療法の種類と治療結果は独立である(関連がない)
- H₁: 療法の種類と治療結果は独立でない(関連がある)
期待度数は「行の合計 × 列の合計 / 総数」で算出する。
自由度: df = (r - 1)(c - 1)(rは行数、cは列数)
上の例では df = (2 - 1)(2 - 1) = 1 となる。
カイ二乗検定の適用条件¶
カイ二乗検定の適用にはいくつかの条件がある。
- 各セルの期待度数が十分に大きいこと(一般に5以上が目安とされる)
- 各観測値が独立であること
- データが度数(カウント)であること(比率や割合を直接用いてはならない)
期待度数が5未満のセルがある場合、2×2表ではフィッシャーの正確確率検定(Fisher's exact test)の使用が推奨される。また、2×2表ではイェーツの連続性補正(Yates' continuity correction)が適用されることもあるが、近年ではフィッシャーの正確確率検定がより適切とされる場面が多い。
相関分析¶
ピアソンの積率相関係数¶
Key Concept: 相関係数(correlation coefficient) 2つの連続変数間の直線的関連の強さと方向を表す指標。ピアソンの積率相関係数rは-1から+1の範囲をとり、+1は完全な正の直線関係、-1は完全な負の直線関係、0は直線的関連がないことを示す。
Section 3では、相関係数rが効果量の指標として機能することに触れた。ここでは相関分析の手続きと解釈上の注意点を掘り下げる。
ピアソンの積率相関係数(Pearson's product-moment correlation coefficient)は、2変数の共変動を各変数の標準偏差の積で標準化した値である。
r = Σ(X_i - M_X)(Y_i - M_Y) / √[Σ(X_i - M_X)² × Σ(Y_i - M_Y)²]
直感的には、rは「2変数がどの程度一緒に変動するか」を-1から+1のスケールで要約した指標である。
相関係数の検定¶
相関係数が0と有意に異なるかを検定するには、以下の検定統計量を用いる。
t = r × √(n - 2) / √(1 - r²)
この統計量は自由度 df = n - 2 のt分布に従う。帰無仮説は H₀: ρ = 0(母相関係数が0)である。
相関係数の解釈に関する注意点¶
相関分析の結果を解釈する際、以下の点に注意が必要である。
1. 相関は因果を意味しない
これは統計学における最も重要な警句の一つである。例えば、アイスクリームの売上と溺水事故の件数には正の相関があるが、アイスクリームが溺水を引き起こすわけではない。両者に共通する第三変数(気温)が原因である。心理学研究においても、2変数間に有意な相関が得られたとしても、(a) XがYの原因、(b) YがXの原因、(c) 第三変数Zが両者の原因、のいずれの可能性も排除できない。因果関係の推定には実験デザインや適切な統計的統制が必要である。
2. 外れ値の影響
ピアソンの相関係数は外れ値に対して敏感である。少数の極端な値によって相関係数が大きく変動することがある。必ず散布図を確認し、外れ値の有無を視覚的に確認することが重要である。
3. 非線形な関連
ピアソンの相関係数は直線的関連のみを捉える。U字型やJ字型の関連がある場合、相関係数は実際の関連の強さを過小評価する。例えば、覚醒水準とパフォーマンスの関係(ヤーキーズ=ドッドソンの法則)は逆U字型であるため、ピアソンの相関係数では適切に表現されない。
4. 制限された範囲の問題
変数の範囲が制限されると相関係数は実際よりも低くなる傾向がある。例えば、大学生のみを対象にIQとGPAの相関を調べると、IQの範囲が一般集団より狭く制限されるため、相関が低く見積もられる。
相関係数の前提条件¶
- 2変数が連続変数(間隔尺度または比率尺度)であること
- 2変数間に直線的関連が想定されること
- 2変数が二変量正規分布に従うこと
- 外れ値がないこと
前提条件が満たされない場合、スピアマンの順位相関係数(Spearman's rank correlation coefficient, r_s)やケンドールの順位相関係数(Kendall's tau, τ)などのノンパラメトリックな指標が代替として用いられる。
単回帰分析の基礎¶
回帰分析の考え方¶
Key Concept: 回帰分析(regression analysis) 1つ以上の説明変数(独立変数)から目的変数(従属変数)を予測する統計手法。説明変数が1つの場合を単回帰分析、2つ以上の場合を重回帰分析と呼ぶ。
相関分析が2変数間の関連の強さを定量化するのに対し、回帰分析は一方の変数の値から他方の変数の値を予測する枠組みを提供する。単回帰分析(simple regression analysis)では、1つの説明変数Xから1つの目的変数Yを予測する回帰方程式を求める。
Y = a + bX + e
ここで、aは切片(intercept; Xが0のときのYの予測値)、bは回帰係数(regression coefficient; Xが1単位増加したときのYの変化量)、eは誤差項(残差)である。
最小二乗法¶
Key Concept: 最小二乗法(method of least squares, OLS) 回帰直線と実測値の差(残差)の二乗和を最小化する方法で、回帰係数の推定に用いられる。カール・フリードリヒ・ガウスとアドリアン=マリ・ルジャンドルが独立に考案した。
回帰直線は、データ点と直線の間の垂直距離(残差)の二乗和を最小にするように決定される。すなわち、Σe_i² = Σ(Y_i - (a + bX_i))²を最小化するaとbを求める。
最小二乗法によって得られる回帰係数bは以下の式で算出される。
b = Σ(X_i - M_X)(Y_i - M_Y) / Σ(X_i - M_X)²
この式は相関係数rと以下の関係にある。
b = r × (SD_Y / SD_X)
すなわち、回帰係数は相関係数をYとXの標準偏差の比で重みづけたものである。相関係数は標準化された関連の強さを表すのに対し、回帰係数は元の測定単位での変化量を表す。
決定係数¶
Key Concept: 決定係数(coefficient of determination, R²) 説明変数によって目的変数の分散がどの程度説明されるかを表す指標。0から1の値をとり、1に近いほど回帰モデルの当てはまりが良いことを示す。単回帰分析では、ピアソンの相関係数の二乗に等しい(R² = r²)。
決定係数は以下のように定義される。
R² = SS_regression / SS_total = 1 - SS_residual / SS_total
ここで、SS_regressionは回帰による平方和(回帰モデルが説明する変動)、SS_residualは残差平方和(モデルでは説明できない変動)、SS_totalは全平方和である。
例えば、学習時間(X)から試験得点(Y)を予測する単回帰分析でR² = .36が得られた場合、試験得点の分散の36%が学習時間によって説明されることを意味する。残りの64%は学習時間以外の要因(知能、動機づけ、体調など)に起因する。
回帰分析と相関分析の関係¶
単回帰分析と相関分析は密接に関連している。
| 側面 | 相関分析 | 単回帰分析 |
|---|---|---|
| 目的 | 2変数の関連の強さと方向を記述 | 一方の変数から他方を予測 |
| 対称性 | 対称(XとYを入れ替えても相関係数は同じ) | 非対称(XからYを予測する方向が固定) |
| 出力 | 相関係数r | 回帰方程式 Y = a + bX、決定係数R² |
| 関係 | r | R² = r²(単回帰の場合) |
回帰分析では、XとYの間に明確な方向性(XがYに影響する)が想定されている点が重要である。ただし、これは統計的な予測関係を意味するのであって、必ずしも因果関係を含意しない。
回帰分析の前提条件¶
- 線形性: XとYの間に直線的関係がある
- 独立性: 残差が互いに独立である
- 等分散性: 残差の分散がXの値にかかわらず一定である(ホモスケダスティシティ)
- 正規性: 残差が正規分布に従う
これらの前提条件の確認には残差プロット(残差 vs. 予測値のプロット)が有用である。
まとめ¶
- t検定は2群の平均値差を検定する手法であり、対応なし(独立標本)と対応あり(対応標本)の2種類がある。いずれもt分布を参照する
- 3群以上の平均値比較にはt検定の繰り返しではなく分散分析を用いる。分散分析はデータの全変動を群間変動と群内変動に分解し、F比の有意性を検定する
- 分散分析が有意であった場合、具体的にどの群間に差があるかを特定するために事後検定を実施する
- カイ二乗検定はカテゴリカルデータに対する検定であり、適合度検定(1変数の分布の理論値との適合)と独立性検定(2変数間の関連)がある
- 相関係数rは2変数の直線的関連の強さを表すが、因果関係を示すものではない。外れ値や非線形な関連に注意が必要である
- 単回帰分析は1つの説明変数から目的変数を予測するモデルであり、最小二乗法で回帰係数を推定する。決定係数R²はモデルの説明力を表す
- Section 5では、これらの検定手法を運用する際の注意点(多重比較、前提条件の確認、検定力分析の実践など)を扱う
用語集(Glossary)¶
| 用語 | 英語表記 | 定義 |
|---|---|---|
| t検定 | t-test | 2つの平均値の差が統計的に有意であるかを検定する手法 |
| t分布 | t-distribution | 母分散が未知で小標本の場合に用いる確率分布。自由度が大きくなると標準正規分布に収束 |
| 対応なしt検定 | independent samples t-test | 独立な2群の母平均差を検定する手法 |
| 対応ありt検定 | paired samples t-test | 同一対象の2回測定の母平均差を検定する手法 |
| ウェルチのt検定 | Welch's t-test | 等分散の仮定を置かないt検定。自由度をサタスウェイトの近似式で補正 |
| 分散分析 | analysis of variance (ANOVA) | 3群以上の平均値差をF比によって同時に検定する手法 |
| F比 | F-ratio | 群間分散を群内分散で割った値。群間差の指標 |
| 平均平方 | mean square (MS) | 平方和を自由度で割った値 |
| 事後検定 | post hoc test | ANOVAが有意な場合にどの群間に差があるかを特定する手続き |
| カイ二乗検定 | chi-square test (χ² test) | カテゴリカルデータの観測度数と期待度数の乖離を検定する手法 |
| 適合度検定 | goodness-of-fit test | 1変数の度数分布が理論的分布と一致するかを検定する手法 |
| 独立性検定 | test of independence | 2つのカテゴリカル変数が独立かどうかをクロス集計表で検定する手法 |
| 相関係数 | correlation coefficient | 2変数の直線的関連の強さと方向を-1から+1で表す指標 |
| 回帰分析 | regression analysis | 説明変数から目的変数を予測する統計手法 |
| 回帰係数 | regression coefficient | Xが1単位増加したときのYの予測変化量 |
| 最小二乗法 | method of least squares (OLS) | 残差の二乗和を最小化する回帰係数の推定法 |
| 決定係数 | coefficient of determination (R²) | 説明変数がどの程度目的変数の分散を説明するかを示す指標。0〜1 |
| 残差 | residual | 実測値と予測値の差 |
確認問題¶
Q1: 対応なしt検定と対応ありt検定はそれぞれどのような研究デザインに適用されるか。両者の自由度の違いにも言及して説明せよ。
A1: 対応なしt検定は、独立な2群(例: 実験群と統制群のように異なる参加者で構成される群)の平均値差を検定する場合に適用される。自由度は df = n₁ + n₂ - 2 である。対応ありt検定は、同一の参加者に対する2回の測定(例: 介入前後の測定)やマッチングペアの平均値差を検定する場合に適用される。各ペアの差分スコアを用いるため、自由度は df = n - 1(nはペア数)となる。対応ありt検定は個人差を統制できるため、同じ効果量であれば検定力が高い。
Q2: 3群以上の平均値比較において、t検定を繰り返し適用するのではなく分散分析を用いるべき理由を、第一種の過誤の観点から説明せよ。
A2: t検定を複数回繰り返すと、各検定での第一種の過誤率αが累積し、全体としての第一種の過誤率(ファミリーワイズエラー率)がαを大きく超える。例えば3群の場合、3組のペア比較を行うと全体の過誤率は 1 - (1 - .05)³ ≒ .143 に達する。分散分析は、単一のF検定で「少なくとも1組の群間に差があるか」を評価するため、全体の第一種の過誤率をα = .05に維持できる。
Q3: カイ二乗検定の適合度検定と独立性検定の違いを、それぞれの目的・帰無仮説・自由度の算出法を含めて説明せよ。
A3: 適合度検定は、1つのカテゴリカル変数の観測度数分布が理論的に期待される分布と一致するかを検定する。帰無仮説は「観測分布は理論分布と一致する」であり、自由度は df = k - 1(kはカテゴリ数)である。独立性検定は、2つのカテゴリカル変数の間に関連があるかをクロス集計表で検定する。帰無仮説は「2変数は独立である(関連がない)」であり、自由度は df = (r - 1)(c - 1)(rは行数、cは列数)である。
Q4: 「ピアソンの積率相関係数rが有意であった」という結果から因果関係を結論づけることが妥当でない理由を、具体例を挙げて説明せよ。
A4: 相関は2変数の共変動を示すに過ぎず、因果関係を含意しない。有意な相関が得られた場合でも、(a) XがYの原因、(b) YがXの原因、(c) 第三変数Zが両者の共通原因、のいずれの可能性も排除できない。例えば、自尊感情と学業成績の間に正の相関があったとしても、高い自尊感情が成績を向上させるのか、高い成績が自尊感情を高めるのか、あるいは社会経済的地位のような第三変数が両者に影響しているのかは、相関だけでは判別できない。因果関係の推定には、実験操作による統制やランダム割り当てが必要である。
Q5: 単回帰分析において決定係数R² = .25が得られた場合、この値は何を意味するか。また、R²と相関係数rの関係を述べよ。
A5: R² = .25は、目的変数の全分散のうち25%が説明変数によって説明されることを意味する。残りの75%は、そのモデルに含まれない他の要因によるものである。単回帰分析では R² = r² の関係が成り立つため、R² = .25 ならば r = ±.50 である。相関係数rが関連の強さと方向を表すのに対し、決定係数R²は説明力の割合として解釈される。