Module 0-2 - Section 1: 記述統計¶

セクション情報¶

項目	内容
モジュール	Module 0-2: 心理統計法 I
前提セクション	なし
想定学習時間	3〜4時間

導入¶

心理学研究では、実験・調査を通じて収集したデータから意味のある知見を引き出すことが求められる。そのための第一歩が記述統計（descriptive statistics）である。記述統計とは、収集したデータの特徴を要約・記述するための統計的手法の総称であり、データの全体像を把握し、他者に伝達するための基盤となる。

本セクションでは、まず測定の尺度水準を理解し、データの性質に応じた適切な統計量の選択基準を学ぶ。次に、データの分布を視覚化する度数分布とヒストグラムを扱い、データを一つの値で代表する代表値、データの散らばりを定量化する散布度、そしてデータの相対的位置を示す標準化得点と正規分布の基本的性質を学習する。これらは、Module 0-2の以降のセクションで扱う確率分布や推測統計の前提知識となる。

測定の尺度水準¶

Stevens の尺度水準分類¶

心理学における測定（measurement）とは、一定の規則に従って対象に数値を割り当てる操作である。Stanley Smith Stevens（スタンレー・スミス・スティーブンス）は1946年の論文 "On the theory of scales of measurement" において、測定の結果得られるデータを4つの尺度水準（levels of measurement）に分類した。この分類は、データに対してどのような数学的操作（統計手法）が許容されるかを決定するため、心理統計法の出発点として極めて重要である。

Key Concept: 尺度水準（levels of measurement） 測定によって得られるデータの数学的性質に基づく分類。名義尺度・順序尺度・間隔尺度・比率尺度の4水準があり、適用可能な統計手法を規定する。Stevens (1946) が提唱した。

4つの尺度水準¶

1. 名義尺度（nominal scale）

Key Concept: 名義尺度（nominal scale） カテゴリの区別のみを表す尺度。数値は分類のためのラベルに過ぎず、大小関係や演算に意味はない。

名義尺度は、対象をカテゴリに分類するためだけに数値を用いる尺度である。例えば、性別（1=男性, 2=女性, 3=その他）、血液型（1=A, 2=B, 3=O, 4=AB）、実験条件（1=統制群, 2=実験群）などが該当する。数値は単なるラベルであり、「2は1より大きい」という解釈は無意味である。適用可能な統計量は度数（頻度）、最頻値、比率に限られる。

2. 順序尺度（ordinal scale）

Key Concept: 順序尺度（ordinal scale） カテゴリ間の順序（大小関係）を表す尺度。順位は定まるが、隣接する値の間隔が等しいとは限らない。

順序尺度は、対象間の大小・優劣の順序関係を表現できる尺度である。例えば、学業成績の順位（1位, 2位, 3位...）、満足度の段階評定（非常に不満, やや不満, どちらでもない, やや満足, 非常に満足）などが該当する。1位と2位の差が2位と3位の差と等しい保証はない。適用可能な統計量は、名義尺度の統計量に加えて、中央値、パーセンタイル、順位相関などである。

3. 間隔尺度（interval scale）

Key Concept: 間隔尺度（interval scale） 等間隔性を持つ尺度。値の差に意味があるが、絶対零点を持たないため比の計算はできない。

間隔尺度は、値の間隔（差）が等しい意味を持つ尺度である。例えば、摂氏温度（10°Cと20°Cの差は20°Cと30°Cの差と等しい）、知能指数（IQ）、多くの心理検査の標準化得点が該当する。ただし、絶対零点（「何もない」状態を表す0）が存在しないため、「20°Cは10°Cの2倍暑い」という比の解釈は意味をなさない。適用可能な統計量は、順序尺度の統計量に加えて、平均値、標準偏差、ピアソンの積率相関係数などである。

4. 比率尺度（ratio scale）

Key Concept: 比率尺度（ratio scale） 等間隔性に加えて絶対零点を持つ尺度。値の比（倍率）の計算が意味を持つ。

比率尺度は、間隔尺度の性質に加えて絶対零点を持つ尺度である。例えば、反応時間（ミリ秒）、身長（cm）、正答数、出現頻度などが該当する。0が「その属性が存在しない」ことを意味するため、「反応時間が400msは200msの2倍」という比の解釈が可能である。すべての統計量が適用可能である。

尺度水準の階層関係¶

4つの尺度水準は、名義 < 順序 < 間隔 < 比率という階層関係を持つ。上位の尺度は下位の尺度の性質をすべて含み、下位の尺度で使用可能な統計量はすべて上位の尺度でも使用できる。

graph LR
    N["名義尺度<br>分類のみ"] --> O["順序尺度<br>+ 順序"]
    O --> I["間隔尺度<br>+ 等間隔性"]
    I --> R["比率尺度<br>+ 絶対零点"]

尺度水準	許容される操作	代表値	散布度	心理学での例
名義尺度	=, ≠	最頻値	—	診断カテゴリ、性別
順序尺度	=, ≠, <, >	中央値	四分位範囲	リッカート尺度、順位
間隔尺度	=, ≠, <, >, +, −	平均値	標準偏差	IQ、検査得点
比率尺度	=, ≠, <, >, +, −, ×, ÷	平均値	標準偏差、変動係数	反応時間、正答数

心理学における尺度水準の論争¶

心理学で頻繁に使用されるリッカート尺度（例：「1=全くあてはまらない」〜「5=非常にあてはまらない」）は、厳密には順序尺度である。しかし実際の研究では、項目を複数合算した合計得点を間隔尺度として扱い、平均値や標準偏差を算出することが一般的に行われている。この扱いの妥当性については議論があるが、多くの教科書では「複数項目の合算により近似的に間隔尺度の性質が得られる」と説明されている。データ分析にあたっては、この前提の妥当性を常に意識する必要がある。

度数分布とヒストグラム¶

度数分布表¶

収集したデータの全体像を把握するための基本的な方法が、度数分布表（frequency distribution table）の作成である。

Key Concept: 度数分布（frequency distribution） データをいくつかの階級（区間）に分け、各階級に含まれるデータの個数（度数）を整理したもの。データの分布の形状を把握する基本的手法である。

度数分布表の構成要素は以下の通りである。

階級（class）: データを区切る区間。例えば「60点以上70点未満」のように設定する
階級値（class mark）: 各階級の中央の値。上の例では65点
度数（frequency）: 各階級に含まれるデータの個数
相対度数（relative frequency）: 各階級の度数を全体のデータ数で割った割合
累積度数（cumulative frequency）: ある階級までの度数の合計
累積相対度数（cumulative relative frequency）: ある階級までの相対度数の合計

具体例: 30名の学生の心理学テスト得点（100点満点）

階級（点）	階級値	度数	相対度数	累積度数	累積相対度数
40〜50	45	2	0.07	2	0.07
50〜60	55	4	0.13	6	0.20
60〜70	65	8	0.27	14	0.47
70〜80	75	10	0.33	24	0.80
80〜90	85	4	0.13	28	0.93
90〜100	95	2	0.07	30	1.00

ヒストグラム¶

ヒストグラム（histogram）は、度数分布表をグラフ化したものである。横軸に階級、縦軸に度数をとり、隣接する柱が隙間なく並ぶ形式で描画する。

ヒストグラムと棒グラフは外見上類似するが、本質的に異なる。棒グラフは名義尺度データ（質的データ）の可視化に用い、各棒は独立したカテゴリを表すため棒の間に隙間を置く。一方、ヒストグラムは量的データの連続性を反映し、棒を隙間なく配置する。

分布の形状¶

ヒストグラムから読み取れる分布の形状は、適切な代表値の選択に直結する。主な形状には以下がある。

対称分布（symmetric distribution）: 中央を軸に左右対称。正規分布がその代表例
正の歪み（positive skew / right skew）: 右裾が長い分布。例えば反応時間データに多い
負の歪み（negative skew / left skew）: 左裾が長い分布。例えば天井効果のあるテスト得点
双峰性分布（bimodal distribution）: ピークが2つある分布。異なる母集団が混在している可能性を示唆する

代表値¶

代表値（measures of central tendency）とは、データの分布を一つの値で要約する統計量である。主要な代表値として平均値、中央値、最頻値の3つがある。

平均値¶

Key Concept: 平均値（mean） 全データの値の総和をデータ数で除した値。算術平均とも呼ぶ。すべてのデータ値を反映するが、外れ値の影響を受けやすい。間隔尺度以上のデータに適用する。

算術平均の計算式:

x̄ = (1/n) Σ xᵢ （i = 1 から n）

ここで、x̄ は標本平均、n はデータ数、xᵢ は各データの値である。

計算例: 7名の参加者の反応時間（ms）: 250, 280, 310, 295, 340, 270, 305

x̄ = (250 + 280 + 310 + 295 + 340 + 270 + 305) / 7 = 2050 / 7 ≈ 292.9 ms

平均値の特性として、すべてのデータ値からの偏差の和がゼロになること（Σ(xᵢ − x̄) = 0）が挙げられる。これは平均値がデータの「重心」に位置することを意味する。

中央値¶

Key Concept: 中央値（median） データを大きさの順に並べたとき、ちょうど中央に位置する値。データ数が偶数の場合は中央の2値の平均をとる。外れ値に対して頑健（ロバスト）な代表値である。

計算手順: 1. データを昇順に並べる 2. データ数 n が奇数の場合: (n+1)/2 番目の値 3. データ数 n が偶数の場合: n/2 番目と (n/2)+1 番目の値の平均

計算例: 上記の反応時間データを昇順に並べると: 250, 270, 280, 295, 305, 310, 340

n = 7（奇数）なので、(7+1)/2 = 4番目の値 → 中央値 = 295 ms

最頻値¶

最頻値（mode）は、データの中で最も頻繁に出現する値、または度数分布において最も度数の大きい階級の階級値である。名義尺度を含むすべての尺度水準で使用可能な唯一の代表値である。連続変数では個々の値が一致しにくいため、度数分布表を作成した上で最も度数の大きい階級の階級値として求めることが一般的である。

代表値の使い分け¶

3つの代表値は、データの分布の形状と尺度水準に応じて使い分ける必要がある。

条件	推奨される代表値	理由
対称分布（正規分布に近い）	平均値	3つの代表値がほぼ一致し、平均値が最も情報量が多い
歪んだ分布	中央値	外れ値の影響を受けにくい
名義尺度データ	最頻値	名義尺度に適用可能な唯一の代表値
順序尺度データ	中央値	順序情報を活用でき、間隔の等しさを仮定しない
双峰性分布	最頻値（複数報告）	単一の代表値では分布の特徴を反映できない
外れ値が存在する	中央値	頑健性が高い

対称分布における代表値の関係: 完全な対称分布では、平均値 = 中央値 = 最頻値となる。正の歪みがある分布では最頻値 < 中央値 < 平均値、負の歪みがある分布では平均値 < 中央値 < 最頻値の傾向がある。

具体例（外れ値の影響）: 反応時間データにおいて、注意散漫な試行で極端に長い反応時間（例: 2500 ms）が1つ含まれた場合を考える。

データ: 250, 270, 280, 295, 305, 310, 2500
平均値: (250+270+280+295+305+310+2500)/7 ≈ 601.4 ms
中央値: 295 ms

平均値は外れ値に大きく引っ張られ、データの大部分の傾向を反映しなくなる。このような場合、中央値がデータの中心傾向をより適切に代表する。

散布度¶

代表値だけではデータの特徴を十分に記述できない。例えば、平均値が同じ70点でも「全員が65〜75点に集中しているクラス」と「40点から100点まで広く散らばっているクラス」では、データの性質は大きく異なる。散布度（measures of dispersion / variability）は、データの散らばりの程度を定量化する統計量である。

範囲¶

範囲（range）は最も単純な散布度であり、データの最大値と最小値の差として定義される。

範囲 = 最大値 − 最小値

計算が容易だが、2つの極端な値のみに依存するため、外れ値に非常に敏感であり、データ全体の散らばりを適切に反映しない場合がある。

四分位範囲¶

四分位範囲（interquartile range; IQR）は、データを昇順に並べたとき、下位25%点（第1四分位数; Q1）と上位25%点（第3四分位数; Q3）の差として定義される。

IQR = Q3 − Q1

中央50%のデータの散らばりを表すため、外れ値に対して頑健である。箱ひげ図（box plot）の箱の高さに対応する。

偏差と分散¶

Key Concept: 分散（variance） 各データ値と平均値との差（偏差）の二乗の平均。データの散らばりの程度を表す基本的な統計量である。

分散を理解するには、まず偏差（deviation）の概念を押さえる必要がある。

偏差: 各データ値と平均値との差

dᵢ = xᵢ − x̄

偏差の総和は定義上ゼロになる（Σdᵢ = 0）。そこで、散らばりの指標を得るために偏差を二乗してから平均する。

母分散（母集団全体を対象とする場合）:

σ² = (1/N) Σ (xᵢ − μ)² （i = 1 から N）

標本分散（標本から母集団の分散を推定する場合）:

s² = 1/(n−1) Σ (xᵢ − x̄)² （i = 1 から n）

標本分散で n ではなく n−1 で除する理由は、標本平均を用いる際に自由度が1つ失われることを補正するためである（不偏推定量）。この n−1 を自由度（degrees of freedom）と呼ぶ。

計算例: 5名の不安尺度得点: 12, 15, 18, 14, 16

平均値: x̄ = (12+15+18+14+16)/5 = 75/5 = 15
各偏差: (12−15), (15−15), (18−15), (14−15), (16−15) = −3, 0, 3, −1, 1
偏差の二乗: 9, 0, 9, 1, 1
偏差二乗和: 9+0+9+1+1 = 20
標本分散: s² = 20/(5−1) = 20/4 = 5.0

標準偏差¶

Key Concept: 標準偏差（standard deviation） 分散の正の平方根。元のデータと同じ単位で散らばりを表現できるため、分散よりも解釈が直感的である。

s = √s²

上記の例では: s = √5.0 ≈ 2.24

分散は偏差を二乗して算出するため、単位も二乗されてしまう（例: 得点の分散の単位は「点²」）。標準偏差は平方根をとることで元のデータと同じ単位（例:「点」）に戻すため、実践的な解釈が容易になる。「データは平均値から平均的にどの程度離れているか」を示す指標として理解できる。

標準化得点と正規分布¶

z得点（標準化得点）¶

Key Concept: z得点（z-score） 個々のデータ値が平均値から標準偏差何個分離れているかを示す値。平均0、標準偏差1に変換することで、異なる尺度間での比較を可能にする。

異なる尺度・単位で測定されたデータを比較するためには、データを共通の基準に変換する必要がある。z得点（標準化得点）はこの目的で用いられる。

z得点の計算式:

z = (x − x̄) / s

ここで、x は個々のデータ値、x̄ は平均値、s は標準偏差である。

z得点の性質: - z得点の平均は常に0、標準偏差は常に1 - z > 0: 平均より上 - z < 0: 平均より下 - z = 1: 平均から標準偏差1つ分上 - 単位を持たない無次元量

具体例: ある学生の心理学テスト得点が78点、クラスの平均が70点、標準偏差が8点の場合

z = (78 − 70) / 8 = 1.0

この学生は平均より標準偏差1つ分上に位置する。同じ学生の統計学テスト得点が85点、平均80点、標準偏差10点であれば

z = (85 − 80) / 10 = 0.5

心理学テスト（z = 1.0）のほうが、統計学テスト（z = 0.5）よりもクラス内での相対的位置は高いことがわかる。このように、z得点は異なる尺度間での相対的比較を可能にする。

なお、日本で広く用いられる偏差値（T得点の一種）は、z得点を平均50、標準偏差10の尺度に線形変換したものである。

偏差値 = 50 + 10z

正規分布¶

Key Concept: 正規分布（normal distribution） 平均値を中心として左右対称な釣鐘型（ベルカーブ）の確率分布。多くの心理学的変数が近似的に正規分布に従うと仮定される。推測統計の多くの手法の基盤となる。

正規分布（ガウス分布とも呼ばれる）は、統計学で最も重要な確率分布である。その確率密度関数は以下のように定義される。

f(x) = (1 / (σ√(2π))) × exp(−(x − μ)² / (2σ²))

ここで、μ は平均、σ は標準偏差、π は円周率、e は自然対数の底である。

正規分布の主な性質: - 平均値 = 中央値 = 最頻値（完全に対称） - 平均値 μ と標準偏差 σ の2つのパラメータで完全に規定される - x 軸に漸近する（理論上、値の範囲は −∞ から +∞） - 分布の面積（確率の合計）は1

68-95-99.7 ルール¶

正規分布では、平均値を中心とした一定範囲に含まれるデータの割合が定まっている。これを経験則（empirical rule）あるいは 68-95-99.7 ルールと呼ぶ。

μ ± 1σ の範囲: 全データの約 68.27% が含まれる
μ ± 2σ の範囲: 全データの約 95.45% が含まれる
μ ± 3σ の範囲: 全データの約 99.73% が含まれる

graph LR
    A["μ - 3σ"] --- B["μ - 2σ"] --- C["μ - 1σ"] --- D["μ"] --- E["μ + 1σ"] --- F["μ + 2σ"] --- G["μ + 3σ"]

範囲	含まれる割合	心理学での意味
μ ± 1σ	約68%	「標準的な範囲」の中核
μ ± 2σ	約95%	この範囲外の値は比較的稀
μ ± 3σ	約99.7%	この範囲外の値は極めて稀（外れ値の候補）

標準正規分布¶

平均 μ = 0、標準偏差 σ = 1 の正規分布を標準正規分布（standard normal distribution）と呼ぶ。任意の正規分布 N(μ, σ²) に従うデータを z 変換すると、標準正規分布 N(0, 1) に従うデータに変換される。これにより、標準正規分布表を用いて任意の正規分布における確率を算出できる。

具体例: 知能指数（IQ）は平均100、標準偏差15の正規分布に従うように設計されている。

IQ 115 の z 得点: z = (115 − 100) / 15 = 1.0 → 上位約15.87%
IQ 130 の z 得点: z = (130 − 100) / 15 = 2.0 → 上位約2.28%
IQ 85 の z 得点: z = (85 − 100) / 15 = −1.0 → 下位約15.87%

68-95-99.7 ルールを適用すると、IQ 85〜115（μ ± 1σ）に約68%、IQ 70〜130（μ ± 2σ）に約95%の人が含まれることがわかる。

まとめ¶

測定の尺度水準（名義・順序・間隔・比率）は、データに適用可能な統計手法を規定する。Stevens (1946) の分類が標準的に用いられる
度数分布表とヒストグラムは、データの分布の形状を把握するための基本的な手法である。分布の形状（対称、歪み、双峰性など）は代表値の選択に影響する
代表値として平均値・中央値・最頻値があり、データの尺度水準と分布の形状に応じて使い分ける。外れ値が存在する場合は中央値が頑健な選択肢となる
散布度として分散・標準偏差・範囲・四分位範囲があり、データの散らばりの程度を定量化する。標準偏差は元データと同じ単位で解釈できるため実用性が高い
z得点によってデータを標準化することで、異なる尺度間の比較が可能になる
正規分布は心理統計の基盤となる確率分布であり、68-95-99.7 ルールはデータの分布における確率的解釈の基礎である
次のセクション（Section 2: 確率と確率分布）では、正規分布を含む確率分布の理論的基礎を扱い、推測統計への橋渡しを行う

用語集（Glossary）¶

用語	英語表記	定義
尺度水準	levels of measurement	測定データの数学的性質に基づく分類。名義・順序・間隔・比率の4水準がある
名義尺度	nominal scale	カテゴリの区別のみを表す尺度。数値は分類ラベルに過ぎない
順序尺度	ordinal scale	カテゴリ間の順序関係を表す尺度。値の間隔の等しさは保証されない
間隔尺度	interval scale	等間隔性を持つ尺度。差の計算は可能だが、絶対零点を持たない
比率尺度	ratio scale	等間隔性と絶対零点を持つ尺度。比の計算が意味を持つ
度数分布	frequency distribution	データを階級に分け、各階級の度数を整理した分布
平均値	mean	全データの総和をデータ数で除した値
中央値	median	データを大きさ順に並べたとき中央に位置する値
最頻値	mode	最も頻繁に出現する値
分散	variance	偏差の二乗の平均。データの散らばりの基本的指標
標準偏差	standard deviation	分散の正の平方根。元データと同じ単位で散らばりを表す
z得点	z-score	データ値が平均から標準偏差何個分離れているかを示す標準化得点
正規分布	normal distribution	平均を中心に左右対称な釣鐘型の確率分布
標準正規分布	standard normal distribution	平均0、標準偏差1の正規分布
自由度	degrees of freedom	独立に変動しうるデータの数。標本分散では n−1

確認問題¶

Q1: Stevens の4つの尺度水準をそれぞれ定義し、心理学研究における具体例を1つずつ挙げよ。

A1: (1) 名義尺度: カテゴリの区別のみを表す尺度。数値は分類ラベルに過ぎず、大小関係に意味はない。例: 臨床診断カテゴリ（うつ病、不安障害、統合失調症など）。(2) 順序尺度: カテゴリ間の順序（大小関係）を表す尺度。値の間隔の等しさは保証されない。例: 疾患の重症度評価（軽度、中等度、重度）。(3) 間隔尺度: 等間隔性を持ち差の計算が可能な尺度。ただし絶対零点を持たない。例: 知能指数（IQ）。(4) 比率尺度: 等間隔性に加えて絶対零点を持ち、比の計算が意味を持つ尺度。例: 実験における反応時間（ミリ秒）。

Q2: ある研究で10名の参加者の不安得点が以下のように得られた: 8, 12, 15, 11, 45, 13, 10, 14, 9, 13。この場合、代表値として平均値と中央値のどちらが適切か。理由とともに説明せよ。

A2: 中央値が適切である。データを昇順に並べると 8, 9, 10, 11, 12, 13, 13, 14, 15, 45 となる。45は他のデータ値から大きく離れた外れ値である。平均値は (8+9+10+11+12+13+13+14+15+45)/10 = 15.0 となるが、これは大多数のデータ（8〜15の範囲）の中心傾向を適切に反映していない。中央値は (12+13)/2 = 12.5 であり、外れ値の影響を受けずにデータの中心的傾向をより正確に代表する。このように、外れ値が存在する歪んだ分布では、中央値のほうが頑健な代表値となる。

Q3: 標本分散の計算で n−1 で除する（n ではなく）理由を説明せよ。

A3: 標本分散を計算する際に n ではなく n−1 で除する理由は、母分散の不偏推定量を得るためである。標本平均 x̄ を用いて偏差を計算する場合、Σ(xᵢ − x̄) = 0 という制約があるため、n 個の偏差のうち独立に変動できるのは n−1 個である（自由度が n−1）。n で除した場合、母分散を系統的に過小推定する（偏りのある推定量となる）。n−1 で除すことでこの偏りを補正し、期待値が母分散に一致する不偏推定量が得られる。この n−1 をベッセルの補正（Bessel's correction）と呼ぶ。

Q4: ある心理学テストの得点分布が平均60点、標準偏差10点の正規分布に従うとき、得点が80点以上の受験者はおよそ何%と推定されるか。68-95-99.7 ルールを用いて答えよ。

A4: 80点のz得点は z = (80 − 60) / 10 = 2.0 である。68-95-99.7 ルールより、平均 ± 2σ の範囲（40〜80点）に約95.45%のデータが含まれる。正規分布は対称であるため、この範囲外の約4.55%は上下に等分され、80点以上の受験者は約2.28%と推定される（概算として約2.3%）。

Q5: z得点を用いることで、異なる尺度で測定されたデータの比較が可能になる理由を、具体例を用いて説明せよ。

A5: z得点は「平均値から標準偏差何個分離れているか」を示す無次元の標準化された値であり、元のデータの単位やスケールに依存しない。例えば、ある学生の記憶テストの得点が85点（平均75点、標準偏差5点）、注意力テストの反応時間が320ms（平均400ms、標準偏差40ms）であったとする。記憶テストのz得点は (85−75)/5 = 2.0、注意力テストのz得点は (320−400)/40 = −2.0（反応時間は低いほど良いため、z = −2.0は平均より2標準偏差分速い、すなわち優れていることを意味する）。両テストとも平均から標準偏差2個分離れた成績であり、クラス内での相対的な位置（上位約2.3%）は同等であると解釈できる。このように、z得点への変換により「点」と「ミリ秒」という異なる単位のデータを共通の基準で比較できる。