標準偏差/標準誤差と平均値/中央値(番外編)

記事
学び

はじめに

前回の記事で,標準偏差の細かい内容と平均値ー標準偏差中央値ー四分位範囲の使い分けについて,次の記事で解説すると述べていました。

今回はその内容を詳しく説明していきます。

1.標準偏差とはなにか。

標準偏差は,「データのばらつき」を表す指標です。

簡単に言えば,偏差(実測値ー平均値)の平均値のことです(語弊あり)。しかし,よくよく考えてみると,データのばらつきを要約したいのだから,「データのばらつき(偏差)を平均すればよい」はずです。

それでは実践してみます。

1 2 3 4 5 6 7
以上のデータの平均値は,4です。
偏差はそれぞれ実測値から平均値を引いた差なので,以下のようになります。
-3 -2 -1 0 1 2 3
偏差の平均値を計算すると,0÷7=・・となります。

これは平均値が分布の中心にあることが原因です。
そのため,一旦すべてのデータを2乗して計算します。
9 4 1 0 1 4 9
偏差を2乗した値の平均値を計算すると,4です。
しかし,この値は2乗(平方)したものなので,戻します。
すると,±2が標準偏差となります。

標準偏差は「平均値±標準偏差」として記述されます。
この場合は「4±2」です。

これが何を示すかと言うと,全データの約68%がこの間に含まれることを意味します。また,平均値±2標準偏差の間には全データの約95%が含まれ,平均値±3標準偏差の間に全データの約99.7%が含まれます。

このような便利な指標ということで,データの要約値として「平均値ー標準偏差」が多用されるのです。

2.標準偏差と四分位範囲の使い分け

一方で,前回の記事で整理したように,四分位範囲というものも存在します。四分位範囲は,第3四分位数(75%)ー第1四分位数(25%)から算出されるので,全データの50%を説明することができます。

なお,実は,四分位偏差というものもあり,偏差=平均ですので,四分位範囲÷2から算出します。これは,より焦点をデータの中心部に絞り,第1四分位数と第3四分位数が中央値からどれだけばらついているかを判定します。

四分位範囲はデータ全体四分位偏差は四分位範囲の散らばり具合を検討できる指標というわけです。

主に論文等で使用するのは四分位範囲だと思いますが,これは「IQR:四分位範囲(第1四分位数‐第3四分位数)」として記述するのが一般的です。

話は戻り,標準偏差と四分位範囲の使い分けは,「平均値」と「中央値」のどちらをデータの要約値として採用するかによります。

結論から言えば,平均値は標準偏差中央値は四分位範囲です。
なぜなら,標準偏差は平均値を使用し,四分位範囲は中央値を使用して算出されるからです。

3.平均値と中央値の使い分け

では,平均値と中央値はどのように使い分ければよいのでしょうか。
これは分析の目的データの性質によります。

平均値の主な問題点は,外れ値の影響を受けるところです。著者は,外れ値を安易にデータから排除していいと思わない人間ですが,多くの研究では,外れ値を検討しないので平均値の問題は比較的生じなくなっています。

中央値の主な問題は,データの中央以外の変化が問題にならないところです。中央値は順位の真ん中を指すため,その前とその後のデータが大きく変わっても真ん中さえ変わらなければ変化がないことになってしまいます。

このような問題を踏まえて,データ全体の平均が知りたい場合は「平均値」,データ全体の真ん中が知りたい場合は「中央値」を使用するようにしましょう。

4.標準偏差と標準誤差の違い

またややこしいことに,標準偏差に似た名前の標準誤差(Standard Error: SE)というものがあります。

標準偏差はSDなので,どっちがどっちかわからなくなりやすいです。

標準誤差について,理解するうえでは,前回の記事の「正規分布」と「中央極限定理」について理解する必要があります。

いくつかの標本を抽出し,その平均値をまとめた分布が中央極限定理によって正規分布に近似することは前回の記事で整理しました。

こうした標本平均値の標準偏差を標準誤差と呼びます。
少しこんがらがってきますよね・・

一言で言えば,標準誤差は,標本平均値で母集団の平均値を推測する際の誤差を表す指標なのです。

つまり,あくまでも標準偏差は標本集団の,標準誤差は母集団のデータに対して使用されるという違いを抑えておきましょう。

ただし,基本的に標準誤差は平均値の信頼区間で代替されることがほとんどで,実用されることはあまり多くありません(また今度解説します)。

おわりに

最後までお読みいただきありがとうございました。
内容の誤り説明の不備があれば,ぜひご連絡ください。

今回の内容がタメになったと感じられた方は,ぜひいいね♡フォローをお願いします。

また,著者は,統計の代行論文執筆のサポートなども行っております。お気軽にご連絡ください。


サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す