#029 標準偏差

記事
コラム
前回分散について説明しました。分散とは値の集合体の散らばり具合のことで、値が大きいと散らばり具合が大きいことになります。分散は、それぞれの値と平均値の差の2乗を合計して、個数で割った数です。次数は2次です。(2乗しているという意味。2次関数とか聞いたことありますよね)
頭の良い学者さんは考えました。「次数が2次なら、それにルートかけて1次にすれば、それぞれの値の次数と一致するから、何かいいことあるんじゃね?」もっとも、本当はこんな発言なかったと思いますが...
でも良いことはあったのです。分散に平方根をとった数を「標準偏差」(σ[シグマ]で表されることが多いです)と言いますが、平均値+標準偏差の値の間にあるデータの個数は、値の集合が正規分布をとっているのであれば、必ず全体の34%含まれることがわかったのです。これは、グラフの形が違っても(とんがったグラフでも、平べったいグラフでも)同じです。そこがすごいですね。
例えば、100人の学生がテストを受けて、平均が60点、標準偏差が10点だったばあい、自分の点数が70点(平均(60)+標準偏差(10))だと、真ん中よりも34人くらい上(少なくとも、上から16番目)にいることとなります。

正規分布2.png

サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す