こんにちは。この前冬山キャンプをしたら寒くて死ぬかと思った山城です!
【データ分析をしよう!】の第3回は、
複数のグループの結果に差が出た時、たまたま差が出たのか、それとも何か原因がって差が出たのかを判断する方法について、ザックリと書いていこうと思います。
統計学では、「その結果がどれくらいの確率で起こるか」を計算して、5%を基準として判断していきます。
・5%以上の確率で起こる → 偶然
・5%より大きい確率で起こる → 偶然ではない
例として、
英語のテストを1班7人と2班9人で行った結果が、
1班 59, 67, 60, 78, 75, 80, 66 平均:69.29
2班 52, 78, 56, 71, 51, 58, 80, 60, 51 平均:61.89
となったとします。
平均点の差は偶然の差かそうではないかを判断してみましょう!
この場合、統計学の「平均の差の検定」という手法で計算を行って判断していきます。
【平均の差の検定】
眠くなるので計算過程は割愛します(ハナホジ)
なんやかんや計算すると、この差が出る確率は5%より大きくなります。
今回は確率が5%より大きいため、この差はたまたま起こったことと判断できます。
ザックリ説明しましたが、さらに詳しく知りたい方はグーグル先生に聞いてみてください!
次回は、「これとこれは関係ある?」をテーマにしたいと思います。
お楽しみに♪