統計学の基本と無作為抽出の問題(2)
1.統計学とはなにか。統計学とは一言で言えば「データを整理し,わかりやすくするための学問」です。膨大なデータをそのまま眺めても,そこから有益な情報を直感的に読み取るのは難しいものです。例えば,日本人100人の体重を測定したとします。このデータをそのままリストとして眺めても,全体の傾向を把握するのは容易ではありません。そこで,データの代表的な特徴を示す「要約値」を求めることで,情報を簡潔に表現することができます。ここで,すでに専門用語が出てしまいました。要約値(要約統計量/基本統計量/記述統計量)とは,平均値や中央値,最頻値,最小・最大値,分散,標準偏差,四分位範囲・・・など,データの分布や特徴した値を指す。このうち,平均値や中央値,最頻値などは,データの中心を代表するものとして,代表値と呼ばれる。[1]たくさん呼び方があってややこしいですが,これは統計学の特徴でもあります。これら細かい概念については,一つずつ抑えていきましょう。話は戻り,先の日本人100人の体重の測定についてです。最も基本的な要約値の一つが,平均値(mean)です。これは,すべてのデータを足して個数で割ることで求められ,データの「中心的な値」を示します。たとえば,100人の体重の平均値が50kgだったとすると,「この100人の体重はおおよそ60kgである」と表現できます。 ※どの要約値や関連値についても,計算方法を理解する必要はあまりな いです。機械計算できるので,概念の理解を先に行いましょう。しかし,「おおよそ」という表現に疑問を持つ人もいるかもしれません。つまり,「データがどのくらいバラついているの
0