こんにちは。たけのこよりきのこ派の山城です!
【データ分析をしよう!】の第4回は、
二つの要素の関係の強さを分析する方法をご紹介します。
関係性を表す方法として、相関係数(比例または反比例を数値で表したもの)で関係の強さを出す方法があります。
相関係数は、以下のように−1〜1の範囲で表されます。
・-1に近いほど反比例する関係が強い
・0に近いほど関係性がない
・1に近いほど比例する関係が強い
例として、ビールの販売数と平均気温の関係を測ってみたいと思います。
まずはデータを散布図にしてみます。
赤線は「回帰直線」と呼ばれるものです。相関係数は各数値と赤線までの誤差を元に計算します。
【相関係数の求め方】
計算がめんどくさいので、ここは機械に任せましょう。(はなほじ)
なんやかんやあって、相関係数は0.315となりました。
0.315は一般的には弱い相関があると判断されます。
つまり、気温が上がると比例してビールは売れる傾向があることがわかります。
このように、2つの要因の関係性の強さを、数値で表すことができるのです。
※ただし、相関関係はあっても必ずしも因果関係があるわけではないので、他の要因も検討する必要があります。
次回は、「自由評価の分析方法」をテーマにしたいと思います。
お楽しみに♪