【データ分析をしよう!】 第4回 これって関係あるの?

記事
ビジネス・マーケティング

こんにちは。たけのこよりきのこ派の山城です!


【データ分析をしよう!】の第4回は、
二つの要素の関係の強さを分析する方法をご紹介します。

関係性を表す方法として、相関係数(比例または反比例を数値で表したもの)で関係の強さを出す方法があります。

相関係数は、以下のように−1〜1の範囲で表されます。
・-1に近いほど反比例する関係が強い
・0に近いほど関係性がない
・1に近いほど比例する関係が強い



例として、ビールの販売数と平均気温の関係を測ってみたいと思います。

まずはデータを散布図にしてみます。
販売数 と 平均気温.png

赤線は「回帰直線」と呼ばれるものです。相関係数は各数値と赤線までの誤差を元に計算します。


【相関係数の求め方】
quicklatex.com-f0bb616f6eee926b7a0ca6cccb783b86_l3.png


計算がめんどくさいので、ここは機械に任せましょう。(はなほじ)
やる気なし.png


なんやかんやあって、相関係数は0.315となりました。
0.315は一般的には弱い相関があると判断されます。

つまり、気温が上がると比例してビールは売れる傾向があることがわかります。

このように、2つの要因の関係性の強さを、数値で表すことができるのです。
※ただし、相関関係はあっても必ずしも因果関係があるわけではないので、他の要因も検討する必要があります。


次回は、「自由評価の分析方法」をテーマにしたいと思います。
お楽しみに♪


thumbnail_yaruki_aru_suit.jpg















サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す