重回帰分析の注意点

記事

IT・テクノロジー

◆この記事の要点

・重回帰分析でモデルに組み込むべき説明変数は、分析の目的（予測 or 解釈）によって異なる

・適切なモデルの設計は、ぜひご相談ください！

◆具体的なイメージ

あなたは学校の先生です。

生徒の「試験の点数」が、「出席率」や「課題の点数」とどう関係しているか知りたいとします。

このとき、以下の２パターンの違いを考えてみましょう。

①「出席率」や「課題の点数」から、「試験の点数」を予測したい

②「試験の点数」に対する、「出席率」の影響を知りたい

①は、分析する目的が「予測」です。

生徒がとる「試験の点数」が何点になるかを予測するのに使います。

②は、分析する目的が「解釈」です。

例えば「出席率」が平均より10%高いと、「試験の点数」が平均よりも何点高くなるかを理解するのに使います。

それによって、例えば「試験の点数」を上げたい重要な科目については、朝イチの開講を控えて、遅刻しがちな生徒が出席できるようにする等の対策を講じることができます（これは大学等のイメージ）

◆回帰の目的に応じた重回帰モデルの違い

実は予測をしたいか、解釈がしたいかで、重回帰モデルに組み込むべき説明変数は異なります。

具体的に先ほどの例でいうと、「試験の点数」を予測するために準備した回帰モデルがあるとします。そのモデルの回帰係数を見て、「出席率」を10%高くしたときに、「試験の点数」が何点になるか、という解釈はできないことがあります。

その結果、「モデルの決定係数R^2は良好だったのに、思ったような施策効果が出てこない…」など誤った施策で時間と費用を無駄にすることがあります。

一見簡単に見える重回帰モデルでも、誤った使い方では利益に繋がりません。

もし不安があるときは、下記にてご相談いただければ幸いです。

モデルの設計から、結果の解釈までサポートさせて頂きます！

現役データサイエンティストがデータ分析代行します

この出品者の出品サービス

5,000 円 /60分

5,000 円 /60分

10,000 円