エクセルデータ分析(ネット購入①)

告知
ビジネス・マーケティング

データを探す

総務省が公表している「インターネットを利用した1世帯当たり1か月間の支出」を分析します。この調査は、統計理論に基づき選定された全国約3万世帯を対象は毎月行われています。
データは総世帯、二人以上の世帯/単身世帯で分かれていて、月次(二人以上の世帯のみ)、4半期、年次等の集計データが公表されています。
データは2015年~2024年地域ごとのデータがあり、指定された22品目と総購入量などが含まれています。

今回は単身世帯の年次データから購入傾向の経時的変化・最もネット購入者が多い地区、指定22品目の売上上位・下位、大都市と小都市の傾向の違い等を分析しようと思います。
他にもこのような公表データがありますので、組み合わせることで色々な角度から分析ができるかも知れません。
画像1.png

分析表を作る

ダウンロードしたデータベースは下図になります(DB1-1タブ)。
画像3.png
このデータベースからまずは全体像を下記データを用いて分析してみます。
まずは分析をすべき項目をL列から選択して貼り付けます。
画像2.png
横軸は年次(2015年~2024年)とします。
年次データは元データの全37項目に記載され(I列)、それが10年分あります。このデータを「重複の削除」と「行/列の入れ替え」で加工して1行目に貼り付けます。
画像5.png
このレイアウトに各データを反映させていきます。
あわせて、A1セルの選択によって、全国・地方・都市階級それぞれのデータを反映させられるようにしていきます。これはピボットテーブルを用いれば簡単にできますが、より分析の自由度を高めるため、敢えてエクセル関数で作成します。
INDEX-MATCH関数
B2セルには「2015年(B1セル)」の「世帯数分布(A2セル)」を表示します。対象は「全国(A1セル)」です。
INDEX('DB1-1'!$A$1:$W$373,MATCH($A2&B$1,'DB1-1'!$L:$L&'DB1-1'!$I:$I,0),MATCH($A$1,'DB1-1'!$13:$13,0))
画像1.png
【配列】A1セルからデータ範囲全て(W373セル)までを指定します。
【行番号】MATCH関数で「2015年(B1セル)」の「世帯数分布(A2セル)」があるセルの行数を検索します。
MATCH($A2&B$1,'DB1-1'!$L:$L&'DB1-1'!$I:$I,0)
画像1.png
このように2つの条件から検索して反映させる場合は2つの【検査値】を「&」で指定し、それぞれの【検査範囲】も同じ順番で「&」で指定します。【照合の種類】は「0:最初に出てくる列」を指定します。【列番号】同じくMATCH関数で全国のデータがある列(N列)を指定します。
この結果、「2015年」の「世帯数分布」があるセルは342行目(上から342番目)」と検索できました。
【列番号】同じくMATCH関数で全国のデータがある列(N列)を指定します。
MATCH($A$1,'DB1-1'!$13:$13,0)
画像1.png
「全国」という【検査値】が含まれるセルは「A1セル」のみです。「全国・地方・都市階級」の区分は13行目にありますので【検査範囲】は13行目になります。【照合の種類】は「0」に設定します。
この結果、「全国」があるセルは14行目(左から14番目=N列)」と検索できました。
このようにINDEX関数とMATCH関数を組み合わせることで、「全国」の「2015年(B1セル)」の「世帯数分布(A2セル)」である「10,000」を抽出することができました。
このB2セルの計算式を縦横にコピペすることで分析表は完成です。年度別分析表です。
画像1.png
少し動作が重たいので、【検査範囲】をDB1-1タブにデータがある部分のみに一部修正しました。
INDEX('DB1-1'!$A$1:$W$373,MATCH($A2&B$1,'DB1-1'!$L$1:$L$373&'DB1-1'!$I$1:$I$373,0),MATCH($A$1,'DB1-1'!$A$13:$W$13,0))
また、同じ方法で地区別分析表も作成しました。

データを分析する
この状態でも年度別分析表から以下のことがわかります。
ネット購入の世帯数(10行目)がこの10年で約2倍になっていることがわかります。なお、集計世帯数にばらつきがあるので、世帯数実数(3行目)ではなく統計学的に算出された1万人あたりの世帯数(9行目)で判断すべきです。
またその支出金額(6行目)も約3倍になっていることがわかります。
一方、一人当たりの単価(11行目)は2倍までにはなっていないことから、ネットで購入する方が増えたことが支出金額の増加につながっていることがわかります。
また指定22品目(6行目)が占める総支出額(11行目)の割合から、指定品目以外での購入の多さが想定できます。指定品目についての分析で何かわかるかもしれません。
世帯主の平均年齢(5行目)や有業人員(4行目)から少子高齢化社会が感じられます。年齢別の分析で新たな知見が得られるかもしれません。
この分析表をもう少しわかりやすい表に加工していきます。
年度別分析表
画像1.png
地区別分析表
画像1.png
人口・購入意識の変化が「紫」、購入量を「オレンジ」になります。
「年度別分析表」には10年間の推移を「地区別分析表」には条件付き書式で最高値/最低値を表示しました。
画像1.png
全国的にはこの10年で働いている単身者は5%増え、年齢はほぼ横ばいとなっていますが、地域によってこの状況は異なります。「北海道・東北」や「九州・沖縄」では有業人員は10%伸びていますが、「関東」では伸び率は2%、「四国・中国」ではマイナスになっています。年齢は「関東」「九州・沖縄」ではマイナスですが、それ以外の地区ではプラスとなっていて「四国・中国」では2.2歳上昇しています。
ネット購入をした世帯数は全国的には201.6%の伸び率となっていますが、年齢が低下した「九州・沖縄」では253.5%と最大の伸びとなっているのに対し、年齢が上昇した「四国・中国」は143.6%しか増えていません。なお、「関東」の伸び率は全国並みです。このことから年齢以外にもネット購入普及率には要因があると考えられます。
地区別では「関東」がネット販売をけん引していて「中国・四国」では全体的に普及が進んでいない傾向が伺えます。「中国・四国」は2015年からネット販売が全国平均よりも普及していない傾向にあります。これをどう捉えるかは議論が分かれるところと思われます。「未開地で靴を売る営業員」の話と同じで、「誰も履いていないから売れない」か「誰も履いていないから売れる」かの考え方によると考えます。
年齢が若く有業人員が多い「大都市」はネット購入をする金額が多いことがわかりますが、「小都市・町村」と比べてネット購入を行っている方の割合はかわりません。

長くなったので「指定22品目の売上上位・下位」は次回にします。
きりがないので全体像の分析はここまでとしますが、この分析表からは様々なことが分析できます。このエクセルファイルを下記にてお譲りします。

サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す ココナラコンテンツマーケット ノウハウ記事・テンプレート・デザイン素材はこちら