エクセルデータ分析(太陽光発電)

記事
ビジネス・マーケティング

データを探す

経済産業省資源エネルギー庁が都道府県別の発電所数、出力数の統計表を公表しているので分析してみました。
時系列データがありますので、日照時間や梅雨・積雪の影響を受けるであろう太陽光発電の県別・月別の最大出力を分析しようと思います。
担当省庁が面積や日照時間などのデータを公開していれば、それと組み合わせて分析することで、各都道府県の太陽光発電に最適な季節や太陽光発電の向き不向きがわかるかも知れません。

データベースを作る

まずはこの統計表がデータベースになっているのかを確認します。
画像2.png
統計表をみると「都道府県」「○○発電所」のセルが結合されていました。
データベースとはデータが1対1で対応している必要があります。
例えば、A5セルには「北海道」、B5セルには「99」というデータが入っているため、1対1の対応になっています。
一方「都道府県」はA列ではありますが2行目というセルは存在せず、2〜4行目というセルになっています。
このような状態ではデータベースとして使用することができませんので、「セル結合」を解除する必要があります。
画像3.png
これでセル結合問題は解決しましたが、次の課題が生じました
例えば、C4セルの「最大出力計」は「水力発電所」のデータですが、C2セルが空欄になっているため、「水力発電所の最大出力計」として認識できるようにする工夫が必要になります。
ただ、これから作成するエクセル関数ではその課題があることを前提に作りますので、ここでは対応を行いません。
この統計表は「2024年4月」~「2025年1月」までの統計表が各タブにわかれています。10か月分つまり10タブで「水力発電所の最大出力計」とする処理をするのが面倒というのが一番の理由です。
このためここでは10タブの「セル結合解除」のみを処理します。

分析表を作る

この統計表には県ごと・月ごとの各発電所の数、最大出力がのデータがあります。

枠組み作成
まずは分析表の枠組みを作ります。県ごとに月別データを並べ、最大出力が多い順に順位をつけます。
さらに順位別に都道府県を並べ、最大出力が最も多い月・少ない月を表示し、傾向を探ります。
この分析結果を元に各都道府県の面積・日照時間・梅雨/積雪の時期等のデータを加えれば太陽光発電を導入するべき時期等が推定できる可能性があります。
まずは県別・月別データに統計表データを反映させていきます。
画像4.png

統計表データの反映
INDEX('2024.4'!$K:$K,MATCH($A3,'2024.4'!$A:$A,0))
これはB3セルの計算式です。B3セルに北海道の2024年4月のデータ(2024.4タブにあります)を反映させます。
MATCH関数で特定した2024.4タブにある「北海道」の「太陽光発電」の値をINDEX関数で表示します。
画像6.png
【検査値】(A3セル)の「北海道」が【検査範囲】(2024.4タブのA列)の何行目にあるかを検索しています。【照合の種類】は「0」を入力します。
「0」には検査値と等しい最初の値を検索するという意味があります。
この結果が「5」となり、「北海道」は「5行目」という検索結果となります。
画像6.png
【配列】2024.4タブのK列に太陽光発電の最大出力データがあります。
【行番号】MATCH関数の結果である「5行目」が北海道の太陽光発電のデータです。
【列番号】今回は【配列】を1列しか入れていないので指定不要です。
この式を右方向(C列~K列)、下方向(4行目~49行目)にコピーするので、必要に応じて「$」で行・列を固定しています。
右方向にコピーしてもタブ名(2024.4)は変わらないので、それぞれ2024.5、2024.6…2025.1に変更します(これは手作業です。どなたかよい方法をご存知でしたらご教示ください。)
画像2.png
ここまでできました。
平均・順位の作成
順位は各都道府県の期間内平均値で求める事にします
平均の関数(L3セルの場合)
AVERAGE(B3:K3)
順位の関数(M3セルの場合)
RANK(L3,$L$3:$L$49)
画像9.png
【数値】L3(北海道の平均値)が【参照】各都道府県平均値(L3からL49)の何番目かを表示します(【順序】は降順にするため記載不要です)。
ランク表への反映
この結果を元に各ランクの都道府県、最大月、最小月をランク表に反映させていきます。
・都道府県への反映
INDEX(A:A,MATCH(O2,M:M,0))
画像11.png
上記INDEX-MATCHと同じ形式なので説明は割愛します。
・最大月/最小月への反映
これまで使ってきたINDEX-MATCHの応用編です。
今回はMATCH関数で指定の行の中の列を特定してINDEX関数で表示します。
INDEX($B$1:$K$1,,MATCH(MAX($B3:$K3),$B3:$K3,0))
これはQ3セルの計算式です。「北海道」で最も出力が多かった月を検索しています。
画像1.png
【配列】B1セル(2024.4)〜K1セル(2025.1)からデータを探します。
【行番号】1行しか選択していないので指定不要です。
【列番号】MATCH関数で検索した列番号のデータを表示します。
画像1.png
先ほどMATCH関数で「行を指定する」と記載しましたが、正確な表現ではありません。MATCH関数は【検査値】が【検査範囲】の何番目にあるかを検索する関数です。
先ほどは行全体を【検査範囲】としていたので、検索結果=行数となりましたが、今回は「B1セル(2024.1)〜K1セル(2025.1)からデータを探します」のでB列~K列の何番目にあるかを検索します。
検索結果が「10」と表示されたため、B列から数えて10番目の列、つまりK列となります。INDEX関数でB1~K10を範囲指定しているため、INDEX-MATCH関数の検索結果は「2025.1」となります。
【検査値】MAX関数でB3~K3の中から最も大きい数字(最大出力月)を指定しています。MAXをMINに代えればMIN関数(最も小さい数字)を指定します。
【検査範囲】「北海道」の月別出力から検索します。
【照合の種類】「最も最初に出てくる値」を指定していますので、同じ出力だった場合はその出力になった最初の月が対象になります。
画像3.png
これで分析できる状態になりました。

データを分析する

太陽光発電量全国一は「福島県」で2025年1月が最も多く2024年5月が最も少ないことがわかります。以下「宮城県」「茨城県」「岡山県」「栃木県」と続きます。北関東、東北地方で太陽光発電の出力量が多い事がランク表で確認する事が出来ました。
なお、少ない地区は少ない順に「東京都」「沖縄県」「富山県」「福井県」「徳島県」です。
もう少し細かく見てみましょう。
見にくいので「条件付き書式」で色を付けてみました。
画像1.png
最大月が黄色、最小月が青です。
画像4.png
何か違和感がありませんか?
例えば「北海道」は冬に最大出力となっています。積雪の影響はないのでしょうか?
「山形県」は10ヵ月中6ヵ月が同じ出力量になっています。真夏の8月と同じ出力量を真冬の1月に出せるのでしょうか。
他にも「佐賀県」は毎月同じ出力量ですし、「沖縄県」も9ヵ月同じ値です。
このデータは何なんでしょうか?
経済産業省資源エネルギー庁のホームページには下記記載がありました。
画像6.png
つまり佐賀県の各電気事業者の「発受電月報等」には「毎月同じ出力」と記載されていることになります。

このような信頼できないデータからは何も分析ができないことがわかりました。
政府が開示しているデータにはこのような信用度の低いデータベースがあるとわかったことが今回の分析の成果となります。

このような結果となりましたがご希望の方はこのエクセルシートをお譲り致します。これ以外の提供方法がわからないので、システム上の最低価格にてご提供致します。。
各種データベースの分析を予定している方は下記サービスもご検討ください。




サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す ココナラコンテンツマーケット ノウハウ記事・テンプレート・デザイン素材はこちら