時系列解析と予測について(2)

記事
ビジネス・マーケティング
こんにちは。
時系列解析の話になりますが、具体的にはどうするのかということになります。今、手元にあるデータをヒストグラムにして、期待値(統計平均)、分散を求めることは、基本的なことです。これは、時系列から時間的な順序を無視してデータの分布を視覚化したものとなります。しかしながら、今の問題は、時間の経緯とともに推移するデータに関する一つの構造が知りたいということではないでしょうか。期待値とか、分散という言葉が出てくるように、数学的に整合していること、かつ、客観的に理論がレビューされて十分理解できることが、条件となってくることは、一般性を損なうことではないと思われます。ここで、時系列データがとる構造に、考え方としてのモデルを与え、このモデルが現在のデータの状況をよく表し、予測に関しても許容できるほどの範囲内であれば、そのモデルは正しいと解釈していいと考えられます。
時系列データにモデルを与えるといっても、いきなり突拍子もないことを考える必要はありません。まずは、非現実的であっても、ある一定の仮定の下に、モデルが数学的に成立していることが必要です。1つでも反証があるというのであれば、数学的には成立しないわけですから、ある範囲内において、そのモデルは成立していると仮定するのです。
ここになって、例え非現実的であっても、と書きました。ただでさえ、時系列データの予測なんて怪しいのに、と思われるかもしれません。しかしながら、理論の構築においては、いきなり、実際の時系列データをよく表している表現を与えることは、至難の業ですから、ある仮定の下に数学的なモデルを与えて、妥当性を評価することを出発点とすればいいということです。その過程において、様々な考察が生まれ、数学的なモデルが発展していくと思われます。
最初の出発点としては、次の2点を仮定することでしょう。1.「期待値は時間に依存しない」2.「分散は時間に対して可逆的である」。まず、1に関しては、時系列データの平均は、一定であるということを言っています。時系列をある区間に分割して平均を採ってみると、1が成り立たない場合が多いのではないでしょうか。実際に時系列の平均値が時間とともに変動すると考えるのは、ごく自然なことなのですが、最初のステップとしては、時系列データのヒストグラムの山(統計平均)は動かないと仮定するのです。2に関しましては、分散は期待値の2次モーメントであることを思い出せばわかりやすいと思われます。この2つの仮定をもとに時系列データというものを考えていくと、分散・共分散行列は、対角上に分散が、非対角上に共分散が対象に並ぶ構造となって、現在の時系列データが張る線形空間を与えてくれることになります。

サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す