依頼を受けて時系列データから”パターン抽出”を行いました。
そのときに工夫したポイントを3つ紹介します。
■■■■■■■■■■■■■■■■■■■■■■■■■■■■
1)周期の区切り方でエクセル表の”列”と”行”の項目が変わる
■■■■■■■■■■■■■■■■■■■■■■■■■■■■
1週間ごとの周期でパターンを知りたい場合、「1週目」「2週目」… を
行名にすることによってRにおけるその後の解析が簡単になります!
もちろんデータによって列名は変化しますが、例えば「月曜日の売上」
「火曜日の売上」…というものが想定できます。
■■■■■■■■■■■
2)生データの対数変換
■■■■■■■■■■■
すべてのデータに言える事ではないかもしれませんが、対数変換を行うこと
により、より周期予測が当てはまりやすくなりました。
生データに”0”が複数入っている場合や、値に大きな振れ幅がある際に有効
です。
■■■■■■■■■■■■■■■
3)ts関数を使用したデータ変換
■■■■■■■■■■■■■■■
いろいろなライブラリ(賢い人がつくってくれたプログラムのまとまり)を
利用する際に、時系列データの解析においては『ts関数』によるデータ変換
が必須であることが分かりました。
ts(データ名,start=c(年,月),frequency=区切りたい周期)
例えば、dfという2000年から1年ごとの売上データを変換するときは、
ts(df,start=c(2000),frequency=1)
とすると、変換できます。
--------------------------------------------------------------------------------
以上です。
これ以降の解析は様々ですが、不明点や具体的に相談したい内容がございましたら、いつでもご連絡ください!