Rによる時系列データの解析ポイント

記事
IT・テクノロジー
依頼を受けて時系列データから”パターン抽出”を行いました。
そのときに工夫したポイントを3つ紹介します。

■■■■■■■■■■■■■■■■■■■■■■■■■■■■
1)周期の区切り方でエクセル表の”列”と”行”の項目が変わる
■■■■■■■■■■■■■■■■■■■■■■■■■■■■

 1週間ごとの周期でパターンを知りたい場合、「1週目」「2週目」… を
 行名にすることによってRにおけるその後の解析が簡単になります!

 もちろんデータによって列名は変化しますが、例えば「月曜日の売上」
 「火曜日の売上」…というものが想定できます。

■■■■■■■■■■■
2)生データの対数変換
■■■■■■■■■■■

 すべてのデータに言える事ではないかもしれませんが、対数変換を行うこと
 により、より周期予測が当てはまりやすくなりました。

 生データに”0”が複数入っている場合や、値に大きな振れ幅がある際に有効
 です。
■■■■■■■■■■■■■■■
3)ts関数を使用したデータ変換
■■■■■■■■■■■■■■■

 いろいろなライブラリ(賢い人がつくってくれたプログラムのまとまり)を
 利用する際に、時系列データの解析においては『ts関数』によるデータ変換
 が必須であることが分かりました。

 ts(データ名,start=c(年,月),frequency=区切りたい周期)

 例えば、dfという2000年から1年ごとの売上データを変換するときは、

 ts(df,start=c(2000),frequency=1)

 とすると、変換できます。

--------------------------------------------------------------------------------

以上です。
これ以降の解析は様々ですが、不明点や具体的に相談したい内容がございましたら、いつでもご連絡ください!


サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す