・時系列データの解析手法として、トレンド解析及びトレンド除去後の周期性の解析というのが一般的に用いられるらしい。
・時系列データの解析を実施してみたいと思って最初に思いついたのが、気温のデータだった。気温のデータは、気象庁のHPからcsvでダウンロードできる(以下)。
・解析する際に気づいたのだけれど、手軽にハンドリングできるデータサイズだとトレンドが緩やか過ぎて、あまり参考にならなかった。ということで、今回は周期性の解析のみ実施してみた(下図)。
・処理の流れは以下の通り。
①気象庁HPから落とした10年分の東京の気温データを読み込む。
②RowIDを7で割った整数部分の列を作成。
③②で作成した列でグループをまとめ、算術平均を算出。←各日では重すぎたので、週ごとの平均にした。
④③のデータを図示し、継続的な上昇・下降傾向がないことを確認(下図)。
⑤③のデータを1週ずつずらした表を作成。
⑥ちょっと重かったので行を減らした。
⑦線形相関係数を算出(下図)。
・この時点で52週周期であることが推察された。
⑧図示するにはまだ重すぎたので、行を減らした。
⑨相関係数を図示(下図)。
・綺麗なsinカーブになるものだなぁと感心した。
・今度やるときは、適当な関数から疑似データを作成してトレンドも加味した解析をやる必要があると感じた今日この頃。
終わり。