【競馬・番外編】よりきめ細かい…

記事
エンタメ・趣味
ここのところ、当たらずといえども遠からず、そんな結果ばかりです。唯一明らかなのは財布が夜中の墓地=すごく寂しいということ。なんだか落語の言い回しより抜粋なのですが。

で、データ数は少ないのですが、もしかするときめ細かく予想できるかも知れないと思い、「SMILE」に倣い、モデルを再構築することにしました(今、ブンブンPCが頑張ってくれています)。

SMILE、下記のような距離区分です:

S=SPRINT(1000~1300メートル)
M=MILE(1301~1899メートル)
I=INTERMEDIATE(1900~2100メートル)
L=LONG(2101~2700メートル)
E=EXTENDED(2701メートル以上)

どうしてもデータ数が足りないので、LEは1つにまとめました。現状は芝かダートかしか見ていなかったので、2区分を1つにまとめるというデメリットよりは、きめ細かいモデルになるのではないかと。
で、ダートはクッション値を持たないので、含水率が公開された2019年9月からのデータ、芝はクッション値データを持つようになった2020年9月からをモデルとして、今年からのデータは検証用に使用しています(※レース買い目指示の基データとして)。

当然、データ数は減るので、場合によっては過適合(与えられたデータばかり勉強しすぎて、今後やってくるデータに弱い。例えるなら、問題集の答えを丸暗記してテストではさっぱりってイメージかな?)が起こるかも知れませんが、交差検証でなんとかしてもらうよう、祈っておきます。
サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す