netkeibaからレース日程とレース一覧を取得する方法【第1回】pythonスクレイピングの基本編
私はフリーランスでメインはデータを扱う仕事をしています。
その他ですとjavascript/react/typescriptを使用したフロントエンドの作成・バックエンドAPIの作成やAWSを使用したインフラの整備や動画編集・ウェブサイトの運用をしています。
一番長くやっているのがpythonとデータベースを連携したデータ取得・加工・集計・分析・運用といったデータのライフサイクルを扱う仕事で
趣味で競馬分析を行っていることから、特に、このココナラやその他クラウドソーシングでは競馬のデータ取得や分析などのツール作成を請け負うことが多いです。
そこで今回は競馬データを扱うことをテーマにブログを書いていこうと思います。第一弾はnetkeibaからレースデータを取得する方法をして紹介します。ややプログラムを書く技術者よりになると思いますが、手っ取り早くデータ取得ツールが必要な方はツールを作成して出品しておきますので、ご購入のご検討をお願いします。またpythonを扱う方はコピペでデータ取得できるように書いていきます。
※また自分が超めんどくさがりなので詳細な説明は省き、結論のコードだけのせることも多いと思います。第1回はnetkeibaからレース日程とレース一覧を取得する方法
第2回はnetkeibaから出走表とレース結果とその他結果データ(払い戻し等)を取得する方法
第3回はnetkeibaから競走馬のプロフィール・過去レース結果を取得する方法
を予定しています。
第4回以降は未定で、その他のデータ取得方法/データベース格納/統計学と集計方法/競馬×機械学習入門、このあたりを書こうかと
0