netkeibaから出走表と結果を取得する方法【第2回】pythonスクレイピング
netkeibaからデータを取得するの第二弾です。前回は指定の日付範囲から日程とレース一覧を取得しましたが、
今回は具体的な出走表と結果と払い戻しを取得します。
netkeibaには通常の結果とデータベースの結果ページが存在しますが、今回は前者をターゲットとします。対象ページの確認まずは出走表のページを見ると、レースIDが書いてます。そして結果ページも同様です。
レースIDは前回のレース一覧で取得済みです。(RIDという列名で保存してます)
出走表ページに戻って、欲しい出走表がどのように配置されているか開発者ツールで確認します。
するとテーブルになっているので、こういう時は便利なpandasを使いましょう。取得テスト前回同様にget_driver関数でドライバを取得し、出走表のURLを入力してdriver.get(url)します。
そして以下のようにpandasのテーブルタグを読みこんでデータフレームリストで返す関数を使用しますdata = pd.read_html(driver.page_source)
len(data) # テーブルが何個読み取られたか
# 5お目当てのデータは最初のリストに格納されていました。pandasを使用すると簡単に取得できますが、馬名に貼られているリンクは別途取得する必要があります。
今回は省略しますが、作成したツールの方では取得しています。出走表取得コードdef get_race_table(driver, race_id):
url = f"race/shutuba.html?race_id={race_id}" # 禁止文字列のた
0