【概要】
ウェブサイトから情報を抽出するコンピュータソフトウェア技術(Webスクレイピング)を用いて指定されたWebページの情報をCSVやExcelファイル、Googleスプレットシート、jsonファイル等で出力します。
画像は例としてCSVファイルとしてエクスポートしているサンプルです。他にもexcelファイル、Googleスプレットシートの場合やコードサンプルも掲載しています。
当方は他クラウドソーシングサイトでdoda.comやhb.en-japan.comをスクレイピングした経験があります。
使っているPythonライブラリはBeautifulSoup,Seleniumです。
また画像抽出にはPillowを用いています。
【お取引の流れ】
※ココナラ様の流れに沿って進めさせていただきます。
1.ご購入前に、必ず「見積り・カスタマイズの相談」からメッセージをお願いいたします。
2.ご依頼内容のヒアリングの結果、所要時間を試算し、オプションのご提案をいたします。
3.2の双方の同意内容に基づき、オプションを含めたご購入手続きをお願いいたします。
対象となるサイトによっては利用規約によりスクレイピングできない場合がございます。
事前に以下の情報とお見積もりの相談を下さい。
・サイトのurl
・取得したい情報
・完成物のイメージ
※ご注意
基本的にはデータ階層が1段階(親のみのページ)の料金となります。
ページが複数に渡る場合や画像抽出、ログインが必要なサイトのスクレイピングはオプション追加の対象となります。