【※使用PCがMacの方は実行ファイルがWindows専用のため、お引き受けできません。予めご了承ください。】
【※Webサイトによっては取得不可の情報、robots.txtにより取得が禁止されている場合があります。また、以前までは取得できたWebサイトでも数日後には取得出来なくなるという場合もございます。この点を踏まえて購入していただけると幸いでございます。】
【サービス内容】
Pythonを使用してWebサイトから購入者様が欲しい情報をスクレイピング致します。(購入者様から事前にスクレイピングを行うWebサイトの情報を出来るだけ詳しく教えていただけると、納品までの流れがスムーズになる場合があります。)
同じWebサイトへのスクレイピングを定期契約を依頼される方も大歓迎です!
【使用ライブラリ】
スクレイピングにはPythonの一般的なライブラリを使用します。
・Scrapy
・Scrapy-Selenium
・Requests
・BeautifulSoup
・Selenium等
【出力ファイルについて】
・CSV、Excelファイルでの出力が基本となります。
【サービス内容について】
・2つのWebサイトのからのテキスト形式の情報取得は複数でも無料です。
(取得したいWebサイトが複数の場合は追加料金)
・CSV、Excelファイルでの出力は無料です。
・サイトの仕様変更により突然情報取得が出来なくなった場合でも無料で検証します。
(※robots.txt、規約変更の場合は取得出来なくなる場合もございますので予めご了承下さい。)
【※以下は追加料金になります】
・CSV、Excelファイル以外のファイル出力を指定される場合(1000円)
・2つ以上のWebサイトから情報を取得する場合(一つのWebサイトにつき500円)
・画像の取得、保存(2000円)
・XPATH、CSSセレクタの情報をお渡しする場合(要相談)
・サイトの仕様変更により取得が複雑になった場合(要相談)
※その他ご要望があればご相談ください。
【その他】
・スクレイピングに必要なコードの開示、提供は行いません。
・Webサイトに負荷を掛けないように取得しますので取得する情報の数によっては納期よりお時間を頂く場合がございます。
※納品されたファイルは購入者様の大事な購入品です。納品されたファイルの管理は購入者様の自己責任でお願い致します。
・購入者様自身でスクレイピングして欲しいWebサイトの情報を調べて伝えていただけると納品までがスムーズに行える場合がごさいます。
・スクレイピングして欲しい情報は出来る限り詳しくお伝え下さい。
・購入後、キャンセルされる場合は出来るだけ早くお伝え下さい。
・また、キャンセルが必要な場合は購入者様の都合によるキャンセルとさせていただきます。
・情報取得の目視確認は購入者様自身で行ってく下さい。
・Webサイトに対して過度な負荷を掛ける様な取得の依頼、相談はお断りします。
・取得出来ない情報に関しては、取得出来ない原因を出来る限り具体的に説明致します。