【ブラウザ拡張】OAuthスクレイピングとPDF出力の検証
結論:ブラウザ拡張機能で、OAuthサイトにログイン・データをPDF保存は実現可能。スクレイピングの技術といえば、Selenium・Puppeteerが定番ですが、ブラウザ拡張機能による可能性をご紹介します。Outh認証が必要なサイトにGoogleアカウントでログインブラウザ拡張機能によるスクレイピングは直接DOMを操作することができ、原始的で強力な手法です。各ブラウザの拡張機能です。今回、OAuth認証の突破とPDF出力の検証をする機会およびその成功により、ビジネス用途において最も強力な選択肢の1つであると主張します。具体的には以下のようなことが可能です:- サイト内のテキストの読み込み・保存- 画像や音楽、ファイルなどの保存- 認証必要サイトへのログイン- APIを通じた機能実行・データベース使用などです。スクレイピングに必要なほとんどの要件を十分に実現可能です。従来手法との比較Selenium・Puppeteerはスクレイピングのプロジェクトではよく選ばれる技術です。これらはかなり強力技術で、スクレイピング需要を確実に満たすといえます。バックグラウンドや並行実行なども可能で、他システムとの連携も得意です。一方で常駐するサーバが必要となり維持運用の複雑さ・維持コストがかかることが大変になってきます。一方で、ウェブブラウザ拡張機能での実現は、ブラウザの内部に内包されるため維持は不要。当然維持コストもかかりません。加えて、スクレイピング対象のサービスそのものに追加される拡張機能ですので、サービスの延長ですぐに覚えることができます。ビジネス用途においては、保守運用の要員がデータを
0