【Pythonプログラム作成】PDFからハイライト箇所を抜き出し(参考資料あり)

予算
1万
3万
納品希望日
ご相談
募集期限
募集終了 締切日 2021年6月20日 /
掲載日 2021年6月6日
応募状況
応募人数 2
契約人数 1
閲覧数 203
用途・種類
作業自動化・効率化、アプリ開発
対応範囲
用意してあるもの
開発言語
Python

募集内容

依頼の概要・目的・背景
【概要】 PythonでPDFファイルのハイライト箇所を抽出する。 添付ファイルのようなPDF(Remarkableというデバイスから出力したPDF)から、ハイライト箇所を抽出できるようなプログラムを作成いただきたいです。 ※参考URLのGithubにおけるプログラムの、ExampleのPDFではなく、添付ファイルのPDFで正常に動作するようにお願い致します。 ハイライトには2種類あります。 ①文字の上を太さのある黄色線(ハイライトマーカーのイメージ)で塗っている箇所については、文字を認識したうえでテキストで抽出 ②同じく、太さのある黄色線の長方形(矩形)で囲われた箇所については、その矩形内部を画像として抽出 上記抽出したものを、Wordにペーストしていく作りを想定しています。 PDFの該当ページについても分かるような設計にしていただきたいです。(参照URLのGithub参照)
添付ファイル
求めるスキル
Python
特記事項
経験者優遇

応募者一覧

応募者
応募日時
konoki_yuri
2021/06/06 16:17

募集内容についての質問

募集者情報

fukuyasan1230
5.0 (1)
発注実績
1
発注件数
100%
発注率
100%
取引完了率
認証状況
本人確認
機密保持契約(NDA)