Tesseract

記事
IT・テクノロジー

準備

モジュールとは別に Tesseract 本体をインストールしてパスを通しておく
 インストール時に追加するもの
  Additional language data
Japanese (横書きの日本語)
Japanese (vertical) (縦書きの日本語)
※ Javanese はインドネシアのジャワ語なので不要
  Additional script data(download)
Japanese script (日本語の横書きに関するスクリプト)
Japanese vertical script (縦書きの文字構成に関する補助情報)

Import

import pytesseract

テキストを抽出

pytesseract.image_to_string(画像)
 日本語
pytesseract.image_to_string(画像, lang="jpn")

Install

pip install pytesseract

サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す ココナラコンテンツマーケット ノウハウ記事・テンプレート・デザイン素材はこちら