OCR(Optical Character Recognition/Reader)とは、光学的文字認識のこと。
紙に記入された文字などをスキャナやカメラで画像化したものを元に、テキスト文字に変換するソフトウェアのことです。
仕事的によくOCRは利用しています。
お客様から届いた注文書をOCRでテキスト化し、今まではオペレーターが全てて手入力していた情報をほとんど手入力することなく自動化したり。
ここ近年のOCRはAIの手助けもあって、飛躍的に文字認識精度が向上しています。
私が職場で利用しているOCRはAi inside社のDX SuiteというOCRです。
ネットで拾った手書き文字の画像をこのOCRにかけたところ、下の画像のように、100点満点の認識率でした。
現在のOCRはここまで進化してます。凄いですよね!
左:ネットで拾った手書き文字の画像、右:DX Suiteでテキスト化した文字
(※テキスト化した文字には改行は含まれないため、元画像との比較のために改行は後で手入力しました)