Codex CLI で作ってみた1

Codex CLI で作ってみた1

記事
IT・テクノロジー

マルチモーダル文字認識ツール :(github.com/take365/llmocr)
従来の OCR(文字認識)は、専用ライブラリや設定が必要で手間がかかりました。
しかし マルチモーダル LLM(例: GPT-4o のように画像を直接理解できるモデル) を組み合わせることで、画像をそのまま渡すだけで高精度な文字認識が可能になりました。
この仕組みを活用したのが [llmocr] で、「文字認識の設定や前処理を簡略化できる」 点が最大の特徴です。

財務諸表分析ツール(github.com/take365/NFAL)
もうひとつの事例が [NFAL] です。
これは金融庁の EDINET に公開される有価証券報告書 を対象にしたプロジェクトです。
報告書の取得
データの抽出
財務諸表の数値計算
といったプログラム開発を Codex CLI で進めました。
さらに Codex CLI を通じて
LLM による定性的な分析(文章解釈や説明生成)
Web 参照機能を用いた補足的な調査や解釈
まで自動化・統合できるようになり、数値とテキストの両面から分析を行える点が大きな強みとなりました。

どちらもgithub(take365)にてオープンソース公開中です。
そういった開発の相談も承っております。ご興味ありましたらぜひ。

サービス数40万件のスキルマーケット、あなたにぴったりのサービスを探す