初めに
日本の漫画フォーマットに特化したOCRのライブラリがあるので動かしてみます
開発環境
環境セットアップ
公式のままだとエラーになるので、pyproject.toml を変更します
requires-python = ">=3.8"
上記のように3.8以上にしておきます
そのあとは、以下でライブラリを入れていきます(torchはCPU版になりますが、今回は簡単な推論だけなのでそのままにします)
uv sync
推論
以下のようなコードを使って漫画の画像をOCRで文字認識を行います。画像はリポジトリ内に入っているサンプル画像を使用します

from manga_ocr import MangaOcr mocr = MangaOcr() text = mocr(r"assets\examples\00.jpg") print(text)
画像をOCEで認識した結果は以下のようになりました
素直にあやまるしか