manga-ocrを動かす

初めに

日本の漫画フォーマットに特化したOCRのライブラリがあるので動かしてみます

github.com

開発環境

環境セットアップ

公式のままだとエラーになるので、pyproject.toml を変更します

requires-python = ">=3.8"

上記のように3.8以上にしておきます

そのあとは、以下でライブラリを入れていきます(torchはCPU版になりますが、今回は簡単な推論だけなのでそのままにします)

uv sync

推論

以下のようなコードを使って漫画の画像をOCRで文字認識を行います。画像はリポジトリ内に入っているサンプル画像を使用します

from manga_ocr import MangaOcr

mocr = MangaOcr()
text = mocr(r"assets\examples\00.jpg")

print(text)

画像をOCEで認識した結果は以下のようになりました

素直にあやまるしか