• ベストアンサー

繁字中国語をOCRで取り込んで翻訳して読みたい

題字にある中国語の本とは、写真印刷された手書き文字の時代の本です。活字じゃないのでそれだけでも敷居が高いし、現代の中国語ではなく、繁字体です。 Justsystem一太郎2023の一太郎padとiPhoneXRペアでの結果は散々でした。 良い手を知っている方がいればご教授お願いいたします。 OCRさえ成功すれば、翻訳は翻訳サイトを試せばいいのかもしれないとかんがえています。OCRソフトは中国語で探すのが最良だろうと思うのですがそれ自体が敷居が高く、人に頼るのが良いだろうと考え投稿いたします。よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • staratras
  • ベストアンサー率41% (1512/3682)
回答No.3

No.2の追伸です。 本文2行目の9・10文字目は「吾國」だと読みましたが、Googleは「合图」と理解しています。人間はその文字の形だけでなく前後とのつながりも考えて文字を識別しますが、そこまでは要求できないようです。

skmonono
質問者

お礼

私も吾國と思います。今や画像から文字起こしできるAI時代なんですね。他のAIも探してみたいですね。googleやってみます。ありがとうごいました。

Powered by GRATICA

その他の回答 (2)

  • staratras
  • ベストアンサー率41% (1512/3682)
回答No.2

OCRとは違いますが、text化はこのような簡単なやり方もあるのではないでしょうか。 まず紙の本をスキャナーやカメラで画像にします。 (今回はご質問に添付された画像を使いました) 次にその画像をGoogle Lensの翻訳機能で「中国語(台湾)」→「中国語(台湾)」にして得られた文字情報が次の通りです。 自序 秀升於民七奉山西警務處長委任為山西官醫院中醫士每於 診病之磁首喜研習合图各派武術如岳氏六合意拳少林五行 八卦太極公立摩羅漢拳及宋氏之内功納卦神連池龍拳等經 雞皆有各門受業之專師大致僅得其皮毛消恨其習馬而未精 也何者既服務醫事日與病人相周旋營營於寒熟表裡斤斤於 補湯溫京極勞極苦極沉悶日所見多憔悴之色耳所聞性呻吟 之聲使不研習武術以舒合襟懷则我身久已釀成鬱症故余之 研習武術則等於自服烏葯陳皮也蓋聞德育智育體育三者為 立身之要術亦治國平天下之大經凡古往今来之大英雄大豪 傑美不根基乎此諺云、欲為健全之事業必具健全之身體所以 細かく言うと本文5字目の「七」はなぜかひらがなの「と」になっていましたので手動で訂正しました。また7行目の最後から2文字目は画像では「余」に見えますが「餘」になってしまいました。(これは訂正していません)そのほかはほとんど正しいのではないかと思います。

回答No.1

OCRではないですが、Microsoftのcopilotに画像を取り込んで翻訳をしじすると添付画像の様に翻訳されました。 内容はあっていますでしょうか?

skmonono
質問者

お礼

私もやってみたところ正しい内容に近づきました。句読点を認識せず、意訳しすぎて原文が不明になるのが痛い。元漢字を使って直訳してほしいのでやはりOCRが欲しいところです。でもこの方法で中国語にしてみたり、別ページを試したりしようと思います。

Powered by GRATICA

関連するQ&A