- ベストアンサー
スキャンの仕方で困っています。
文書を編集したいと思い、初めてプリンターについてるスキャンを利用したのですが、文字化けします。読取革命ライトです。わかるかた、お願いします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
こんばんは。 #2 です。 「読み込み」-「編集」-「認識」 の三段階だと思います。 ただ、画像を取得したところまでは確かだと思います。 しかし、取得した画像を良く確認してください。目で読める範囲でなければ、OCRでは取得できません。正しく文字が読めれば、次のステップに入ります。なお、背景色と同系の文字の色で彩度が低いと、かなり工夫が必要になります。また、背景色が銀色の場合は、ほとんど不可能です。元のフォントは、最小、7 point ぐらいまでは読むと思いますが、あまり大きなものは、縮小でもしないと認識できないはずです。 編集は、[傾き補正]のみで、それ以上手を掛ける場合は、画像の取得に工夫したほうがよいです。逆さになっていたり、横になっているものは、正しく直せます。ただし、表の場合は、少し補助線のようなものが必要なときがあります。 その後、領域の確定(「レイアウト」)で、正しく判定されているか分からないのです。一度、失敗した認識は、全部、領域の認識をクリアにして、デフォルトの設定を直したりしてから、最初からやり直したほうが早いです。領域の確定を自動にすると、うまく行かないことがあります。 レイアウトを取った時点で、認識モードを確認してください。日本語は日本語、英語は英語にしてください。たぶん、日本語モードでも、ある程度の英語の認識はするはずです。 領域の属性は、自動判定か、もしくは、文字ですか? 文字の場合は、範囲を設定してあげないといけないかもしれません。しかし、こちらのほうがヒット率が上がります。 また、文字方向は、自動判定ですか? 以外に失敗することがあるので、横書きか、縦書きか指定してください。 それができたら、「認識」です。 そうすれば、できているはずです。 私の経験では、単行本片面(600字)で、修正する必要のある文字10字あれば、もう認識度は低いので、元の画像を取る段階からの工夫が必要です。DPIの精度を上げるよりは下げたほうがよいことがあります。私の経験(私のソフトも機械も古い)では、新聞の読み込みが、もっとも条件の悪いレベルになります。新聞の紙の色と文字の色がモノクロレベルではっきりと取れないと、概ね認識で失敗します。私は、一般書籍なら、OCRで99%レベルまでの認識で仕事をしています。 ためしに、まず、メーカー側やソフト会社のフォルダに、サンプル画像が入っているはずですから、それで試してみてください。それで、コツをつかんでください。皆さん、認識率のことばかり言いますが、その前の段階が大事です。 参考にしたところ: http://panasonic.co.jp/pss/pstc/products/yomikaku/feature_3_1.html
その他の回答 (2)
- Wendy02
- ベストアンサー率57% (3570/6232)
こんにちは。 「読取革命」ということは、キャノン系の総合型プリンタでしょうか? 「読取革命」は使ったことがありませんが、評判は良いようです。 まず、どの程度の「文字化け」なのか分かりませんが、全部が文字化けという場合は、言語の選択を間違えていることがあります。また、縦横の認識自体を間違えていることがあります。 また、一部が文字化けの場合は、文書の傾きあったり、画像の彩度が低くすぎることがあります。通常は、自動設定になっていて、画像のゴミや彩度の補正はしてくれるはずです。 編集の仕方は分かりませんが、ソフト側で選ばせる方式と手動で直す方法とあります。手動で直す方は学習機能がありません。ソフト側で選ばせると学習機能がありますが、後者は時間が掛かります。 使いこなしレベルが低い人は別して、私の経験では、一般の単行本レベルでしたら、初回で95%ぐらいの認識率です。逆に、良くないのは、TIMEやNews Week など英文マガジンの特殊フォントでした。(OCR =optical character recognition 光学式文字認識,『読取革命』などのソフトウェア)私のは、スキャナーもOCRソフトも、かなり古いものです。それでも、95%以上は取れます。
- uro_tan
- ベストアンサー率15% (6/40)
OCRは画像を解析して文字化するソフトウェアなので、複雑な文字や似た文字がある場合には正しく解析できないことがあります。 OCRが間違えた文字を探して直してあげて下さい。
お礼
ありがとうございます。では、文書を編集するには何を買ったらよいのでしょうか。 OCRてなんですか。
お礼
くわしいアドバイスありがとうございます。 「読取革命」ということは、キャノン系の総合型プリンタでしょうか? はい、そうです。文字化けもほとんどです。いろいろ試しているのですがまだ、うまくできません。