• ベストアンサー

本の文字をスキャナしてそれをパソコンの文字に変換する方法。

国語のテストを作りたいのですが、参考書の文字をすべて打つのは大変です。そこで、その参考書をスキャナして(そのままでは書体が違うので)、その文字を読み込んでパソコンのワードとかに出す方法を教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • amukun
  • ベストアンサー率31% (611/1955)
回答No.1

OCRソフトで読み取ります。 スキャナをお持ちならOCRソフトがバンドルされていると思いますが・・・ ただし100%読み取れるわけではないので、手打ちでの修正が必要です。

その他の回答 (6)

  • vowow
  • ベストアンサー率56% (88/155)
回答No.7

 はじめまして。  以前、仕事の関係でOCRソフトからのデータ取り込みをやりましたが、認識率の悪さに辟易した記憶があります。メーカーは90何パーセントの認識率・・・ などと言いますが、体感的には認識率は遥かに悪いです。  99パーセントの認識率というのは、私の経験則上あり得ません。  #5さんのご紹介された論文の実際の条件設定がよくわかりませんが、よほど奇麗にスキャンした、傾きの無い明瞭な活字であればそこそこいくのでしょうが、原稿の数が多くなってくれば、ある程度斜めになったりするものも出てきますので、実務上は更に悪化します。  体感上は「1000文字あれば10文字は正確に認識されない」というよりは、「毎回1パーセントは失敗する可能性が常にある」が実際に近いのではないかと思います。  ということは、その失敗が結構な頻度で続いて発生する可能性もあるわけです。  特に、スキャナに付属のソフト程度であれば、到底実務に耐えられるとは思えません。  実際にやってみてわかったのですが、修正は必ず出てくるのですが、「まず修正箇所を見つける」という作業があった後「実際の修正」という作業があります。  これが非常に煩雑なのです。それだったら、一から手打ちでやった方がまだまし・・・ と何度思ったかわかりませんでした。  それ以前に、データ化されるのは参考書からの転用らしいですが、著作権は大丈夫ですか?参考書も立派な著作物です。

asao2345
質問者

お礼

みなさんありがとうございました。

  • 4G52GS
  • ベストアンサー率71% (1969/2770)
回答No.6

他の方が言われているように、スキャナに付属している(はずの)OCRソフトを使うのが一般的でしょう。 取説にそういった記載があるはずですので、確認しましょう。 使い方のコツですが、縦書き、横書きの自動識別は非常に難しく、変換効率も大きく落ちます。 画像として読み取った段階でペイントなどで切り分け、OCRにかけると、良いでしょう。 変換後はOCRソフトの画面に文字として表示されるはずですので、「編集」→「すべて選択」→「コピー」として、Wordなどを立ち上げ、「編集」→「貼り付け」でよいはずです。

  • tatsumi01
  • ベストアンサー率30% (976/3185)
回答No.5

少し前ですが、日本語OCRの性能を比較した論文があります。最高で99%、最低で97%です。99%だと凄いと思うかも知れませんが、1ページに1000字あるとすると10字は間違っているわけです。修正は結構大変です。 また、OCRが間違うときは似た字に間違うので発見するのが大変です。「ト→卜」、「へ→ヘ」、「ぱ→ば」なんて、間違っているかどうかわかりますか。テスト問題の印刷ならどうでも良いかも知れませんが、検索のように文字コードが正しくないと困る場合には問題になります。

参考URL:
http://www.is.kyusan-u.ac.jp/~nakano/sub2/articleW.htm
  • inaken11
  • ベストアンサー率16% (1013/6245)
回答No.4

http://www.vector.co.jp/soft/win95/writing/se277726.html?g スキャナにおまけソフトでOCRソフト付いてませんでしたか? 参考URLのソフトで試用してみてはいかがでしょう。

参考URL:
http://www.vector.co.jp/soft/win95/writing/se277726.html?g
  • dadacya
  • ベストアンサー率26% (132/492)
回答No.3

OCRソフトですね。 スキャナにバンドルされてませんでした? AIソフトの「読んでココ!」なんか有名です。

  • kikiki99jp
  • ベストアンサー率12% (132/1021)
回答No.2

スキャナにOCRソフトはついていませんでしたか。 簡単な変換ぐらいはできますが。