- ベストアンサー
ビジネス書類の電子化スキャナーの使い方
- ビジネス書類をiPhoneで持ち歩きたい方へ。大量の書類を処理するにはどのスキャナが適しているのか、書類のdpiは何が最適なのか、PDFへの変換方法と圧縮率についてもご紹介します。
- OCRの実用性について、Camscannerと複合機、専用スキャナの違いも解説します。また、OCRされたPDFの並び替えや結合・分割による影響についてもお伝えします。
- ビジネス書類の電子化をスマートに行う方法をご紹介します。パソコンでPDFに変換し、iPhoneに保存して閲覧と編集を行い、クラウドにデータを保管しない方法も紹介します。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
ドキュメントスキャナというものが最適です。 定番はこれ http://scansnap.fujitsu.com/jp/ 私はScanSnap S1500を使用していますがdpi値はほぼ決められてます。迷うことはないしデフォルト値でまったく問題ありません。 スキャン時にOCR処理を行うことも可能。OCR可能かどうかは保存形式に依存。 JPEGからOCR処理をするためにはOCRソフトが必要ですが持っているのですか? 問題点は、裁断が必要ということ。 データ化した書籍は捨てるつもりなら裁断に躊躇はないでしょうが、きちんとした裁断機を買うとなると結構な値段になる。 私は裁断機は使用せず、大型のカッターナイフと定規で裁断してますけど… ScanSnap S1500のADFは楽ですよ。 2枚以上を同時に吸い込むことは殆ど無いし、複数枚吸い込んだとしても警告表示が出て用紙をセットしなおして再開するのも簡単。 詳しく知りたければこちらを読んでください。 http://pc.watch.impress.co.jp/docs/column/ebook/20121119_573985.html http://pc.watch.impress.co.jp/docs/column/ebook/20121206_577488.html
その他の回答 (3)
- shintaro-2
- ベストアンサー率36% (2266/6245)
#3です >でも、ひとつ解像度をあげると600dpiと倍なのでファイルサイズも倍? 縦横600dpiですので、データ量としては4倍になります。 OCRをするには、文字サイズに対し適切なスキャン解像度が存在します。 大体、200~400dpiです。 フォントが5ポイント程度の場合には600dpiとかが必要な場合もあります。 ですので、誤変換を避けるのであれば、300dpi固定で良いと思います。 http://www.adobe.com/jp/joc/a9guide/tips/sakusei/page03.html >OCRはAcrobatでかけたほうがファイルサイズや精度で有利? AdobeのOCRよりは、読取革命の方が優秀と思います。 スキャンスナップのOCRの機能をPDFに適用するというのであれば、未検証 >4.OCRをかけるとして、ScanSnap OrganizerよりAcrobatXなどの方が精度が高い? 怪しい
お礼
現状持っていない&最終目的がiPhoneで持ち運ぶので 精度のよい読取革命はあきらめて AcrobatでPDFのOCRをClearScanでファイルサイズを縮めることを 優先しました。 でも、とても勉強になりました。 ありがとうございます。
補足
長さで2倍で面積で4倍だからファイルサイズでも4倍わかりました。 現状の理解は 1.大量の書類を処理するのには紙送りのある専用スキャナが便利。 2.スキャナの時にdpiは300dpiで大丈夫。 →ただし、iPad mini Retinaの324dpi(予定)より低い300dpiのため 将来は今のiPad Retinaで150dpiの自炊の閲覧のように妥協できる程度の綺麗さになるのは 今年の第三四半期くらいまでから確定予定。 でも、ひとつ解像度をあげると600dpiとデータサイズ4倍かつ 取り込み時間も2倍以上~4倍近くなるため現状低圧縮300dpiが妥協点。 3.JPGで取り込むより最初からPDFに変換して OCRはAcrobatでかけたほうがファイルサイズで有利。 しかし、OCR精度は「読取革命」の方が上。 4.OCRをかけるとして、ScanSnap Organizer等スキャナー添付とAcrobatXはあまり変わらないかも? Acrobatでは600dpiの1枚PDFをClearScanで処理した後、 ファイル結合するのが綺麗さ優先時にファイルサイズでベスト? また、解像度が足りないとClearScanで線が消えたり、斜めになったりと暴走報告あり ◯ClearScanがOCRだけでなく、まったく違う文字にならないか心配です。 5.OCRのかけられたPDFを他のアプリでいじって問題が起きれば後でAcrobatXで透明テキストの削除と 再OCRをかければよい? ◯ClearScanの破損が心配です。 そろそろ、Acrobatの問題になってきたようなので、 夜にはこの質問終了します。 みなさんありがとうございます。
- shintaro-2
- ベストアンサー率36% (2266/6245)
>EPSONの複合機のPDFの並べ替えが出来ない弱点と違い、 PDFで保存する直前に、 並べ替え、回転、削除が可能です。
お礼
エプソンの複合機のこと 教えてくださってありがとうございます。 教えてくださらないと誤解したままでした。
補足
EPSONの複合機は保存の直前には並べ替え、回転、削除可能ですね。 確認しました。 ありがとうございます。 正確にはScanSnap S1500などAcrobat付属なら WinPCでPDFにした後からでも並べ替え、回転、削除、結合、分割等可能 とソフト的メリットがあるですね。 これまででの理解は 1.大量の書類を処理するのには紙送りのある専用スキャナが便利。 2.スキャナの時にdpiはデフォルトで大丈夫らしい? →しかしiPad mini Retinaの324dpi(予定)より低い300dpiにやや不安です。 でも、ひとつ解像度をあげると600dpiと倍なのでファイルサイズも倍? 3.JPGで取り込むより最初からPDFに変換して OCRはAcrobatでかけたほうがファイルサイズや精度で有利? 4.OCRをかけるとして、ScanSnap OrganizerよりAcrobatXなどの方が精度が高い? その場合、Acrobatでは600dpiの1枚PDFをClearScanで処理した後、ファイル結合する? ClearScanがOCRだけでなく、まったく違う文字にならないか心配です。 5.OCRのかけられたPDFを他のアプリでいじって問題が起きれば後でAcrobatXで透明テキストの削除と再OCRをかければよい? ClearScanが壊れないか心配。 という所です。 1以外はクエスチョンが多いのは自分で調べて追加した部分のためです。 他にあれば教えてください。 よろしくお願いいたします。
- yasuto07
- ベストアンサー率12% (1344/10625)
今は、両面スキャナーがあるでしょう、私は富士通のエスシリーズですね。ocrの意味わかりますか、、、。 pdfにするのと、ocrで、テキストかするのは意味が違いますよ、と思います。 エスシリーズなら、一発、pdfになります。私のは一分で、10枚くらい、読み込みます。 300dpiで十分だと思いますよ。pc上で、画像編集するなら、150でも、72dpiでも、文字は読めます。
お礼
回答ありがとうございました。 iPhone用はオリジナルを別途保管の上で 必要に応じてAcrobatで150dpiに画質を落として持ち運ぶことにしました。 ありがとうございます。
補足
回答ありがとうございます。 両面スキャナーいいですね。 しかし、裏紙コピーの取り込み時に裏写りはどのように対策してられますか? OCRは Optical Character Recognition の略で光学文字認識のこと。 Optical Character Reader の略で光学式文字読取装置のこと。 EPSONの複合機の「読んでここ」でもそのまま文章化は難しかったですが、 OCRで透明テキスト付けておくと大量の資料から検索が楽かな?と思います。 文字だけなら、300dpiで良かったのですが、 グラフや図形、白黒写真、パワーポイントの点で色を表現が 時々あるので皆様の工夫をアドバイスいただければと思います。
お礼
最終的に富士通のScaSnapのS1500にしました。 最新のScanSnap iX500 FI-IX500が欲しかったけど予算が足りませんでした。 どのみちバージョンの違いはあれバンドル線用品とはいえAcrobatX(IX500ならXI) がついているので、スキャン時に 「画質の選択」 スーパーファイン 「カラーモードの選択」 グレー(どうでもいい書類は白黒) 「読み取り面の選択」 両面 「オプション」 すべてレ点をはずす。 「ファイル形式」 PDF(検索可能なPDFのレ点ははずす) 「画質」 最大(低圧縮) でスキャンして、それをAcrobatのClearScanで OCRでファイルサイズを小さくして (必要ならオリジナルは保管の上で、モバイル用は150dpiに画質を落として) iPhoneで運ぶことにしました。 ありがとうございました。
補足
回答ありがとうございます。 s1500いいですね。 EPSONの複合機のPDFの並べ替えが出来ない弱点と違い、 付属ソフトで対応可能ですね。 透明テキストも壊れても以下同文ですね。 OCRはiPhoneのアプリ(camscanner)です 後はスキャナの読み込み時のOCRの機能になります。 しかし、裏紙コピーの取り込み時に裏写りはどのように対策してられますか? デフォルトでグラフや図形、白黒写真、白黒のパワーポイントの点で色を表現は 大丈夫ですか? 専用機なら自動で文字と画像を区別するのかな? 良かったらその辺りも教えてください。