• 締切済み

OCRソフトで作成した「透明テキスト付きPDFファイル」の,あまりにも《巨大》なファイル・サイズ

 諸先輩方に質問させていただきたく存じます。  これまでバインダーに綴じていた,ある1冊の単行本のコピーを電子化しようと思い,富士通の「ScanSnap S510」というスキャナで取り込み(白黒・600dpiの画質),取り敢えずPDFファイルにしました。A4×230枚で,ファイル・サイズは47MBです(画像データのサイズとしては常識的だと思います)。  このファイルを,「e.Typist(version 12.0)」というソフトを使って「透明テキスト付きPDF」に変換したところ,ファイル・サイズが,同じA4×230枚であるのに,何と946MBにもなってしまいました(もとのサイズの20倍)。小さい文字がびっしりの原稿ですが,そうだとしても,あまりにも大きすぎるサイズではないかと思います。  今回は,もともとのPDFファイルのイメージ・レイアウト等を動かしたくなかったので,(1)PDFファイルから画像を読み込む→(2)文字を認識させる→(3)認識結果をAdobe Acrobatに転送する(再びPDF化する),という手順を踏みました。  もちろん,文字を認識させた後,いったんWORDファイルに変換したうえで,改めてPDF化すれば,ファイル・サイズを大幅に小さくできるのは承知しています。  しかし,やはり,もともとの書籍のイメージ・レイアウト等を崩したくありません。この場合,ファイルのサイズが,このように巨大なものになってしまうのは,避けられないことなのでしょうか。    ご教示いただければ幸いです。

みんなの回答

  • wand88
  • ベストアンサー率20% (409/1958)
回答No.1

e.TypistでもAcrobatでも小さくする事は可能 オプションの設定方法をちゃんと見ましょう

Laza2006
質問者

お礼

ご教示ありがとうございます。設定方法の詳細を調べた結果,PDFファイルからの画像の読み込み方法が,「フルカラー」モードになっていることに気付きました。「白黒」モードに切り替えたところ,解像度を全く落としていないにもかかわらず,変換後のファイル・サイズは,逆に小さくなって,33MBになりました。お恥ずかしい限りです。いずれにせよ問題は解決しました。どうもありがとうございました。

関連するQ&A