• 締切済み

Adobe Acrobat 7.0 StandardによるPDF作成時の設定について

Adobe Acrobat 7.0 Standard についての質問です。 シートフィーダー付のスキャナーで取り込んだマルチページTIFF画像(1)(白黒2値,600dpi A4,CCITT Group4圧縮)を、Adobe Acrobat 7.0 Standard で 設定を [環境設定-PDFへの変換-TIFF-白黒圧縮-JBIG2(劣化あり)]で読み込み、PDF形式で保存(2)すると、元のマルチページTIFFファイルと比較して容量が2/3くらいになります。 このPDFファイルの全ページを、OCRを使用してテキストとして認識[設定 言語:日本語-PDFの出力形式:検索可能な画像(非圧縮)-ダウンサンプリング:最低(600dpi)]の処理をした後に、保存しなおす(3)と、元のマルチページTIFFファイルと比較して容量が1/3~1/5くらいになるにもかかわらず、最初のPDFファイルから画像の劣化は全くありません(見分けがつきません)。 具体的にいうと、A4白黒10ページのある文書の場合、 (1)マルチページTIFF(白黒2値,600dpi A4,CCITT Group4圧縮): 1575 KB (2)PDF-無処理(JBIG2劣化あり): 1014 KB (3)PDF-OCR処理(圧縮??): 431 KB ここで2つ質問があるのですが、 I. (1)から(2)で容量が減少するのはJBIG2圧縮のおかげだと思うのですが、(2)から(3)で容量が減少するのはなぜなのでしょうか? II. また、マルチページTIFFをPDFに変換する際、OCR処理を経ずに(2)から(3)のような圧縮?を実現することは出来ないでしょうか?(ダウンサンプリングは無しで) 全ページのOCR処理はすごく時間がかかるのですが、現状では、ファイルの容量を減らすために仕方なく実施しています。 また、マルチページTIFFをスタートにしなくても構わないので、紙の白黒書類を上記と同等以上に圧縮してPDFとする方法をご存知でしたら、ご教授願います。 よろしくお願いします。

みんなの回答

noname#40524
noname#40524
回答No.1

OCR処理に就いては詳細は不明ですので適切なお答えは出来ませんが。 以前した時は『白/黒 2値』で取得しています。 OCR処理ソフト等は『白/黒 2値』で取得して変換していますね。 却ってカラー情報、グレースケール情報が有るとOCRソフトでテキスト 変換した時に誤認識しました。

hidkam
質問者

お礼

ありがとうございました。 しかし、OCR処理における画像圧縮に関して知りたいので、 回答の募集は継続させていただきます。