- 締切済み
PDFのOCR化でファイルサイズが小さくなる理由
以下の質問に回答して下さった方、有り難うございました。 何かの手違いで、お礼を言うおうとしたら、会員IDまたはパスワードが違うといわれ、はねられてしまいます。 なので、これを利用してお礼を言わせていただきます。 ------------------------------- 暇なときにでも すみません。 どなたか、回答よろしくお願いします。 印刷されたドキュメントをスキャンして、PDFファイルで保存した後、スキャンソフトにOCR化の機能が付いていたので、OCR化すると、ファイルサイズがかなり小さくなりました。 これはなぜでしょうか。 最初は、画像データが文字コードに置き換えられたからだと思っていたのですが(OCRの原理を調べてもそのようなことが書いてあったので。)、そのファイルの文字をみても、文字の形(フォント等、かすれ具合等)はどうみてもOCR化される前の画像データ?と変わりません。 そうすると、OCR化したファイルは、文字の画像データとこれに対応する文字コードデータを持たなければならなくなり、かえってデータ量が増えるような気がします。 でも、現実には減少しているので、いったいどのような仕組みになっているのでしょうか。 そもそもPDFファイルの仕組み(まったくの画像データではないようですね。)や、OCRの理解が不十分なので、よけい分からないのですが、初心者にも分かるようにご説明いただけたら有り難いです。 よろしくお願いします。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- Hoyat
- ベストアンサー率52% (4897/9300)
DTP屋です。 「OCR化をしたからファイルサイズが小さくなった」のではなく、「OCR化したさいの再保存の際のPDF変換設定により最適化がなされてファイルサイズが小さくなった」だけです。 スキャンして保存した時点ではスキャンした時の解像度が生かされます。ですがOCR処理して再保存した際に最適化処理により「画像の圧縮率」が変わったか「画像解像度」が変わったからです。 何が変わったのかの詳細については「PDF変換設定」を確認しないと分かりませんけどね。
- ozunu
- ベストアンサー率14% (240/1644)
この手の投稿は、一見礼儀正しい好ましい投稿に見えますが、実は規約違反・ルール無視の削除対象投稿です。 あ、もちろんこの回答もネ。