- 締切済み
書類・書籍のPDF化に伴いOCR化すべきか
書類・書籍のPDF化に伴いOCR化すべきか教えてください 業務などで使用していた 書類・書籍などがかなり多くなってきたので スキャンしPDFにしようと思っております。 この場合、PDFにする場合、OCR認証という文字認識ができるようですが 文字認識をした場合 文字認識をしない場合 容量にどれくらいの差がありますでしょうか。 保存予定の書類をデータ化した場合の目安ですと OCR認証せずに普通に読み取ると40MB程度でした。 こちらをOCR認識するとある程度の保存容量の変化 ございますでしょうか、 目安で構いませんので、教えてください。
- みんなの回答 (5)
- 専門家の回答
みんなの回答
- 19satoru75
- ベストアンサー率18% (46/251)
書類や書籍に書かれた内容をコピペして引用したりするならOCR化した方がいいです。
- tetsumyi
- ベストアンサー率25% (1948/7539)
スキャンして読める程度に解像度を落としてJPG画像をPDFにすれば良いのでは。 OCR化すると形状が変るので好ましくない。
- 121CCagent
- ベストアンサー率52% (15558/29898)
PDFファイルのOCR化するとファイルサイズは激増するのか? https://ameblo.jp/japanscanservice/entry-11388988961.html dpiとOCR設定時のファイルサイズの違い https://www.book-scan.net/scan/dpitoocrsetteijinofairusaizunotigai.html などは検索すると出ては来ますね。 >容量にどれくらいの差がありますでしょうか。 大して容量に差はない気はしますがOCRをした場合は数%位は容量が増える場合が多いのかな?とは思いますが。 とは言え1つのファイルでは僅かな容量差でも塵も積もれば山となるでは無いですが数が増えればそれだけ容量は喰うようにはなりますね…
- are_2023
- ベストアンサー率32% (1003/3077)
OCRとはOptical Character Recognitionの事でPDFや写真などから文字を読み出しテキストに変換する事です OCRは文字しか扱わないのでPDFの中のグラフや図は無視されます 文字だけの書籍ならOCRでテキストにする方がファイルサイズは小さくなりますが、段落や字体の変化は無視されます
- t_ohta
- ベストアンサー率38% (5241/13712)
PDF内をテキスト検索したいのであればOCRでテキスト起こししておくべきですが、テキスト検索しないのであればOCRは不要です。 ファイル容量はテキスト量次第ですが10%くらい増える印象ですね。