- ベストアンサー
【MFC-J6983CDW】PDFをOCRしたい
■製品名を記入してください。 【MFC-J6983CDW】 ■どのようなことでお困りでしょうか? 相談したいこと、トラブルに至った経緯、試したこと、エラーなどを教えてください。 【OCRされていないPDFファイルに対してMFC-J6983CDWの OCR機能を利用してOCRできないでしょうか。 つまり、下記はできないでしょうか。 PDF(OCRなし) → iPrint&Scan → PDF(OCRあり) 紙を資料をスキャンする際にiPrint&Scanを使用して OCR化しており、本ソフトのOCRの正確性が非常に 高く満足しています。 ただ、OCR化されていないPDFファイルがあり、 このPDFファイルをどうにかOCR化できないか検討 しています。いろいろフリーソフトなどでOCR化を 試してみたのですが、正確性がいまいちでした。 iPrint&Scan(またはControlCenter4)のOCR機能を 利用して、正確にOCR化されたPDFファイルを 生成できないでしょうか。 】 ■お使いの環境について教えてください。 ・パソコンもしくはスマートフォンのOSは何ですか? (例)Windows10/8.1/7・MacOS・iOS・Android 【Windows10】 ・どのように接続されていますか? (例)有線LAN・無線LAN・USBケーブル・bluetooth 【有線LAN】 ・関連するソフト・アプリがあれば教えてください。 【iPrint&Scan、ControlCenter4】 ・電話回線の種類は何ですか? (例)アナログ回線・ISND回線・ひかり回線・IP電話 【ひかり回線】 ※OKWAVEより補足:「ブラザー製品」についての質問です。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
https://support.brother.co.jp/j/b/producttop.aspx?c=jp&lang=ja&prod=mfcj6983cdw こちらですね。 原稿の文字をテキストデータとしてスキャンする(OCR) https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-3538B62F-E095-4172-82F7-6AF040E8B7A3_85 スキャンする時に同時にOCRをすることは出来ますが既にPDFファイルとして保存済みのものをOCRするような機能は無いです。 PDFをGoogleドライブで文字認識させる方法 https://blog.mc-copy.jp/pdf/pdf-character-recognition-google/ みたいなのを利用するとか…
その他の回答 (3)
- sidebank201509
- ベストアンサー率57% (773/1355)
なるほど、誤解したあさってな回答失礼しました。 ブラザーさんのOCR技術はスキャン時のものなので できないですね。
お礼
ご回答ありがとうございました。 やはり、PDF→PDFのOCRはできなさそうですね。 ちなみにBrotherさんから提供されている ソフトウェアで下記があります。 ・Presto PageManager ・Nuance PaperPort これらのソフトウェアではPDF→PDFで OCRの機能がありました。ただ、結果が 正確な場合とそうでない場合の差が大きく、 利用を諦めました。
- sidebank201509
- ベストアンサー率57% (773/1355)
保存をクリックした後、 保存のダイアログボックスで ファイル形式選択で サーチャブルPDF マルチページ (*.pdf) が選べるかと思うのですが。 https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-8BD3959D-9D42-48D7-A086-34631BA42A53_110
補足
ご返信頂きありがとうございます。 ご指摘頂いた手順に辿り着くことが できていません。。。 ご提示頂いたURLは「スキャン」機能の説明かと 思います。ただ、私の理解ではこの画面から できることは下記の認識です。 1)【できる】紙 → PDF 2)【できない】PDF → PDF 今回私が行いたい作業は2)となります。 手元に紙があれば1)の方法でサーチャブル PDFを生成できるのですが、今回のケースでは 紙が手元になく、電子データ(PDF)のみが 手元にある状態です。
- sidebank201509
- ベストアンサー率57% (773/1355)
なるほど、ブラザーさんのOCR機能が優れているんですね。 OCR化されたPDFが サーチャブルpdfへの出力であるなら ControlCenter4 Homeモードのスキャン設定 でできます。https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-7BA06984-74D2-47D5-B5E8-A790DF77647E_112 ーーーーーー 透明テキスト付きPDF(Searchable PDFと呼ばれることもあります) https://www.antenna.co.jp/pdf/reference/whats-searchable-pdf.html スキャンした画像だけのPDFにもかかわらず、文字を検索したり、コピーが可能な場合があります。こうしたPDFは透明テキスト付きと呼ばれ、紙文書の電子化に欠かせない仕組みのひとつと考えられています。
補足
回答ありがとうございます。 下記の手順を具体的に教えて頂けないでしょうか。 >OCR化されたPDFが >サーチャブルpdfへの出力であるなら >ControlCenter4 Homeモードのスキャン設定 >でできます。
お礼
回答ありがとうございます。 やはり、難しそうですか。。。 現状、下記を行うことで対応しています。 1) PDFをJPGに変換 2) tesseractでPNGをOCRしてPDFに変換 上記の対応により、PDFを開いてCTRL+Fから検索は できるのですが、コピー&ペーストすると、余計な スペースなどが多く含まれてしまいます。。。