• ベストアンサー

【MFC-J6983CDW】PDFをOCRしたい

■製品名を記入してください。 【MFC-J6983CDW】 ■どのようなことでお困りでしょうか?  相談したいこと、トラブルに至った経緯、試したこと、エラーなどを教えてください。 【OCRされていないPDFファイルに対してMFC-J6983CDWの  OCR機能を利用してOCRできないでしょうか。  つまり、下記はできないでしょうか。   PDF(OCRなし) → iPrint&Scan → PDF(OCRあり)  紙を資料をスキャンする際にiPrint&Scanを使用して  OCR化しており、本ソフトのOCRの正確性が非常に  高く満足しています。  ただ、OCR化されていないPDFファイルがあり、  このPDFファイルをどうにかOCR化できないか検討  しています。いろいろフリーソフトなどでOCR化を  試してみたのですが、正確性がいまいちでした。  iPrint&Scan(またはControlCenter4)のOCR機能を  利用して、正確にOCR化されたPDFファイルを  生成できないでしょうか。 】 ■お使いの環境について教えてください。 ・パソコンもしくはスマートフォンのOSは何ですか? (例)Windows10/8.1/7・MacOS・iOS・Android 【Windows10】 ・どのように接続されていますか? (例)有線LAN・無線LAN・USBケーブル・bluetooth 【有線LAN】 ・関連するソフト・アプリがあれば教えてください。 【iPrint&Scan、ControlCenter4】 ・電話回線の種類は何ですか? (例)アナログ回線・ISND回線・ひかり回線・IP電話 【ひかり回線】 ※OKWAVEより補足:「ブラザー製品」についての質問です。

質問者が選んだベストアンサー

  • ベストアンサー
  • 121CCagent
  • ベストアンサー率52% (15527/29843)
回答No.1

https://support.brother.co.jp/j/b/producttop.aspx?c=jp&lang=ja&prod=mfcj6983cdw こちらですね。 原稿の文字をテキストデータとしてスキャンする(OCR) https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-3538B62F-E095-4172-82F7-6AF040E8B7A3_85 スキャンする時に同時にOCRをすることは出来ますが既にPDFファイルとして保存済みのものをOCRするような機能は無いです。 PDFをGoogleドライブで文字認識させる方法 https://blog.mc-copy.jp/pdf/pdf-character-recognition-google/ みたいなのを利用するとか…

yyooaa
質問者

お礼

回答ありがとうございます。 やはり、難しそうですか。。。 現状、下記を行うことで対応しています。 1) PDFをJPGに変換 2) tesseractでPNGをOCRしてPDFに変換 上記の対応により、PDFを開いてCTRL+Fから検索は できるのですが、コピー&ペーストすると、余計な スペースなどが多く含まれてしまいます。。。

その他の回答 (3)

回答No.4

なるほど、誤解したあさってな回答失礼しました。 ブラザーさんのOCR技術はスキャン時のものなので できないですね。

yyooaa
質問者

お礼

ご回答ありがとうございました。 やはり、PDF→PDFのOCRはできなさそうですね。 ちなみにBrotherさんから提供されている ソフトウェアで下記があります。  ・Presto PageManager  ・Nuance PaperPort これらのソフトウェアではPDF→PDFで OCRの機能がありました。ただ、結果が 正確な場合とそうでない場合の差が大きく、 利用を諦めました。

回答No.3

保存をクリックした後、 保存のダイアログボックスで  ファイル形式選択で  サーチャブルPDF マルチページ (*.pdf) が選べるかと思うのですが。 https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-8BD3959D-9D42-48D7-A086-34631BA42A53_110

yyooaa
質問者

補足

ご返信頂きありがとうございます。 ご指摘頂いた手順に辿り着くことが できていません。。。 ご提示頂いたURLは「スキャン」機能の説明かと 思います。ただ、私の理解ではこの画面から できることは下記の認識です。  1)【できる】紙 → PDF  2)【できない】PDF → PDF 今回私が行いたい作業は2)となります。 手元に紙があれば1)の方法でサーチャブル PDFを生成できるのですが、今回のケースでは 紙が手元になく、電子データ(PDF)のみが 手元にある状態です。

回答No.2

なるほど、ブラザーさんのOCR機能が優れているんですね。 OCR化されたPDFが サーチャブルpdfへの出力であるなら ControlCenter4 Homeモードのスキャン設定 でできます。https://support.brother.co.jp/j/s/support/html/cv_mfc6583cdwa_jpn/doc/manual/index.html#GUID-7BA06984-74D2-47D5-B5E8-A790DF77647E_112 ーーーーーー 透明テキスト付きPDF(Searchable PDFと呼ばれることもあります) https://www.antenna.co.jp/pdf/reference/whats-searchable-pdf.html スキャンした画像だけのPDFにもかかわらず、文字を検索したり、コピーが可能な場合があります。こうしたPDFは透明テキスト付きと呼ばれ、紙文書の電子化に欠かせない仕組みのひとつと考えられています。

yyooaa
質問者

補足

回答ありがとうございます。 下記の手順を具体的に教えて頂けないでしょうか。 >OCR化されたPDFが >サーチャブルpdfへの出力であるなら >ControlCenter4 Homeモードのスキャン設定 >でできます。

関連するQ&A