書籍PDF化：縦書き検索ができない（OCR済）

2011/02/01 11:45

このQ&Aのポイント

書籍をPDF化し、自分でOCRを掛けたが縦書きの検索がうまくいかない
他のアプリで試すと、縦書きは検索結果に表示されず、横書き部分の検索のみ可能
OCR時の設定に問題があるのか、検索するアプリが縦書きに対応していないのか疑問

mitsuwao23
お礼率68% (56/82)

画像・動画・音楽編集
回答数4
ありがとう数3

みんなの回答 （4）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

hokkaidor
ベストアンサー率100% (1/1)

2011/03/07 23:29 回答No.4

もうだいぶ質問の時から時間がたってしまいましたが，同じ悩みを持つ方が検索でここにたどり着くこともあるかと思いますので(私もそうでした)，書いておきます。実は私も全く同じ症状で困っていました。ScanSnapで自炊した本を，iPad上で主にGoodReaderを用いて読もうと思っていたのですが，Mac上で問題なく検索できる縦書きのOCR済みPDFファイルが，iPadのGoodReaderの検索に全くかかりません。横書きの本や縦書きの本の中にある図表ないの横書き文字は検索されます。どうも，iPad，iPhone上のアプリでは，まともに縦書きPDFファイルの検索に対応しているアプリがないようです。質問者さんの挙げておられるiBooksも http://books.campur.com/archives/438 に，縦書きのPDFは検索できないと書いてあります。私が見つけた，唯一縦書き検索に対応しているiPadのアプリとしては，「Bookman（無料）」がありました。しかし，これにも問題があります。（１）検索スピードが異様に遅い。普通の新書１頁を検索するのに５秒くらいかかるので，200頁程度の全文検索には，15分くらいかかってしまいます。（２）なぜか，OCRをAcrobat8でかければ検索にかかりますが，ScanSnap Managerでかけると，横書き以外，全く反応しません。OCRをかけるアプリケーションによっても違いが出るというのは困ったものです。やはりAcrobatを使っておくのが無難なのでしょうか？素人には，横でできるものがどうして縦でできないのか理解不能ですが，兎に角，現状では難しいようです。実は私自身はデジタル物に疎いので，他の方の訂正，追加情報を期待します。

質問者

お礼 2011/03/08 07:33

投稿してから見つけたサイトの中に（url 探してみましたが見つかりませんでした)「 MacはOSレベルでは縦書きをサポートしていないので、縦書き検索をするには、アプリが個別に対応している必要がある」と書かれていました。 OS X で対応されていないうことであれば、iOSでもされていないと考えるのが当然だと思うので、自分としては、現状ほとんどのアプリで検索できない事にも納得できました。Apple側の対応を待つしかない、ということでしょうかね。。ご回答ありがとうございました。

その他の回答 (3)

kokubosino
ベストアンサー率19% (697/3530)

2011/02/01 17:16 回答No.3

MacでAcrobat Proで縦書きって一番悪い組み合わせですはっきり言って駄目ですよ、あきらめましょう＾＾ PDFなんでそのまま読みましょうね、OCRだと識字率が悪いから

noname#142908

2011/02/01 12:12 回答No.2

まずAcrobatでは駄目な理由を明確にしてください Acrobatが一番適切なアプリです

質問者

補足 2011/02/01 12:32

理由ですが、pdf化した書籍はパソコンではなく、iPadで読む予定です。現在、縦書きpdfの検索に対応しているアプリがあるのかは、まだ調べていませんが、iBooksは横書きならpdfでも検索が可能で、今後アプリ自体がepubファイルの縦書き表示に対応するのに従い、縦書き検索も可能になると思います。その際の二度手間を防ぐために、いま自分の手順が間違えているのであれば教えて下さい、ということです。

yasuto07
ベストアンサー率12% (1344/10625)

2011/02/01 11:56 回答No.1

なぜ、加工利用を想定していたのに、PDFにしたしまったのですか？、これは印刷イメージの意味ですよ。二次加工には、向かないのです。意味を理解していますか？。本来は、書籍３００冊、業者に頼むなら、テキスト文にしてもらえばよかったのに。 PDFの文章の検索なて、どう考えても、うまくいくはずがありませんよ。 PDFを、OCR、テキスト文に直しているかなにかしているのですか、二度手間、三度手間を感じます。

質問者

補足 2011/02/01 12:51

あまり、詳しくないのは事実ですが、手順が間違えてるとも思えません。 OCRテキスト認識では、スキャナなどで取り込んだ画像形式のPDFを検索可能な文字列として変換させる機能です。 http://blog.m-school.biz/article/122983491.html また、頼んだ業者さんでも同じ手順を踏んでいるはずです。基本料金として（PDF化）一定額がまず設定されており、オプションでOCRの追加が選べる形です。取り込みのスキャナーは持っていないのですが、acrobatは持っていたため、今回は自分でOCR処理することにしたのです。また、PDF内の検索も横書きであれば、一切問題ありません。うまくいくはずがない、とはどういう意味でしょうか？ PDFにOCR処理をして、テキスト内検索は、googleなどで検索する限りとても一般的に思えます。今回は、それがうまく行かないのでここで尋ねているのです。

書籍PDF化：縦書き検索ができない（OCR済）

書籍PDF化：縦書き検索ができない（OCR済）