• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:PDFの余白、黄ばみ除去等の加工について)

PDFの余白、黄ばみ除去等の加工について

このQ&Aのポイント
  • 印刷会社が受け取った書籍をpdf化し、売るという事業を展開しています。pdfの加工方法として、余白の除去や文字のくっきり化、黄ばみ除去などがあるようです。
  • 具体的には、サイト「http://www.scapon.jp/tuning.html」を利用して、サーバーサイドのプログラミングを使ってpdfのチューニングを行うことができます。
  • しかし、この技術は難しいとされ、良い情報がなかなか得られずに詰まってしまっています。質問者は、どのような方法を使ってこの加工を実現しているのか知りたいとしています。

質問者が選んだベストアンサー

  • ベストアンサー
noname#208507
noname#208507
回答No.1

PDFの加工は分かりませんが、チューニングの内容については画像処理の知識とOpenCVやHALCONのような画像処理パッケージがあれば実現可能でしょう。 「余白除去」は処理の内容が、Webページに少し書いてありますね。あらかじめメディアン・フィルタなどでノイズを除去しておいて、後からトリミングしていると思います。 「文字くっきり」は、何らかのエッジ保存平滑化フィルタを使っているのでしょう。バイラテラルフィルタを何度かくり返し適用するか、Kuwahara filterのような絵画調の効果が得られる処理を使っているのではないかと。 「黄ばみ除去」は、モノクロの文書ならグレー変換した後に大津の二値化を適用するなり、K平均法などで白黒に二値化するなど色々と考えられます。濃淡のある文書では、黄ばみをセグメンテーションするような、もっと凝った方法が必要でしょう。 恐らく「裏写り・地色除去」も「黄ばみ除去」と似たような手段をとっていると思います。あくまで全て想像ですが。

関連するQ&A