- 締切済み
自炊:電子書籍化
- 自炊代行の見積もりは1冊当たり400円で、120万の予算がかかるが納期は3ヶ月以上かかる。
- 自分で自炊するためにはOCRソフトが必要で、InDesignに対応できるものが良い。
- PDFになっている書籍もOCR化することができるのか疑問。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- lupin-333333
- ベストアンサー率31% (294/933)
>InDesignは業者だけが使うんですか 揚げ足とられているような言い方で、・・・・。 まあ、いっか。 誤解をあたえたようですが、このソフトはDTPの世界でも、本や雑誌、新聞等、特定のフォーマットで業務に耐えられる編集ソフトです。だからと言って、業界で多数使われていると限りませんが、その分素人には扱いにくく、ほとんど機能を使えずにいます。 しかも一般の方は、そのソフトの存在さえしりません。しっていても、イラストレーターぐらいです。 なにせ、エディター(MS-Wordなど)と、このソフトの違いさえ理解してもらうのに苦労するほどです。 誰かが「メジャー」とほざいていましたが、それは特定の業界に限ってですよね。私の周りで知っている人いません。会社でも、1割いるかどうか(1万人以上いるIT関連企業ですが)。 ホトショップを知っている方でもこのソフトの名前知っている人はかなり少ない。いや知らないでしょう。しかも、何のカテゴリーで、どこが違い、どこにすぐれているのか(法人だとパッケージで買うので、有ることは理解しているようですが、ほとんど使っていませんと言う回答でしたよ)。理解しているひとなんて、 デザインルームや、マニュアル等取り扱う部署、総務課ぐらです。あと、設計関係の人もしっていたな。 事務系や、工場で働いている人、学生、など一般の方が知っている人はほとんどいません。それでメジャーて言うですかね。 そういった意味で、知っている人で、これに対応した物なんて言う発言だと、(1)~(7)内容とそぐわない。 捕捉をみたらやっぱりそうでしたね。 >当然有料。1冊10円。100冊切るのに10分かかっていませんでした。 カバー帯取る私のほうが時間掛かっていました 個人でやっても同じですよ。全部とって、切る前の段階までが時間がかかり、だいたい20~30ページぐらいになるように並べて、切ってゆくだけですから、切るのは1回10秒程度、300ページで2分前後ですか。1冊3分もあれば、切れますよ。100冊で半日もあれば、できますね。 特定の本であれば、いいですが、雑誌や、写真集、高い物安い物、まあ業者だと、丁寧にやってくれるところはないですね。雑誌なんか10mm前後カットしますからね。 それから、 >本をデータ化する目的は販売や人に読んでもらうことではなく自分が持っている書籍を物理的に小さくすることが目的です ですが、コピー屋はみなさん、そういいます。レコードのレンタル屋(1970年代のこと)、ビデオのれんたる屋、などから始まって、業務用コピー機の普及が拍車をかけ、最近はYouTubeまで、みなさん 個人の所有、見る事を目的 として、始まっています。その都度各業界側の団体が妥協案をだしてきています。問題なのは、個人で楽しむ物と、販売等、営業目的での所有の区別にあります。 麻薬等でも、ある程度の量以上をもっていると、営利目的で起訴されます(嫌疑がかけられる問いこと)。他の証拠と、その量でアメリカだと、ほぼ有罪になります。中国、タイだと、他の証拠がなくても、営利目的として、有罪、死刑です。 つまり、何がいいたいかと言えば、特殊な状況で無い限り、大量の保有、コピー等はありえないということです。 3000冊ですか。いや5000冊以上。 個人保有の本だと、研究者、小説家、古書マニアなど、専門家でないと、ありえない数字ですよね。訴えられたら、あなたは証明できますか? と言うことです。 もし、著作権とうの団体が妥協するとしたら、その辺になるのではないですか。冊数制限、在る程度以上は誓約書等にサインの上、身分照会を含む。なんてね。
- softbankHawks
- ベストアンサー率66% (1057/1598)
私が自炊をやるなら、背表紙の裁断機と富士通のScanSnapを使うでしょう(やらないけど)。 こういう感じで。 http://www.saidanbon.com/jisui_manual_cutting_a_book.php >(1)検索もしたいので・・・ InDesignはメジャーなソフトなので素人でも持っている場合はあります(私も)が、それを使う、ということは「あとで印刷/製本するかもしれない」ということですか? 私が自炊するとしたら、画像でPDFにしてそのテキスト部分をOCRで読み出して別レイヤーに埋め込む、という処理をするだろうと思います。 その場合、InDesignで画像をそのままのレイアウトで製本もできるでしょうし、テキスト部分だけを読み込んで自由にレイアウトし直すことも可能でしょう。 ちなみにScanSnapはOCRソフトも付属しています。精度は知りません。 両面スキャンもできます。 http://scansnap.fujitsu.com/jp/ >(2)すでにPDFになっているもの・・・ OCRは他の回答でも仰っていますが、正確に、というのならば『不可能とは言えないが(相当に!!)面倒』です。 大まかで良いのならばAmazon等で評判の良いのを使えばいいでしょう。 OCRソフトは、たぶんスキャナを買えば(機能制限版かもしれませんが)付いてくるとは思います。 それで不足だったときに考えればいいでしょう。 >(3)電子書籍はどのタブレット・・・ 私が今選択するならばiPad2かな(買わないけど)。 理由:現在コストパフォーマンスが高い機種だと思うから。 iPad用のリーダーソフトはいくつもありますから、ご随意に。 iTunes Storeの評価でも参考にして、あとは見た目で良いのでは? >(4)(5) パス >(6)表紙、カバーもスキャンして電子書籍棚・・・ PDFの一ページ目に表紙を入れておけば、その表紙を書棚に並べるようなタイプのソフトはあります。 最初から入っているiBooksはそのタイプ。 他にあるかどうかは知らない。 >(7)棚があった場合、今後新たに本を購入時、・・・ iTunesStoreから購入すれば、そうなります。(今は書籍数が少ないですけど) PDFなら読み込めますが、他の独自形式の場合たぶん無理。 他の端末でも似たような仕様でしょう。 iBooksの取説より引用 -------------ここから------------- • iBooksで開けるのは、ePub電子書籍フォーマットで発行されたブック、およびPDFフォーマットの書類のみです。 • iBookstore以外から入手したePub電子書籍をiBooksに追加するには、追加する書籍がDRMフリーであること、および書籍をiTunes 9.2以降を使用して同期することが必要です。 •一部のPDF書類はiBooksと互換性がない場合があります。 --------ここまで---------
お礼
そうです、iBooksのような電子書籍棚。 iBookstoreから購入した電子本以外この棚に載るないと聞きました。 どの電子本も載る棚はないんでしょうか。 ありがとうございます。
補足
とりあえず1週間スキャナ借りて試作してます。 多分この調子だと300冊はできそう。 その後OCRソフトを選びスキャナも購入しようと考えてます。 日本は規格統一までにかなり時間が掛かりますね。 そんなのは待っていられないんです。 今の本は今の規格で考えます。 デジタルですから統一もしくは複数規格でも偏れば多いほうで、そのときに変換できるような気もします。
- lupin-333333
- ベストアンサー率31% (294/933)
http://japanese.engadget.com/2011/09/05/ebook/ 投稿者はこれらの記事をしっているのだろうか。 所有者本人が、電子化するのは、規制されるものではないが、それを商売としている業者は、規制の対象に成っている。 法的に決着がついているものではないが、賭博や風俗と同じで、依頼者もなんらかの当事者になってしまうでしょう。 だいたい >収納に限界が来ましてデータ化(電子ブック)にすることを これ自体、変ですね。今収まっているのですよね。それとも本屋とか、図書館とか、みたいに常にたたみ1枚分以上あけないといけないんですかね。これから入手するものを電子化すればいいのではないですか? 3000と聞くと多い様に聞こえるが、天井まである本棚にすると、7~10個程度か(1個400冊として)。6畳なら四面の壁面に隙間無くならべるくらいだろうか。まあ本の大きさにもよるし、本棚にもよるので、実際にはわかならい。 >(7)棚があった場合、今後新たに本を購入時、本そのものではなく、電子書籍を購入した場合その棚に乗るのか これは意味がわからない。投稿者が電子書籍といっているのは、CDやDVD及びUSBメモリーの事をいっているのだろう。 もし、そうだとすれば、当然、箱で売っているので乗るでしょう。 ただ、通常、電子書籍なので通常電子データーです。サイトからダウンロードすれば、本棚ではなく、パソコンに格納されます(iPadやiPhoneなどの)。 (6)に関しても同じ。 http://www.yoshodego.com/ http://www.honyalink.net/degital.html http://search.yahoo.co.jp/search?p=%E9%9B%BB%E5%AD%90%E6%9B%B8%E7%B1%8D%E3%80%80USB%E3%83%A1%E3%83%A2%E3%83%AA%E3%83%BC&aq=-1&oq=&ei=UTF-8&fr=ie8sc&n=10&x=wrt http://hon-to.jp/?cid=ep_ls&ppcad などを見て電子書籍の購入方法をみてください。メディアにして購入する方は少ないと思いますよ。あったとしても、USBメモリー、SDカードなどの電子データー記録媒体での販売になるかと思います。つまり、手のひらどころか、指先に乗る大きさの物です。 もし、カバー付けたいのなら、販売された時に箱ははいっているので、そこにのりではりつけるのでしょう。 >(4)タブレット、アプリが決まって、PDFをそのアプリ用にチューン このような内容の投稿者だと、理解するのは無理です。 >(5)そのアプリを使うのに費用は掛かるのか? フリーなら無料、通常有料で購入します。 >(4)タブレット、アプリが決まって 決め手から、その仕様をみて決めてください。でないと、話が進みません。 >(1)検索もしたいのでOCRにしたいがどの この投稿内容でなんで「InDesign」なんていう業務等に使う専門家しかしらない単語がでてくるのだろう。不思議だ。業者の投稿か OCRは、素人ではまず不可能です。300ページ在るもので1冊や2冊なら、まあ時間かけて、補正して1週間ぐらいかかるだろうか。なれれば、3日ぐらいで補正が終わるでしょう。 で3000冊ですか、5、6年かかるのでしょう。 補正しないのなら、マシン性能によりますが、1週間もあればできる可能性があります。 PDFデータがOCRできるかとは、できます。Acrobat自体の機能を使ってもできます。 >(3)電子書籍はどのタブレット、アプリケーションが良いか 規格が統一されていません。互換性がありません。どんな規格なのか、そのメーカーのサイトにゆけば書かれています。その規格で作成されたものであれば、自作でも読めます。 以上、 http://search.yahoo.co.jp/search?p=%E9%9B%BB%E5%AD%90%E6%9B%B8%E7%B1%8D%E3%81%AE%E8%A6%8F%E6%A0%BC&aq=-1&oq=&ei=UTF-8&fr=ie8sc&n=10&x=wrt にリストされている記事をたくさんよんで、どんな規格があるのか勉強してください。話はそれからです。それからOCRなどを研究してください。 ちなみに私は、自分で100冊ほど電子化しました。スキャンするのに業務用の複合機(200万円ぐらい)を使い、両面白黒でB5より大きい本で、300ページ、1時間ぐらいかけて慎重におこないました。 やはり問題は、本の分解ですね。背表紙をうまくとり、大型カッターで、のりがついている部分を2mm程度きるのがポイントですね。この作業をしないと連続してのスキャンは不可能です。 この程度なら、持込でやってくれるお店がたくさんあります。料金もめちゃくちゃ安いです。 ちなみにOCRはフォーマットが固定されていないと、認識率が極端に下がります。つまり、挿絵や図があるようだと、自動認識でも、かなり無理があり、かならず補正が必要です。 私は1冊で(技術資料)、補正に3日程度かかりました。
お礼
ながながとありがとうございました。
補足
「個人による自炊は私的複製の範囲内」とされていますし上記にもあるように「本をデータ化する目的は販売や人に読んでもらうことではなく自分が持っている書籍を物理的に小さくすることが目的です。」 InDesignは業者だけが使うんですか?それは知りませんでした。 私は業者でもなんでもありませんがイラストレーターも普通に使いますがそれは変なのでしょうか。 InDesignにすると電子ブックでページを拡大していて次の段落に進むときに的確に次に進んでくれるアプリが多いと聞きましたのでそうしたいと。 それとデータにしたい理由は、部屋の大きさや棚の大きさまでご親切に想像して頂きましたが私以外には関係ないですね。 しかしお知らせしましょう。 実際は5000冊以上あります。 棚に乗り切らない分も含め、どうしても本実物でとっておきたい本を棚に並べて、一度は読んだけど取っておきたいものをデータにしたい。 3.11に地震で棚が壊れ全て崩れ安全考慮し棚を作り直したら収納が少なくなってしまった。 とりあえずレンタルでスキャナーお願いして、先ほど届きました。 実際買うと50万くらいのものらしいですがA3までスキャンできる分大きくてオドロキました。 レンタル屋さんが試しにB4の500ページくらいの学術書をスキャンしましたが600dpiフルカラーにして1冊5分掛かりませんでした。 表紙、カバー、帯もスキャンしてファイル名つけて保存、全てで10分。 私は倍くらい掛かるだろうか。 OCRソフトでスキャンすると本のページを追っかけて抜けてたり上下逆とか、重なりなどを見つけてくれるソフトも貸してくれました。 断裁が本当に大変かと心配していましたが近所の製本屋さんに相談して暇なときに1日200冊目標で業務用断裁機で切ってもらえるので悩みが一つ減りました。当然有料。1冊10円。100冊切るのに10分かかっていませんでした。 カバー帯取る私のほうが時間掛かっていました。
お礼
今回もながながとありがとうございます。
補足
揚げ足? そんなのはとっていません。 あなたが根拠もなしに業者だのと決め付けているんです。 ほらまた今回も、 >「ですが、コピー屋はみなさん、そういいます。」 本当に貴殿は決め付けるのがお好きですね。 >「個人保有の本だと、研究者、小説家、古書マニアなど、専門家でないと、ありえない数字ですよね」 個人の趣味か営利かどうかは数量なんですか? 研究者、小説家、古書マニアも営利でなければ個人所有ですよね。 私の仕事、背景を見れば誰でも営利ではないと解るし、証明、ハハハ、簡単です。 貴殿にそれをする必要はありませんが。 私は完全に趣味ですが、個人でも会社でも仕事で使っている本を複写し利益を得るもしくは無料で配ったりすれば著作権侵害です。 貴殿にはそれをかんぐったり決め付ける権利はありません。 もしそういう立場の方であれば、その立場で確立された方法で取り調べるなりしてください。 それとこれは麻薬ではありません。 営利かどうかなんて、比べるものがオカシイ、尺度が全く違います。 麻薬は持っているだけで犯罪ですが本は持っていても犯罪ではありません。 味噌を見て糞と言い、カレーを見て糞と言い、カレーをみて味噌と言っている気がします。 とある本を読んでいれば解るフレーズです。