• 締切済み

外部サイトからHTMLを抜き出すための言語と知識

作りたいサイトがあるのですが、それを実現するために必要な知識やプログラミング言語が分かりません。 自分の能力は、HTML,CSSは問題なく使え、javascript,phpを少し理解できる、といった程度です。 今すぐ完成させたいわけではなく、完成のために必要な勉強の道筋をご教授いただければと思います。 任意のamazonの商品を登録するwebサイト あとで読む本をメモ代わりに登録するとともに、外部にも公開したいと考えています。 ブラウザ上にURLを入力するフォームがあり、そこに http://www.amazon.co.jp/%E9%A2%A8%E3%81%AE%E6%AD%8C%E3%82%92%E8%81%B4%E3%81%91-%E8%AC%9B%E8%AB%87%E7%A4%BE%E6%96%87%E5%BA%AB-%E6%9D%91%E4%B8%8A-%E6%98%A5%E6%A8%B9/dp/4062748703 という風に任意のURLを入力すると、自動でその本の「タイトル」「内容」「ページ数」を抽出したページを作成できるようにしたいです。 イメージとしては、amazonの商品URLを入力するだけで↓のようなサイトを作りたいです。 http://bookface.ciao.jp/ まずは自分だけが利用できればいいと思っておりますが、ゆくゆくは誰もが自分のサイトを作れるようになればいいな、と考えております。 また自分はwordpressを多用しているのですが、このサイトを作る時にwordpressを活かすことはできるのでしょうか? 見当違いの質問でしたら、すみません。 以上です。 よろしくお願いします。

みんなの回答

  • notnot
  • ベストアンサー率47% (4900/10358)
回答No.2

Amazonの話で言うと、まずAmazonのAPIを使えるようにAmazonに登録してください。アフィリエイト登録も。 https://affiliate.amazon.co.jp/gp/advertising/api/detail/main.html 入力されたURLから、上記だと 4062748703 という商品IDを切り出して、それをもとにAmazonAPIで商品情報を取得して、必要に応じて加工してページに掲載します。 AmazonAPIを使いやすくするライブラリは、Perl/PHP/Rubyなどどれでも検索すれば見つかるでしょう。

  • zwi
  • ベストアンサー率56% (730/1282)
回答No.1

AmazonのHTMLから取っくて来るのは著作権の違反で訴えられるか、通信を遮断される可能が高いでしょう。 「Amazon.co.jp ヘルプ: Amazon.co.jp 利用規約」 http://www.amazon.co.jp/gp/help/customer/display.html?nodeId=643006#copyright HTMLのURLからdp/4062748703の4062748703がASINなので、Amazon Product Advertising APIで情報を取得出来ますが、一時間に2000アクセスに制限されています。 https://affiliate.amazon.co.jp/gp/advertising/api/detail/main.html それとwordpressは詳しくないので良く分かりません。

関連するQ&A