• 締切済み

RSSの特定記事取得方法

自分のサイトに特定の記事だけを取得して表示させる方法はあるのでしょうか? 例えば、朝日新聞を一般的なRSSで取得しても、色んなジャンルの記事を読み込むのは避けたい。 特定の記事、例えば「イチロー」のキーワードを元に「イチロー」に関する記事だけを取得して、表示させる。 色々探しているのですが分かりません。PHPも触り始めたのですが、そもそも可能なのでしょうか?

みんなの回答

回答No.3

#1です。 > RSS提供元のサイトから取得し、自分のサイトに記事を表示させるつもりですが、そこのリンクを押せば提供元のサイトへ飛ぶわけで、提供元にも利益があるので著作権問題はクリアーしている、というような説明を読んだ記憶があるのですが。勘違いでしょうか? この認識はちょっと甘過ぎますね。RSSの配信元にデータの利用規約が明記されていればそれに従わないと不法行為となる可能性はあります。 RSSの表題には著作権は認められませんでしたが、不法行為と認められた例があります(著作権は著作物である必要があります。著作とは作者の創造性が必須ですね)。 http://www.yonekawa-lo.com/kenkyu/kn010.html また、例えばasahi.comのRSSにも利用規約があります。 http://www.asahi.com/information/service/rss.html 個人でのRSSリーダー等での利用は問題ないが、WEBで公開するには何らかの承諾が必要かと思います(サービスによっては有料という事ですね)。 とはいえ、現実的には個人でやっている分にはいきなり訴えられるというケースは少ないでしょうね(訴える先を調べるだけでも大変でしょうし)。アクセス数がとても多い場合は注意した方が良いですね。 RSSを表示するサンプルはこんなものがありました。 http://www.doyouphp.jp/sample/sample_xml_pear_rss.shtml http://ml.php.gr.jp/pipermail/php-users/2003-July/017082.html フィルタリングするなら取得したデータにstrstrやpreg_match等で指定文字列があるか条件を加えるだけです。 参考まで。

gogovamos
質問者

お礼

技術的な問題はサンプルコードを解読してやって見ます。 ありがとうございました。 でも、著作権に関してはまだ「しっくり」こないのですよね。。。 色んな資料をもっと調べてみます。 丁重な回答どうもありがとうございました。

回答No.2

#1です。一つだけ指摘忘れました。データの著作権にはご注意下さい。基本的に勝手に配信というのは禁じられていると思います。自由に出来るのは引用までです。

回答No.1

> そもそも可能なのでしょうか? 可能ですよ。 流れとしては、 RSSの取得 データの解析(指定キーワードであれば抽出) データの登録 表示 RSSに限るなら、XMLを解析するライブラリがあると楽です。 HTMLも取得するなら正規表現を使って抽出すれば良いです。

gogovamos
質問者

お礼

取り合えず、処理可能との事が分かっただけでもプラスです。ありがとうございました。

gogovamos
質問者

補足

>RSSの取得 >データの解析(指定キーワードであれば抽出) >データの登録 >表示 >RSSに限るなら、XMLを解析するライブラリがあると楽です。 >HTMLも取得するなら正規表現を使って抽出すれば良いです。 以上のアドバイスですが、参考サンプル等はないでしょうか? 丸投げの「質問」で、恐縮なのですが。。 >データの著作権にはご注意下さい。基本的に勝手に配信というのは禁 じられていると思います。自由に出来るのは引用までです。 RSS提供元のサイトから取得し、自分のサイトに記事を表示させるつもりですが、そこのリンクを押せば提供元のサイトへ飛ぶわけで、提供元にも利益があるので著作権問題はクリアーしている、というような説明を読んだ記憶があるのですが。勘違いでしょうか? 取り合えず、処理可能との事が分かっただけでもプラスです。ありがとうございました。