• ベストアンサー

ブログの記事を過去にさかのぼり抽出したい

はじめて質問をしますよろしくお願いします。 ブログの記事を過去にさかのぼり本文のみを抽出したいのですが、なにかよいほう法はないでしょうか? RSSリーダーでは最近の記事しか吸い上げてくれないようですので 過去の記事もすべて抽出するほう法がありましたら、教えてください 視覚障害者の友人が音声読みあげソフトで読みあげやすいように加工したデータを作りたいのです よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • Muller3
  • ベストアンサー率81% (800/979)
回答No.2

http://blog.zuzara.com/2006/12/28/178/ http://zuzara.dyndns.org/api/tsubuan?url=(記事を抽出したいURLをここに入れる) という風に使うんじゃないかと思うんですが、 http://blog.zuzara.com/2007/08/27/231/ この記事によると、なんか落ちてるみたいで試せません(^^; Webstemmer http://www.unixuser.org/~euske/python/webstemmer/index-j.html これが使えれば理想的なのかも…。私が使っているサーバーでは使えない(要Python 2.4以上)ので、未検証ですみませんが。

TOMDAM
質問者

お礼

Muller3さんご親切にありがとうございました。 Webstemmer こう言うソフトを差がしていました。 早速試させていただきます。できるといいんですが(^^; とてもよい情報を提供していただきありがとうございました。

その他の回答 (1)

  • Muller3
  • ベストアンサー率81% (800/979)
回答No.1

http://labs.alfasado.net/naked.cgi URLを入れると、音声読み上げ用に変換してくれます。 URLベースなので記事全て一度に出てくるわけではないんですが、カテゴリーアーカイブごとに抽出すれば作業工程的には楽なんじゃないかなと思うのですが…。 こういうソフトがあるんだなとちょっと覚えていた程度なので、参考になるかどうかわかりませんが。

TOMDAM
質問者

お礼

ご回答ありがとうございました。 こういったサービスがあるのをはじめて知りました。参考にさせていただきます。 質問の補足をさせていただけきます。 視覚障害者にとって音声ソフトを使ってのブログ閲覧に苦労をすることが多いようです。ページジャンプが多い、構造が複雑、いろんな機能がついていて邪魔をする、サイドバーをすべて読み上げてから本文に貼りるなど  そのため、友人には読みたいブログの記事を1件ずつメールにして送っています。が、記事の件数が300近くあるし、他のブログも読みたいようなので、何か効率のよいほう法はないかと考えています。 自分で調べて、こんなページをみつけたのですが http://blog.zuzara.com/2006/12/28/178/ 素人なのでよく分かりません。 もし、記事の抽出が可能なら自分が扱えるファイルメーカー(データベースソフト)をつかって管理をし、一括でメールを送信したいと思っているのですが可能でしょうか?