• ベストアンサー

XMLデータの収集

研究において、XMLデータが必要になりました。 インターネット上で探してみましたが、良いデータを見つけることが出来ませんでした。 条件としては、日本語のXML文書で、構造は特に指定しません。 何か案があれば、よろしくおねがいします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

補足要求。 (どんな研究かなあ・・・) >良いデータを見つけることが出来ません 質問者さんにとって【「良いデータ」ってどんなデータ】だい? あるいは「集めたデータ」の【何が不満】なんだい? (実はValidでないものが多いとか・・・・規格が偏っているとか) >条件としては、日本語のXML文書で、構造は特に指定しません。 具体的に探したわけじゃないが, Webデザイン・開発系のサイトを回ればValidなXHTML 1.0な文書は容易に入手できると思うし, (ただし,ブラウザの実装の問題からDTDに沿わないembed要素やがあったり,XML宣言がないUTF-8の文書に偏るだろう) 最近Blog等が台頭しているからMovable Type等によって生成されたXHTML,RSS,ATOMあたりも入手は容易かと思う。

その他の回答 (1)

回答No.2

他にも思いついたので。Word 2007で文章を書いて保存。docxは複数のxmlファイルをzipで固めたものなのでこれを用いるとか OpenOffice.orgで作成されたODFも同じでzipを解凍すると contents.xmlが取り出せる。 他にもAmazon.co.jp等やその他のWebサービスで提供されているものもある。 http://www.goodpic.com/mt/archives/000479.html Firefox拡張に使われているXULはローカライズされた文字列がDTDに保存されていることが多いから不適かな。

関連するQ&A