- 締切済み
HTMLのparserを探しています。
HTMLのparserを探しています。 XMLのパーサーはかなり見つけたのですが、HTMLのパーサーがなかなか見つかりません。 できれば、フリーのものがいいのですが、 この際、どちらでもいいです。 お願いします。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- shigatsu
- ベストアンサー率26% (511/1924)
mozillaで配布してる Gecko とか使って自作できそうですが、これはいわゆるレイアウトエンジンですから、その手前の部分だけ切り出せばなんとかなりそうですね。 自作は考えられていないと思いますので、かなり外しちゃってるかもしれませんけど・・・ パーサと言って良いかどうかわかりませんが、Dreamweaver3の機能である「HTMLのクリーンアップ」は結構良い感じですよ。特にWordとかで作っちゃったぐちゃぐちゃのHTMLもかなりスッキリします。
- 参考URL:
- http://www.mozilla.org/
解答ではありません。 noa 様に不都合が御座いませんでしたら、便乗で質問させて下さい; パーサとおっしゃるのは、ページの取得能力やブラウジング能力が無いか、またはしないように設定できるものの事でしょうか? 勿論目的にもよりますが、 XML とは異なり、 HTML では定義自体に見栄えが含まれていますので、表示しないというのは解釈していないのと同様な気もするのですが。 SGML パーサか、文法チェッカの事でしょうか? 或いは XSLT のように要素を抽出できれば便利な気もしますね。 いかにも御存知な事かと思いますが、一応関連するかもしれない事を少し書いておきます; ブラウザ(解釈+閲覧表示); W3C の Amaya。日本語が文字化けするそうです。 http://www.w3.org/Amaya/ チェッカ; 「Another HTML-lint」 から ローカル用スクリプトがダウンロードできたと思います。 SGML パーサによる HTML 文書のチェック; 次のサイトで出来ます; http://www.kudpc.kyoto-u.ac.jp/Services/HTML_Parse/html_check.html
HTMLの場合、あんましパーサーって言い方しませんよね(^_^; ヴェクターの「インターネット&通信 > HTML作成 > 作成支援」のところにそれっぽいのがちょこっとあるみたいです。