- 締切済み
オンライン辞書のすべての見出し語と定義が欲しい
http://pali.hum.ku.dk/cpd/search.html このオンライン辞書のすべての見出し語と定義をテキストで入手したいのです。 地道に単語を入れては、結果をコピーというやり方以外に、一気に抽出する方法を教えてください。 こういった情報処理にはまったく疎い人間ですが、ページのソースを観察すると、javascript, bin-cgiという単語が散見されます。 HTMLの処理以外の技術・知識が必要なのだろうと拝察します。その知識習得のための方向性、道しるべ、モデルケース、雛型となるやり方といったものをご教示しただけませんでしょうか? よろしくお願いします。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- notnot
- ベストアンサー率47% (4900/10358)
回答No.1
見出し語があれば定義を取るのは自動化出来ます。 見出し語の一覧を得るのは不可能なので、その会社に申し入れるしかないです。
補足
単語のリストはあります。 その言語における全ての表記を記載したもので90万語におよびますので、このリストを使えば漏れることはありません。 自動化の方法について、あらましを解説いただけると幸いです。