- ベストアンサー
テキスト検索の英文の説明をお願いします。
テキスト検索について知識が無いのですが こちらのページ(http://hpsupesu.gozaru.jp/) の内容をを都合があり理解しなければ ならないのですが英語を訳してもテキスト検索についての 知識がなく専門用語等でよくわかりません・・・。 出来るだけわかりやすく説明していただければ 本当に助かるかります。 本当に申し訳ないのですが宜しくお願いいたしますm(_ _)m
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
1.「辞書」は、単語と、単語が使われている場所を記録したファイルへのポインタと、類似語を記録した別の辞書へのポインタを持つ。 2.「データ(名前がないので)」は、どのドキュメントでそれぞれ何回、どの場所で単語が使われているのかを表す。(章、文、語の番号で位置を記録) 3.ドキュメントは、ドキュメントの本文とインデックスで構成され、「データ」はインデックスへのポインタを持つ 4.インデックスは、プライバシーコードによってそのデータへのアクセス許可を制限する 5.ドキュメントは、段落やドキュメントにタイトルを持つ 6.辞書はISAM形式で保存される だいたいこんなところですかね。細かい情報はまだありますけど。 ぶっちゃけると、「単語」に分割して、その全ての出現位置を1つずつ記録して、最後にそれを合計して「出現回数」を持った「辞書」を作ります。 あとは、逆に辞書から単語を検索し、使われている文書内の位置を検索できるようになります。 割と単純な手法ですが、辞書を作りやすい英文(日本語だと、空白で区切る習慣がないので「どこからどこまでが単語」という解析が先)では割と効果的じゃないかと思います。 #検索頻度が上がると重くなりそうですが。
その他の回答 (2)
- dekopa-
- ベストアンサー率42% (161/378)
#2です。 私も翻訳機だよりなので、あまり期待しないでください。 元ページの前後の文脈から、「formatted fields」というデータの用途に触れているみたいですね。 通常のSEARCHモードに加えて、書式化された情報(例えば参考書籍の為に[GoF95]と著者+年を記載する、とか)を検索するSELECTモードを備えている、かな。
- PED02744
- ベストアンサー率40% (157/390)
う~ん。。。 これ、「STAIRS」というテキスト解析検索システムのファイル構造図のようなんですが、 一般人に見せても大丈夫なものなんですか? こういうのは、「どのようにデータを持ち、高速に検索することができるか」が ノウハウになるはずなので、公開できるとおもえないんですが。。。
お礼
学校の課題で出たので自分も一般人でよくわからないのですが見ても問題ないと思います。 英文は図を説明しているのはわかるのですが専門用語等で全くわからない次第です・・・。
お礼
ご回答ありがとうございます。 回答を参考に訳して結構わかりました。 現在以下の部分の訳がよくわからないのですが出来ればご回答頂ければありがたいです。 STAIRS implements a separate SELECT access system for formatted fields, as opposed to the SEARCH mode used with normal content terms. Methods are provided to process queries containing both objective and content terms.