• ベストアンサー

■カテゴリー違いでしたらすいません

カテゴリー違いでしたらすいません。 他のカテゴリーに書き直してきます。 今、テキストの『文』を抜き出すことについて調べています。 テキストの(重要な)単語を抜き出すことに成功しているのですが、その(重要な)単語を含んでいる『文』を抜き出すことができず困っています。 ある単語を含んでいる『文』を抜き出す。そういうフリーなツールなんかはないでしょうか? 環境はXP(windows)です。 結構マニアックな質問だと思ったので、ここに質問しました。 カテゴリー違いでしたらフリーウェアに出してきます。 そこらへん良く知っている方いたら、よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

文とはテキストファイル中の文字列のことでしょうか? そうなら一部のテキストエディターでも可能です。 (例えば秀丸エディタ) 言われている操作は、正規表現によりパターンマッチで対象の文をある程度特定できると思われます。 (ある程度というのは、質問が詳細でないので判断できないだけのことで完璧に抜き出せるかも知れません) 詳細は多くを書かないといけないので、 「正規表現」「grep」などで検索してみてください。 解決できるだけの情報が集められると思います。

makisi3
質問者

お礼

回答ありがとうございます! http://www.mnet.ne.jp/~nakama/ 正規表現 について自分で調べてめちゃくちゃ理解してきました。 grepについては、よく理解できませんでした。 Linux?Unix?環境でgrepとやると、正規表現に一致する行を出力するとまでしか理解できませんでした。 Windowsでgrepみたいなことができるツールなんてあるのでしょうか?

makisi3
質問者

補足

再び、すいません。 Windowsでgrepみたいなことができるツールを尋ねたのですが、ちょっと調べたらいっぱい見つかりました。 しかし、それらは、複数テキストの中から指定した単語(正規表現)にマッチするテキストを見つけるとかでした。 私の求めているものは、1つのテキストファイル中にある、指定した単語(正規表現)を含む行を出力することです。その単語を含む行のデータベースを作りたいのです。