• 締切済み

表記のゆれを吸収する方法

単語の表記のゆれを吸収したいのですが、 アルゴリズムが考え出せません。 大文字を小文字にしたり、ジをヂにしたり、 ツィをティにしたりしたいです。 こういう場合どのようにしたらいいのでしょうか? 入力は単語と出力は吸収した単語となると思います。 よろしくお願い致します。

みんなの回答

  • bender
  • ベストアンサー率45% (108/236)
回答No.2

複数の文字列が与えられたとき、それらの共通する部分と異なる部分についての研究は、自然言語処理のほかにも、生物情報学の研究の一環として、例えばタンパク質内のアミノ酸の並び方について、すでに多くの研究がされてきたことと思います。 独自に考える以前に、既存のプログラムを試してみたり、これらの分野の文献を検索するか、あるいは学生であれば、先生に直接尋ねることが有効だと思われます。 また、ここで質問されるのであれば、Perl、あるいは、その他プログラミング、または、生物学の分野で質問をした方がよいように思います。

  • xcrOSgS2wY
  • ベストアンサー率50% (1006/1985)
回答No.1

アルゴリズムですね。   単語を読み込む   単語の中に大文字がある場合、それを対応する小文字に変更する   単語の中に「ジ」がある場合、それを「ヂ」にする   単語の中に「ツィ」がある場合、それを「ティ」にする   単語を出力する   ・・・を、読み込む単語がなくなるまで繰り返す ではいかがでしょうか。

関連するQ&A