- 締切済み
表記のゆれを吸収する方法
単語の表記のゆれを吸収したいのですが、 アルゴリズムが考え出せません。 大文字を小文字にしたり、ジをヂにしたり、 ツィをティにしたりしたいです。 こういう場合どのようにしたらいいのでしょうか? 入力は単語と出力は吸収した単語となると思います。 よろしくお願い致します。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- bender
- ベストアンサー率45% (108/236)
回答No.2
複数の文字列が与えられたとき、それらの共通する部分と異なる部分についての研究は、自然言語処理のほかにも、生物情報学の研究の一環として、例えばタンパク質内のアミノ酸の並び方について、すでに多くの研究がされてきたことと思います。 独自に考える以前に、既存のプログラムを試してみたり、これらの分野の文献を検索するか、あるいは学生であれば、先生に直接尋ねることが有効だと思われます。 また、ここで質問されるのであれば、Perl、あるいは、その他プログラミング、または、生物学の分野で質問をした方がよいように思います。
- xcrOSgS2wY
- ベストアンサー率50% (1006/1985)
回答No.1
アルゴリズムですね。 単語を読み込む 単語の中に大文字がある場合、それを対応する小文字に変更する 単語の中に「ジ」がある場合、それを「ヂ」にする 単語の中に「ツィ」がある場合、それを「ティ」にする 単語を出力する ・・・を、読み込む単語がなくなるまで繰り返す ではいかがでしょうか。