- ベストアンサー
日本語を意味的に分割するアルゴリズムが知りたいです。
日本語を意味的に分割するアルゴリズムが知りたいです。 吾輩は猫である。名前はまだ無い。どこで生れたかとんと見当がつかぬ。 吾輩 は 猫 で ある 。 名前 ... というように、日本語を最小単位で分割する方法が知りたいのですが、こういうのは簡単にはできないのでしょうか? PerlやVBAで使いたいのですが参考になるサンプルや書籍などございましたら、教えてください。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
「形態素解析」で、検索してみてください。色々と難しい話が出てきますが、基本的な知識として覚えておくのもよいかも!! 実際には、KAKASI,ChaSenなどの有名なソフトを利用するのが良いでしょう。 http://kakasi.namazu.org/ http://chasen.naist.jp/hiki/ChaSen/ また、perlで使用するならText::Kakasiが良いかも http://search.cpan.org/dist/Text-Kakasi/
その他の回答 (1)
- Pesuko
- ベストアンサー率30% (2017/6702)
回答No.1
最小コスト法の事だと思います。 http://www.google.co.jp/search?hl=ja&rls=GGLG%2CGGLG%3A2006-10%2CGGLG%3Aja&q=%E6%9C%80%E5%B0%8F%E3%82%B3%E3%82%B9%E3%83%88%E6%B3%95&lr= 超高速のデーターベース参照エンジンだから、VBAレベルでは無理だと思うけど。 本来ならIMEといわれるプログラムです、プログラムもさることながら 数10万語に及ぶ辞書を作成する事が必要で、個人レベルでは無理です。