• ベストアンサー

日本語を意味的に分割するアルゴリズムが知りたいです。

日本語を意味的に分割するアルゴリズムが知りたいです。 吾輩は猫である。名前はまだ無い。どこで生れたかとんと見当がつかぬ。 吾輩 は 猫 で ある 。 名前 ... というように、日本語を最小単位で分割する方法が知りたいのですが、こういうのは簡単にはできないのでしょうか? PerlやVBAで使いたいのですが参考になるサンプルや書籍などございましたら、教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • amru05
  • ベストアンサー率63% (33/52)
回答No.2

 「形態素解析」で、検索してみてください。色々と難しい話が出てきますが、基本的な知識として覚えておくのもよいかも!!  実際には、KAKASI,ChaSenなどの有名なソフトを利用するのが良いでしょう。   http://kakasi.namazu.org/   http://chasen.naist.jp/hiki/ChaSen/ また、perlで使用するならText::Kakasiが良いかも   http://search.cpan.org/dist/Text-Kakasi/

参考URL:
http://search.cpan.org/dist/Text-Kakasi/

その他の回答 (1)

  • Pesuko
  • ベストアンサー率30% (2017/6702)
回答No.1

最小コスト法の事だと思います。 http://www.google.co.jp/search?hl=ja&rls=GGLG%2CGGLG%3A2006-10%2CGGLG%3Aja&q=%E6%9C%80%E5%B0%8F%E3%82%B3%E3%82%B9%E3%83%88%E6%B3%95&lr= 超高速のデーターベース参照エンジンだから、VBAレベルでは無理だと思うけど。 本来ならIMEといわれるプログラムです、プログラムもさることながら 数10万語に及ぶ辞書を作成する事が必要で、個人レベルでは無理です。

関連するQ&A