• 締切済み

日本語を形態素解析したいのですが..(jj)

今,JAVAで日本語の形態素解析できるプログラムを探しています. jumanやchasenなどサイトを見つけたのですが,具体的にどのような手順を踏み,どのようなプログラムを書けばいいか分からずに困っています(つへj) 無知で本当に申し訳ないのですが教えていただけないでしょうか?? 入力文→私は昨日,学校に行きました. 出力文→私 は 昨日 学校 に 行き ました このように形態素解析できるようにしたいと思っています☆

みんなの回答

回答No.2

茶筅をJavaで使おうと思ったらたぶんJNIを使わないといけないかと…。要は面倒だということです。 MecabというツールもあってそちらはJava用のバインディングが用意されているそうです。"mecab java"なカンジで検索をかけると詳しくのってるページが見つかるかと。 一番お勧めなのはYahoo!のAPI。ネットに接続が必要なものの、辞書とか必要ないしREST形式だから結構簡単にできるかと思います。 サンプルコード付きのページはリンクで。

参考URL:
http://www.powerbeans.co.jp/modules/wssamples/index.php?id=4
  • thamansa
  • ベストアンサー率40% (95/232)
回答No.1

複雑な処理ですので、このサイトで教えてもらって 解決するような課題ではないように思いますが・・・ >具体的にどのような手順を踏み,どのようなプログラムを書けばいいか 手順としてはプログラムの前に、解析の手順(これをアルゴリズムといいます)を明確化することが必要です。 たとえば、 「行きました」を「行き」「ました」に分けていますが、 なぜ「行きま」「した」ではなく、「行」「きました」でもなく、 「行き」「ました」になるのでしょうか?その判断基準(分割のルール)を明確化することが第一歩です。 もしすべての日本語の分割ルールが明確化できたら、そのルールをアルバイトさんに教えれば、アルバイトさんが分割処理をできるようになりますね。 実は「プログラム」というのは、人間のアルバイトさんの代わりにコンピュータを使うときに指示を与えることなのです。つまり人間のアルバイトさんを使う場合と同じだけの指示が必要ということです。