• 締切済み

英文の形態素解析

Javaのクライアントアプリで、英文の形態素解析を実装しようとしているのですが、適当なライブラリを探しています。 日本語ではSenという解析システムがあるようなのですが、英語辞書が見つからず使えないようです。 Yahoo!のAPIのように、WebAPIのものでもかまわないのですが、ご存知の方がいらっしゃいましたらご教授いただければ幸いです。 よろしくお願いいたします。

みんなの回答

  • kyart
  • ベストアンサー率57% (8/14)
回答No.2

LingPipeのこんなのはどうですか? I have done enough research on this topic but yet to find the solution. と入れてみたら、 <output> <s i="0"> <token pos="ppss">I</token> <token pos="hv">have</token> <token pos="vbn">done</token> <token pos="ap">enough</token> <token pos="nn">research</token> <token pos="in">on</token> <token pos="dt">this</token> <token pos="nn">topic</token> <token pos="cc">but</token> <token pos="rb">yet</token> <token pos="to">to</token> <token pos="vb">find</token> <token pos="at">the</token> <token pos="nn">solution</token> <token pos=".">.</token> </s> </output> な感じで属性で品詞の分析をちゃんとしてくれるみたいですよ。まあこれは無料のはいろいろ制約がついていそうですけど、「natural language processing java」 で検索したら他にもありそうですよ。

参考URL:
http://lingpipe-demos.com:8080/lingpipe-demos/pos_en_general_brown/textInput.html
kurocobain
質問者

お礼

遅レスですいません。 情報ありがとうございました。LingPipeは数少ない無料の形態素解析エンジンみたいですね。 勝手に叩くと怒られそうだったので、結局Yahoo! PipesのTerm Extractorを使ってみることにしました。 精度に難がありそうなので、引き続き情報収集してみるつもりです。

  • _ranco_
  • ベストアンサー率58% (126/214)
回答No.1

英語の形態素解析は、日本語の世界とは対照的に、非常に本格的に確立されたフクザツなガクモンです。理論や用語がまず、ムツカシイです。nantoka morphemeなんていっぱいあるし…。 で、あなたのアプリケーションの目的はなんですか? 形態素解析なんか本当に必要なの?

kurocobain
質問者

お礼

イメージ的に日本語より英語のほうが簡単そう、と思っていましたが実際は全然逆のようですね。。確かに英語は同じ単語でも、文脈によって品詞が変わったりしますもんね。 目的は、あるsentenceから主要な名詞(できれば形容詞)も引き出して、タグ化みたいなことがしたかったのでした。上記のとおり今回はYahoo! Pipesを使ってみましたが、内部ロジックが不明で結果も不安定なので、継続調査してみます。ありがとうございました。

関連するQ&A