- 締切済み
英文の形態素解析
Javaのクライアントアプリで、英文の形態素解析を実装しようとしているのですが、適当なライブラリを探しています。 日本語ではSenという解析システムがあるようなのですが、英語辞書が見つからず使えないようです。 Yahoo!のAPIのように、WebAPIのものでもかまわないのですが、ご存知の方がいらっしゃいましたらご教授いただければ幸いです。 よろしくお願いいたします。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- kyart
- ベストアンサー率57% (8/14)
LingPipeのこんなのはどうですか? I have done enough research on this topic but yet to find the solution. と入れてみたら、 <output> <s i="0"> <token pos="ppss">I</token> <token pos="hv">have</token> <token pos="vbn">done</token> <token pos="ap">enough</token> <token pos="nn">research</token> <token pos="in">on</token> <token pos="dt">this</token> <token pos="nn">topic</token> <token pos="cc">but</token> <token pos="rb">yet</token> <token pos="to">to</token> <token pos="vb">find</token> <token pos="at">the</token> <token pos="nn">solution</token> <token pos=".">.</token> </s> </output> な感じで属性で品詞の分析をちゃんとしてくれるみたいですよ。まあこれは無料のはいろいろ制約がついていそうですけど、「natural language processing java」 で検索したら他にもありそうですよ。
- _ranco_
- ベストアンサー率58% (126/214)
英語の形態素解析は、日本語の世界とは対照的に、非常に本格的に確立されたフクザツなガクモンです。理論や用語がまず、ムツカシイです。nantoka morphemeなんていっぱいあるし…。 で、あなたのアプリケーションの目的はなんですか? 形態素解析なんか本当に必要なの?
お礼
イメージ的に日本語より英語のほうが簡単そう、と思っていましたが実際は全然逆のようですね。。確かに英語は同じ単語でも、文脈によって品詞が変わったりしますもんね。 目的は、あるsentenceから主要な名詞(できれば形容詞)も引き出して、タグ化みたいなことがしたかったのでした。上記のとおり今回はYahoo! Pipesを使ってみましたが、内部ロジックが不明で結果も不安定なので、継続調査してみます。ありがとうございました。
お礼
遅レスですいません。 情報ありがとうございました。LingPipeは数少ない無料の形態素解析エンジンみたいですね。 勝手に叩くと怒られそうだったので、結局Yahoo! PipesのTerm Extractorを使ってみることにしました。 精度に難がありそうなので、引き続き情報収集してみるつもりです。