• ベストアンサー

形態素解析ツール「茶筌(ChaSen)」について

品詞分解の質問に対して、形態素解析ツール「茶筌(ChaSen)」という ものを使って回答されている方がいらっしゃいます。 その結果を見ると、いわゆる学校文法による分類法とは、かなり懸隔が あるようです。 「茶筅」は、いったいどんな文法学説に基づいて品詞分解をしているの でしょうか。 機械のすることだから間違いがある、ともいえるでしょうが、「2年間」 を「2」と「年間」に分けるとか、サ変の複合動詞を語幹と「する」に 分けるとか、「の」を名詞(自立語)とするとかいったことは、単なる 間違いとするには程度が低すぎるようです。 開発者が何らかの学説に基づき、確信犯的に上記のような分類をするよ うソフトを作っているのなら、それはそれで構わないのですが。 どなたかお詳しい方がいらっしゃったらお教えください。

質問者が選んだベストアンサー

  • ベストアンサー
  • azuki24
  • ベストアンサー率49% (907/1826)
回答No.3

茶筌の使用例を書き込んだ張本人です。 Windows用(GUI版)「wincha」の配布版をそのまま使用したもので、カスタマイズはしていません。 以下、ご参考まで。 http://nais.to/~yto/doc/pub/nlk199805.pdf 『日本語形態素解析システム茶筌』  (山下達雄, 奈良先端科学技術学院大学 情報科学研究科)  (情報処理学会研究会報告 98-NL-125, pp. 1-8, May 1998.) ------  茶筌の特徴として、品詞体系、形態素辞書の項目、連接規則がユーザにより自由にカスタマイズできるという点があげられる。現在、公式にサポートされている品詞体系には益岡田窪文法とRWCP で採用されているもの(学校文法に準拠) がある。後者は現在辞書の整備を行なっている最中で、近日中に公開予定である。 ------ (注) RWCP:技術研究組合 新情報処理開発機構(Real World Computing Project) ついでに下記もどうぞ。(Microsoft PowerPointファイル) http://www.yamaguti.comp.ae.keio.ac.jp/japanese/%E6%9D%BE%E6%9C%AC.ppt 『機械学習に基づく自然言語処理システム』  (松本裕治, 奈良先端科学技術学院大学 情報科学研究科, July 2004)

kyouzaiya-k
質問者

お礼

いろいろありがとうございます。学校文法という狭い井戸の中にいると 息苦しくなって、新たな世界を見てみたくなります。そんな世界へ誘っ てくださったことに感謝申し上げます。規範は規範として、柔軟に言葉 に対応していかなくてはと思っています。ただ、全くの私文系なもので どこまでご紹介いただいたものを活用できることか・・・。

その他の回答 (2)

  • Riccota
  • ベストアンサー率46% (116/248)
回答No.2

辞書・文法の定義づけは、自分でできるソフトだと記憶しています。 研究者の指示する形態素の定義を組み込んで解析するものなので、ソフトウェアはその点では批判できないのではないでしょうか。 ただし、定義づけが明確なのにもかかわらず、ソフトウェアのバグや精度が低いせいで解析がおかしくなるということがないとは限りません。 オープンソースの無料ソフトですので、バグレポートとしてご提案されれば、ソフトウェアの精度を上げる協力になるのではないでしょうか。

kyouzaiya-k
質問者

お礼

ご回答ありがとうございます。新たな世界が開けた思いがします。

  • akina_line
  • ベストアンサー率34% (1124/3287)
回答No.1

こんにちは。  解析結果に異論があるのであれば、下記公式サイトの質問箱に書いてあるアドレスにメールして見たらいかがですか。 では。

参考URL:
http://chasen.naist.jp/hiki/ChaSen/
kyouzaiya-k
質問者

お礼

ありがとうございます。 早速、同内容で質問してみたいと思います。