- 締切済み
性能の良い「漢字かな交じり文」はありませんか?
http://www.geocities.co.jp/ymcc0000/ http://www.kawa.net/works/ajax/romanize/japanese.html などweb上で漢字から仮名に変換するサイトがありますが 形態素解析などを使って以下のような文章を正確に仮名に変換できるサービスなどありませんか? 出力は、仮名でもローマ字などでも構いません。 期待する性能 ・行った演技 =おこなったえんぎ ・行った場所 =いったばしょ
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- mtaka2
- ベストアンサー率73% (867/1179)
回答No.1
質問者さんが礼に挙げられている後者のページでは「MeCab」が使われていますが、MeCab は日本でもトップレベルの「形態素解析エンジン」です。 ですが、質問者さんが求めるものは「形態素解析」ではなく「意味解析」のレベルになります。 「行った演技」でも、前後の文脈では「いったえんぎ」の方が正しい場合もあるでしょうし、 逆に「行った場所」でも、前後の文脈によっては、「おこなった場所」の方が正しい場合もあるでしょう。 そういった文脈を解析する「意味解析」が出来るものでないとお望みの結果が得られませんが、 意味解析技術では、未だに満足できるレベルの成果は得られていません。 ちなみに、MeCabの場合は、複数の「候補」を出力することができて、 それを使えば > % echo '行った場所' | mecab -O yomi -N 2 > イッタバショ > オコナッタバショ と、両方の読みを出すことは可能です。
お礼
ご意見ありがとうございます。 いままで違和感があったのは、意味解析までのレベルを求めていたからのようですね。 高速なコンピュータと良質なアルゴリズムと膨大な用例辞書が出来上がる日を待っています(笑)