- ベストアンサー
日本の友達へ 漢字のふりかなを取得すること
最近、日本のプロジェクトをしています。 漢字から漢字のふりかなを取得することを困っている。 例えば: 漢字:松戸 私は欲しいものには「まつど」を取得して、 開発言語はC#です。 OSはXp2. いくら探しても解決できないことになりました。 もし、助けてくれば、本当にありがとうございました。 ============================ 働いても、働いても、相変わらず貧しい人だった。 ============================
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
人名・地名などの固有名詞は複数の読み方があることも多く、自動で処理するのは難しいと思いますが、 一般的な日本語の文章で漢字からひらがなに変換するのであれば、 日本語の形態素解析を行う「茶筌」(Chasen)というライブラリがあります。 http://chasen-legacy.sourceforge.jp/ C#で利用するのであれば、「茶筌forC#」を併用すると便利でしょう。 http://www.vector.co.jp/soft/win95/prog/se329862.html
その他の回答 (2)
- titokani
- ベストアンサー率19% (341/1726)
ImmGetConversionListを使えばできるかもしれません。 ただ、#1さんもおっしゃるように、漢字の読みは何通りか存在するので、 いくつかの候補の中からどれを選択するのかが問題ですね。
お礼
ご提案いただけまして、ありがとうございました。
- FEX2053
- ベストアンサー率37% (7991/21371)
漢字の振り仮名は、同じ漢字でもどう読むかが一定でないため、 相手がテキストファイルの場合、取得する方法はありません。 自分で読んで、書き込む以外に方法はないのです。 相手がExcelブックの場合、入力時のカナを保持しているために =PHONETIC() という関数で取り出すことが出来ますが、 これも「Excelでカナ入力をしている」ことが前提になります。 カナ入力をしていない漢字データ(例えばテキストファイルを 読み込ませた場合)に対してPHONETIC関数を使うと、正しい読み が出てくる場合とメチャメチャな読みが出てくる場合があり、 実務的には全く使えないです。 ちなみにWord文書でも入力時のカナは保持していますが、 簡単に引っ張り出す方法はありません。 では、一般的なプログラムの場合どうするか、と言えば、 漢字フィールドとカナフィールドを別々に持たせる、という方法を とります。特に氏名は特殊な読み方をしますので必ず「漢字氏名」 「カナ氏名」の2項目が必要になります。 住所に関しては、特段「読める」必要はありませんので(漢字の ままで発送などが出来る)、漢字住所だけで済みます。
お礼
ご提示いただきまして、ありがとうございました。 これは住所と名前に対して特に要求がありません。 日本語初心者は漢字を見ながら、意味が分かりますけど、読み方は迷っています、そのため、漢字より、読み方を表示するよう考えています。
お礼
ご丁寧回答ありがとうございました。