- ベストアンサー
完璧な言語翻訳システムは作成可能か?
完璧な言語翻訳システム(例えば日本語から英語、またはその逆)は 作成可能だと思いますか? 可能だとしたら、あと何年くらいで実現できると思いますか? 可能でないとしたら、どのくらいのレベルまでなら実現できると思いますか?
- みんなの回答 (7)
- 専門家の回答
質問者が選んだベストアンサー
機械翻訳に関して、幾つかコメントを追加しましょう。 まず、入力がデジタルなのか、活字文字なのか、手書き文字なのか、音声なのか、それとも手話なのか。この順で難しくなると思います。これは翻訳とは無関係とお思いかもしれませんが、そうではない。意味を理解することによって、高度の誤り訂正が可能になるからでづ。 (<=この「づ」が「す」のタイプミスであることがお分かりになるのは、文の意味が分かるからですね。)文字の読みとりや音声認識は、少なくとも辞書なしには困難です。逆に辞書に載っていないような造語を使って話をする場合には、旨くいかない確率が高い。 機械翻訳は基本的には単語と文法が一体になった特別な辞書を使う作業です。ビジネス文書や技術文書など、文体が簡潔で比喩が使われず、また用語の意味が文脈から明らかであるような分野に関しては、もとの文章がきちんと書けていれば、機械翻訳は既に「完璧」の域に達しています。大量のドキュメントの翻訳をやる場合には、機械を使うことによってかなり安くなります。 電話で話すとリアルタイムで通訳してくれる、という技術も、簡単な会話に限れば既に実用の域に来ています。しかし、これを交渉ごとなどに使おうとすると、機械が正しく訳してくれたかどうかを確認することが重要であり、このため、認識した文章を翻訳した結果を、さらにもとの言語に訳し直した物を、画面に表示して、発話者に見せることは不可欠だと思われます。 海外旅行などの場合の日常会話の機械翻訳においても、音声入力が最大のポイントです。不特定話者(誰が話をするか分からない。ソプラノ歌手の歌を聞いているのかも知れないし、オウムの声かもしれない)の状況で、しかも対象言語も(何語かもわからないし、方言かも、古語かも、最新流行語かもしれないし)対象分野も(おみやげの値段の交渉をしているのか、宗教の奥義を聞いているのか)わからないという状況に対応するのは、技術的というより、データベースの整備がコスト的に引き合わない、という経済的理由によって実現困難です。買い物などの単純な話を標準的言語で明瞭な発音で話すという場合に絞ったシステムなら、ごく近い内に実用になると思います。ただし買い物における商品知識に関する用語の辞書を常にup to dateにしておくことが問題でしょう。また、海外旅行の際に看板を読みとることができると便利ですが、デジカメで捉えた映像から文字を認識して翻訳する、というシステムを考えると、やはり文字認識が最大のネックです。しばしば標準的でないフォントが使われており、デザイン的な文字や、わざと読みにくくしたような飾り文字を扱う必要があるからです。 文学作品の翻訳は、文化的背景を知らないと分からない比喩、隠喩、駄洒落、韻や音の調子、世代や性による表現の違いなど、いわば文字通りではない情報が沢山含まれているので、翻訳には広い知識と高度の理解力がなにより要求されます。さらにそれをターゲットの言語でうまく再現するには、創作に近い能力が要求される。だから大変難しいと言えます。たとえば谷崎潤一郎の小説を「日本語に訳す」ということを考えてみてください。全く自分の言葉で、しかももとの文章に劣らない格調高さで、ですよ。「翻訳」の実用上の本質は異なる言語を媒介するということですが、その技術的本質は別の所にあるということが分かります。 さらに、論理学的な問題として、言語自身に言及する文章の翻訳という事があります。たとえば、次の文の正しい英訳は? 「この文は十六文字で書かれています」=>この文は正しいことを言っていますが、訳すとどうなるでしょう? 「彼は日本語が分からないので、仕事を見つけるのは難しい」=>「日本語」をどう訳すかが問題です。 すでにお気づきでしょうが、この問題は不完全性定理と深い関係があります。
その他の回答 (6)
- h_hikita
- ベストアンサー率40% (104/257)
多分、会話のほうが文体に拘束が少ないため難しい気がします。 ATR(Advanced Telecommunications Research Institute International ) http://www.atr.co.jp 10年位まえから音声通訳関連の研究をしていたはず。 EDR(日本電子化辞書)http://www.iijnet.or.jp/edr/J_index.html 既に終了しているとおもうけど、日本語の概念辞書をつくろうというプロジェクト。 等をキーワードに検索すると関連する情報がひっかかるとおもいます。 NHKのニュースなんかは、NHK技研公開時に日英の 翻訳デモをしてますね。ニュースなんで文体、使用する 語彙、文章の内容というか分野が決まっているので できる技なんでしょうけど。 ここで聞くより、net news 上の適切なニュースグループで、質問するほうが ”回答者の皆さんと「コンピュータに文章の意味を理解させることができるか」ということを議論したかったのです。” という意味では希望の結果が得られるかもしれません。
- cotiku
- ベストアンサー率17% (38/216)
結論からいえば無理でしょう、完璧は。 日本人どうしでも分かり合えないと感じます。たとえば 『天皇は、日本国の象徴であり日本国民統合の象徴であって、 この地位は、主権の存する日本国民の総意に基く。』 の『主権の存する日本国民の総意』を「占領軍の意思」と解釈しました。 占領下、日本国民に主権はなかったので、論理学的にそうなりませんでしょうか。 『主権の存する』をはずして読みなおしてみてください。 またwaterを日本語で水と湯に分けますが、これも日本古来からの思想にかかわることなので簡単に真意は伝わらないと思います。相手が機械であろうと日本人であろうと。 こういう比較のなかから日本文化を探ることに今興味を持っています。
お礼
cotikuさん、回答ありがとうございます。 そうですね。既存の高度の文章(文学をふくむあらゆるもの)は、いくら翻訳 システムが高度になっても無理でしょうね。でも翻訳システムにかけることを 意識して書かれた文章ならば、かなりいけるのではないでしょうか。 システムが元の言語に逆翻訳して、確認リストを出してくれれば。チェックでき ますし。日常生活の実用レベルならば、もうすぐ市場に出てくるような気が します。言語文化は大影響を受けますけど。
- stomachman
- ベストアンサー率57% (1014/1775)
「コンピュータに文章の意味を理解させることができるか」という設問に対して幾つか観点を提出します。 ●まず、人が文章を理解しているかどうか、これがそもそも大変怪しいんです。「理解」って何でしょう?現代国語のテストを受けて満点が取れないような人を見ても、その人が文章を理解できないとは思わないのはなぜでしょうか。 文章を読んだ人に質問すると、その文章に関して次々と色々な事を言ってくれるでしょうが、それらの事を文章を読んだ瞬間に心の中に形成したとは限りません。むしろ、対話によって初めて理解が進んだという事の方がありそうです。知能における機能主義の観点では、その文章に関してヒトと同じように対話ができる(チューリングテストにパスする)機械は、その文章が理解できている、ということになるでしょう。 ●日本語は文法がありません。正確に言うと「規範文法」つまり「正しい日本語」かどうかを判断するしっかりした基準がないのです。「小原は会社で早朝に会議がはじまる」は正しいでしょうか?高度なものでは「完全に焼け落ちてしまった建物の上をヘリコプターが飛んでいた」という例文はどうでしょうか。(既に存在しないものの上ってどこでしょう?)いわゆる文法学者の説は、あくまで学者ご当人の感覚で適否を決めていて、中には首を傾げるような例文もある。ドメニコ・ガラナ(「これは日本語か」河出書房新社)は数千人の日本人に沢山の例文の適否を判定して貰うという膨大な研究の結果、分からん、と言っています。(機械でも人でも)文をかなりいい加減に理解しておいて、後に出てくる文を見たり、文に関する質問を受けてから、もとの文の意味を解釈しなおす、という作業が必要になりますが、普通そこまでは、やりませんね。人は本当に意味が分かっているんでしょうか? ●感情をシミュレートできなくては、機械が文を理解できたということにはならないでしょう。単に機械自身が感情を持つだけでは全然ダメで、発話者あるいは著者の暗示している感情を慮る必要がある。これはヒトでも旨く出来ない個体が多い。また、感情が「怒り度80%」というだけではなく、様々な概念への連想を引き起こすことこそが重要です。このような深い意味での感情の理解ができなくては駄目ですね。感情が文の形態に反映する仕方は人様々ですが、わざと不自然な表現を使ったり、急に文体を変えたりしてそれを伝えようとすることは共通です。ひとたび「文の表面的内容よりも、背後にある感情こそが伝えたいこと」なのだと推察できれば、目標は「何を察して欲しいかを推定すること。なぜそれを明示的に言わないか、その理由を推定すること。」に切り替えねばなりません。大変ではありますが、機械で実現できないと考える理由はありません。 ●Qualiaも問題ですね。クオリアは「感覚質」と訳されたりしますが、たとえば赤い物を見たときの「赤い」という感覚そのものです。比喩・暗喩が有効であるためには、quoliaが重要です。「サラダ記念日」の「サラダ」のみずみずしい感覚が適切な連想を引き起こす(映画ならモンタージュというやつですね)。「たらこ記念日」だったら雰囲気がだいぶ違いますね。機械にquoliaが備わっていないとすると、代わりに「サラダ」と連想されるべき概念のリスト、のような陽的情報を持っている必要があります。しかも、この情報は経験によって変化していくのでなくてはならない。例えば、小説の中で繰り返し使われる小道具や情景は、新しい連想を形成することを狙っている場合がある。 ●さらに語の音や文字そのものの持つquoliaも、作文においてどんな単語を選ぶか、という判断と深く関わっています。たとえば「めらめら」のように2音節の音を2度繰り返す擬態語において、「めらめら」mera-mera=*e*a-*e*a、のように母音に注目して分類してみると、それぞれの型ごとに共通する「感覚」のようなものがあるのが分かります。 (a,a)型「ばらばら」「ざらざら」「だらだら」「がばがば」「からから」「がたがた」 (i,i)型「ぴりぴり」「ぎりぎり」「ひりひり」「ちりちり」 (u,u)型「ぐるぐる」「つるつる」「するする」「ぐぶぐぶ」 (o,o)型「ぽろぽろ」「どろどろ」「そろそろ」「ぽこぽこ」「もぞもぞ」 (e,e)型「でれでれ」「てけてけ」(この型は数が少ない) (u,a)型「ぶらぶら」「ずかずか」「すらすら」 : また使われる子音に注目しても何か共通の雰囲気がある。(だからこそ、聞いたことのない語「ぺもぺもと歩く」を言われたとき多少とも雰囲気が伝わる訳です。)商品の名前をどうするか、など、音のqualiaの感覚なしには判断できないでしょう。「喫茶すぴすぴ」と「喫茶ちゃらちゃら」、どっちに入りましょうか? 機械にこの感覚を与えるには、(もちろん陽に記述されたルールという方法もありますが、できれば)沢山の例文から、音と雰囲気との連想を自発的に形成させる、というのが望ましい。そのためには、雰囲気が分からなくてはいけない。普通に分類されるような感情だけでは「雰囲気」は記述できないので、雰囲気の分類そのものを形成させなくてはならない。外界との接触なしにはこれは不可能です。かくて、機械は極めて優秀かつ前衛的な言語学者・心理学者にならざるを得ません。
お礼
stomachmanさん、ありがとうございます。とても多角的な分析とアドバイス 本当に、私にとって、思考訓練になります。 (この部屋は閉じさせていただくことにしました。メモリオーバーフローなので)
- stomachman
- ベストアンサー率57% (1014/1775)
「フィネガンズ・ウェイク」(あるいは「不思議の国のアリス」でも良いですが)を完璧に翻訳することができるとお思いですか?機械でやるか人がやるか、の問題以前に、「完璧な翻訳」というものが可能かどうか、を問う必要があります。 普通の翻訳は、まず理解して、それをターゲットの言語で言い直すという作業です。でも機械翻訳は、言語理解よりちょっと易しい問題とされています。理解できない文章があっても、辞書に載っている通りに訳せば訳したことになる、という訳です。(中学生の英語はまさにこれをやっています。先ず訳して、それを日本語で読むまで、意味が分からないんですね。)しかし、酔っぱらいのつぶやきを訳すことを考えると、むしろ言語理解よりも難しい。理解不能なことを理解不能なまま訳さなくてはならないからです。 ところでmori0309さんてば、数学の方の研究はお進みでしょうか。
お礼
アイタタ、、、おっしゃるとおりです。「完璧な翻訳」は人間でも無理です。ハイ。 年末年始はバージョンアップ期間だったのですか。OKWebの電子頭脳さま。ご登場願えて うれしいです。 回答者の皆さんと「コンピュータに文章の意味を理解させることができるか」ということを 議論したかったのです。このOKWebは社交場のようですね。単純なQ/Aよりも、お礼や 補足を通じて未知の方と会話できるのが、本当にうれしくて楽しいです。 (こういう利用法はダメかなあ) 「不完全性定理」を勉強中ですが、なにぶん多忙かつアタマワルイので、、、、、、 もうすこししたら質問します。
- h_hikita
- ベストアンサー率40% (104/257)
余程の技術的なブレークスルーが無い限り無理です。 量子コンピュータないしは光素子を使ったコンピュータ ができる&現在のバイナリロジック以外のロジックに 基づいたアーキテクチャが確立される等してHAL9000 並みのコンピュータでもできれば別ですが。 文脈というか発話の状況を著しく限定する必要があります。 旅行の会話集とか、特許とか、法律文書、ニュースの 原稿など語彙と文書のスタイルが決まっているものとか なら現状でも実用的なものができるかもしれません。 # 現状だと人を雇った方が翻訳以外の仕事もしてくれるしたぶん安い。(^_^;
お礼
h_hikitaさん、回答ありがとうございます。 高度なものは技術的なブレークスルーがないとダメでしょうけど、日常の 会話交換や文書交換ならば、近いうちに実現可能だと思います。 要は発話者や発文者が、翻訳システムが受けつけてくれる、簡潔な言葉や 文章を心がければいいのですから。システムが逆翻訳して、元の言語で発話者に 確認を求めたり、翻訳不能であれば「翻訳不能」と表示してくれればいいの ですから。でも言葉の文化は、大影響を受けそうですね。
- asuca
- ベストアンサー率47% (11786/24626)
ソフトウェア的にはそれほど遠くない時期に完成しうると思います。 問題になるのは人間のシナプスを模したAIチップや学習能力、膨大な辞書からの辞書引きということで巨大なメモリで巨大超高速な記憶装置、高速演算できるCPUなどが必要だと言うことです。たったA41ページの翻訳を完全にするのに数時間掛かるとしたら現実的ではないですよね。 ですからハードの開発の方が時間的に掛かるでしょう。 しかし技術の進歩は加速度的に早まっていますので、例えば電子を応用したメモリなどの開発やニューロン推論素子などの開発が進み、市販レベルになればその段階で完成は近いものだと思います。 解答になっているでしょうか?
お礼
asucaさん、回答ありがとうございます。 stomachmanさんがおっしゃるように完璧な翻訳システムは無理でしょうけど 日常生活の実用レベルで使い物になる翻訳システムは、そろそろ現れるので しょうね。翻訳システムが逆翻訳して「あなたの言いたいことはこういうこと ですか」という確認質問を一定の間隔で出してくれれば、間違った訳が相手に 伝わることはないですものね。
お礼
h_hikitaさん、ご親切な回答ありがとうございます。 たいへん参考になりました。