「機械翻訳の現状と展望」(英語教育2019年6月号)
雑誌「英語教育」の今年の連載の1つに、「AI技術と外国語学習の未来」(川添愛、元国立情報学研究所特任准教授、作家)がある。
他の連載にも興味を持ったので、今年度は定期購読にした。
6月号の第3回は、「機械翻訳の現状と展望(前編)」で、ニューラルネットワークを利用した機械翻訳を取り上げている。
説明内容は、主に中澤敏明「機械翻訳の新しいパラダイム」、情報管理、vol. 60, No.5, pp. 229-306 に基づいている(記事末尾の引用では、「vol. 6」と誤記がある)。
この論文はフリーアクセスなので、次のリンクで確認してほしい。
doi.org/10.1241/johokanri.60.299
ニューラル機械翻訳(NMT)では、Google 翻訳が事例として取り上げられることが多い。
著者が試した日英翻訳の例では、驚くほど自然で実用的な翻訳が出力されている。
しかし一方では、「奇妙な凡ミス」という不思議な特徴も持つ。
平昌オリンピックでのノルウェー代表団に起きた、卵の発注数の誤訳の例が紹介されている。
1,500個の卵を注文するために Google 翻訳で韓国語にしたところ、一桁多い 15,000個の卵が届いたという。
この誤訳騒動を伝える BBC の記事は次のリンクから。
www.bbc.com/news/world-europe-42978915
この BBC の記事では、1,500 と 15,000 が韓国語でどのように異なるかも示している。
数字のままであれば、一桁違うことに気づいたかもしれない。
しかし、ターゲット言語の知識がないと、出力結果が正しいかどうかを判断できないため、誤訳を放置してしまう。
このような単純ミスが起きるのは、NMTの手法に起因している。
単語を数百の実数値からなる列のベクトルに変換して計算している。
各単語の数値列から文の数値列が計算され、それをもとにして訳文の単語の数値列を出力する。
数値計算であるため、原文のどの部分が訳文に反映されているのか、解釈することが困難になっている。
卵の数が一桁増えたとしても、「原因不明」としか言えない可能性もある。
また、NMTの特徴として、よく知られているが、入力された原文が過不足なく翻訳される保証はなく、重複訳や訳抜けの発生がある。
「AIが発達すれば、外国語の勉強をしなくてすむ」という言説が広まりつつあるようだが、このようなNMTの現状をまず踏まえてから、次回の後編も読んで、これからの外国語学習について考えてほしいものだ。
他の連載にも興味を持ったので、今年度は定期購読にした。
6月号の第3回は、「機械翻訳の現状と展望(前編)」で、ニューラルネットワークを利用した機械翻訳を取り上げている。
説明内容は、主に中澤敏明「機械翻訳の新しいパラダイム」、情報管理、vol. 60, No.5, pp. 229-306 に基づいている(記事末尾の引用では、「vol. 6」と誤記がある)。
この論文はフリーアクセスなので、次のリンクで確認してほしい。
doi.org/10.1241/johokanri.60.299
ニューラル機械翻訳(NMT)では、Google 翻訳が事例として取り上げられることが多い。
著者が試した日英翻訳の例では、驚くほど自然で実用的な翻訳が出力されている。
しかし一方では、「奇妙な凡ミス」という不思議な特徴も持つ。
平昌オリンピックでのノルウェー代表団に起きた、卵の発注数の誤訳の例が紹介されている。
1,500個の卵を注文するために Google 翻訳で韓国語にしたところ、一桁多い 15,000個の卵が届いたという。
この誤訳騒動を伝える BBC の記事は次のリンクから。
www.bbc.com/news/world-europe-42978915
この BBC の記事では、1,500 と 15,000 が韓国語でどのように異なるかも示している。
数字のままであれば、一桁違うことに気づいたかもしれない。
しかし、ターゲット言語の知識がないと、出力結果が正しいかどうかを判断できないため、誤訳を放置してしまう。
このような単純ミスが起きるのは、NMTの手法に起因している。
単語を数百の実数値からなる列のベクトルに変換して計算している。
各単語の数値列から文の数値列が計算され、それをもとにして訳文の単語の数値列を出力する。
数値計算であるため、原文のどの部分が訳文に反映されているのか、解釈することが困難になっている。
卵の数が一桁増えたとしても、「原因不明」としか言えない可能性もある。
また、NMTの特徴として、よく知られているが、入力された原文が過不足なく翻訳される保証はなく、重複訳や訳抜けの発生がある。
「AIが発達すれば、外国語の勉強をしなくてすむ」という言説が広まりつつあるようだが、このようなNMTの現状をまず踏まえてから、次回の後編も読んで、これからの外国語学習について考えてほしいものだ。