FC2ブログ

「機械翻訳の現状と展望」(英語教育2019年6月号)

雑誌「英語教育」の今年の連載の1つに、「AI技術と外国語学習の未来」(川添愛、元国立情報学研究所特任准教授、作家)がある。
他の連載にも興味を持ったので、今年度は定期購読にした。

6月号の第3回は、「機械翻訳の現状と展望(前編)」で、ニューラルネットワークを利用した機械翻訳を取り上げている。

説明内容は、主に中澤敏明「機械翻訳の新しいパラダイム」、情報管理、vol. 60, No.5, pp. 229-306 に基づいている(記事末尾の引用では、「vol. 6」と誤記がある)。
この論文はフリーアクセスなので、次のリンクで確認してほしい。
doi.org/10.1241/johokanri.60.299

ニューラル機械翻訳(NMT)では、Google 翻訳が事例として取り上げられることが多い。
著者が試した日英翻訳の例では、驚くほど自然で実用的な翻訳が出力されている。

しかし一方では、「奇妙な凡ミス」という不思議な特徴も持つ。
平昌オリンピックでのノルウェー代表団に起きた、卵の発注数の誤訳の例が紹介されている。
1,500個の卵を注文するために Google 翻訳で韓国語にしたところ、一桁多い 15,000個の卵が届いたという。

この誤訳騒動を伝える BBC の記事は次のリンクから。
www.bbc.com/news/world-europe-42978915

この BBC の記事では、1,500 と 15,000 が韓国語でどのように異なるかも示している。
数字のままであれば、一桁違うことに気づいたかもしれない。
しかし、ターゲット言語の知識がないと、出力結果が正しいかどうかを判断できないため、誤訳を放置してしまう。

このような単純ミスが起きるのは、NMTの手法に起因している。
単語を数百の実数値からなる列のベクトルに変換して計算している。
各単語の数値列から文の数値列が計算され、それをもとにして訳文の単語の数値列を出力する。
数値計算であるため、原文のどの部分が訳文に反映されているのか、解釈することが困難になっている。
卵の数が一桁増えたとしても、「原因不明」としか言えない可能性もある。

また、NMTの特徴として、よく知られているが、入力された原文が過不足なく翻訳される保証はなく、重複訳や訳抜けの発生がある。

「AIが発達すれば、外国語の勉強をしなくてすむ」という言説が広まりつつあるようだが、このようなNMTの現状をまず踏まえてから、次回の後編も読んで、これからの外国語学習について考えてほしいものだ。

テーマ : 語学の勉強
ジャンル : 学問・文化・芸術

トラックバック


この記事にトラックバックする(FC2ブログユーザー)

「機械翻訳の現状と展望(後編)」(英語教育2019年7月号)

雑誌「英語教育」の連載の1つ、「AI技術と外国語学習の未来」を毎月興味深く読んでいる。 今月発売の2019年7月号では、6月号の続きで、「機械翻訳の現状と展望(後編)」。 機械翻訳の精度・品質が向上した場合、近い将来に外国語の勉強が不要になるのではないか、という言説が出回っているようだ。 しかし、この記事では、「外国語を学ぶ必要のない未来は来ない」という結論である。 これまで指摘されてい...

コメントの投稿

管理者にだけ表示を許可する

プロフィール

MarburgChemie

Author:MarburgChemie
製薬メーカー子会社の解散後、民間企業研究所で派遣社員として勤務していましたが、化学と語学の両方の能力を活かすために専業翻訳者となりました。

FC2カウンター
カテゴリ
最新記事
最新コメント
最新トラックバック
月別アーカイブ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR