発想と実装の間をつなぐ AI:人工知能特化型メディア

待ってた!ついにGoogle翻訳がニューラルネット機械翻訳を日本語版にも適用。異常に上がった翻訳性能は感動モノ

ついにこの日がやってきました。従来のフレーズベース機械翻訳(PBMT)からの、日本語翻訳完全移行です。

Googleの誇る機械学習システム「TensorFlow」と「Tensor Processing Unit(TPU)」で実現したニューラルネット機械翻訳(GNMT)が、英語 ⇒ 日本語の翻訳にも適用されました。

誰でも無料で使えるけど『おいwお前ww』となってしまいがちだった僕らのGoogle翻訳が、一足飛びに驚異的な進化を遂げたというわけです。

Source: Google Research Blog

とにかく一回試せばわかる。なにこれすんごい

細かな仕様的な話はとりあえず置いておいて、まずは以下を見ていただければと。これはちょっと…なかなかな衝撃です。

翻訳テスト(原文)

Machine translation is by no means solved. GNMT can still make significant errors that a human translator would never make, like dropping words and mistranslating proper names or rare terms, and translating sentences in isolation rather than considering the context of the paragraph or page. There is still a lot of work we can do to serve our users better. However, GNMT represents a significant milestone. We would like to celebrate it with the many researchers and engineers—both within Google and the wider community—who have contributed to this direction of research in the past few years.

こんな感じのややこしい英文が・・・

翻訳結果

機械翻訳は決して解決されません。 GNMTは、人の翻訳者が決して言わないような重大な誤りを犯すことがあります。文章や文章の文脈を考慮するのではなく、文章を孤立して翻訳することです。 ユーザーにより良いサービスを提供するためにできることはまだたくさんあります。 しかし、GNMTは重要なマイルストーンです。 ここ数年でこの研究の方向性に貢献してきた多くの研究者やエンジニア(Googleとより広いコミュニティの両方)との祝辞を述べたいと思います。

こうなる。 と。翻訳結果

ちなみに長らく僕らを助けてくれたExcite翻訳さんの場合

Excite翻訳結果

機械翻訳は決して解決されない。GNMTは、言葉を落とし、固有名詞またはまれな用語を誤訳するように、まだ、決して人の訳者がしない重要なエラーをすることができる、そして、翻訳することはパラグラフまたはページの文脈を考慮するというよりも隔離において宣告する。まだ、私達のユーザーをよりうまく提供するために私達がすることができるたくさんの仕事がある。しかし、GNMTは重要なマイルストーンを表している。私達は、過去の数年の研究のこの方向に寄与していた多くの研究者、およびエンジニア--Googleおよびより広いコミュニティ内の--によってそれを祝福したい。

うん。。。Excite翻訳さんは別に悪くないと思います。(ていうかむしろ見慣れてるのはこっち)今回のGoogleのアップデートがちょっと異次元すぎるんです。

なんていうか… Exciteごめん。。。


日本語 ⇒ 英語の翻訳も精度が超向上。というかもはや別物に

かの有名な「存じ上げません」 ⇒ 「Zonjiage not」という超訳や
「事なきを得た」 ⇒ 「We got Kotonaki」などもご覧の通り。

事なきを得た ⇒ I got a chanceはなんか米国っぽくて格好良い意訳

これはこれで、もう大好きだった『ガバガバGoogle翻訳先生シリーズ』が更新されることも無くなるのかぁ…と、謎の切なさを感じたりもしますが、素晴らしい進化です。寂しくなんかありません。

今回導入されたニューラルネット機械翻訳とはつまり何か?

ちょっとややこしい話になりますが、ニューラルネット機械翻訳がやっているのはつまり、特定の単語を系列データ(並びと関係性を重み付けした状態のデータ)として捉え、それを固定長のベクトル(それってどこにどうかかってんの?)に置換していきます。

で、そこから別の言語の系列データに置き換えてから翻訳実行…という、ちょっとややこしく負荷の高いフローを通る「エンコーダ・デコーダモデル」をニューラルネットワーク上で行う。…みたいな感じの機械翻訳フローです。

実は2016年9月末に中国語 ⇒ 英語の翻訳において試験的に採用がされていて、このときに色んな言語でのテストも非公開でやってたらしいんですが、Google曰く「GNMTの方が翻訳エラーが55~85%少なかった」んだとか。

中国語Ver. の発表当時「他の言語への適用はむこう数ヶ月程度でなんとか…」とか言っていたのがなぜ唐突に早まってリリースされたのかはよく分かりませんが、これはもうただただ感謝してGoogleに祈りでも捧げたい気分です。便利すぎ。

ここから何が起こるのか?加速する「障壁無きコミュニケーション」がもたらすもの

この精度で各国言語の相互翻訳ができる。しかも誰でも使える。マーケティングの観点から見ても、このインパクトはやっぱりかなり大きいはずです。

GoogleやIBM、FacebookにMicrosoftなどで進めるAIの開発にも大きなパワーになるでしょうし、これによりもしかするとリアルタイム同時翻訳による会話サポートなどの分野にもイノベーションが起こる可能性はもちろんあるでしょう。

(※既にGoogle Docsにはこれを活用した機能がシレッと追加されてたりします)

言語や地域の壁を超え、よりスムーズにコミュニケーションが可能な未来。そこで僕らは何を発信し、何を得ていくんでしょうね?ワクワクです。

ちなみに先日発表したデジマラボのAIライター『Articoolo』も現状では英語オンリー対応。なので、日本語翻訳に Google Transrate API あたりを使ってもらえないか打診してみようかな?と。

いやー、これは面白くなってきました。

デジマラボ 編集部 by
BITAデジマラボ編集部です。最新Tech界隈の「なんかすごいね」を、『現場の提案』にするための情報をけっこうがんばってお送りします。