事実を整える

Nathan(ねーさん) ほぼオープンソースをベースに法的観点を含む社会問題についても、事実に基づいて整理します。

ウェブページ機械翻訳の精度が低い問題:自動翻訳の方法を検証してみた結果

f:id:Nathannate:20181008153949j:plain

ウェブページの外国語を自動的に翻訳して欲しい。

てっとり早く英文を理解したい。

そう思っている方に代表的な方法と、【絶対に見てほしい注意点をお伝えしたいと思ってこの記事を書いています。

自動翻訳を全部鵜呑みにするのは大変危険であるということを実証しつつ説明します。

とはいえ、解決策はあります。

もう知ってるという方は『無料の機械翻訳の精度は、残念ながら低い』からどうぞ。

なお、Google検索ページでも翻訳ができますので文量が少ないならそちらでやればいいでしょう。

機械翻訳の方法1:GoogleChromeの自動翻訳機能

自動翻訳googlechrome

英語サイトを自動翻訳する方法はいろいろありますが、私はGoogle Chromeの機能を使っています。
URLの右側にマークがついているのでそこをクリックすれば「このページを翻訳しますか?」と聞いてくるので翻訳ボタンを押せばおわりです。

ページ本文を右クリックして「日本語に翻訳する」ボタンを押すことでも可能です。

ボタンが出ない人へ

以下の方法で設定変更すれば表示されます。

英語自動翻訳googlechrome方法

右上に点が縦に3つ並んでるところがあるのでそこを押すとタブが開きます。

その中から「設定」を押します。

自動翻訳googlechrome設定変更方法

するとこのような画面に遷移します。

下にスクロールすると「詳細設定」タブがあるのでクリックします。

自動翻訳googlechrome設定変更方法

「言語」の項目が出てきます。

その中から言語欄の右側のマークを押すと更にタブが展開されます。

すると、「母国語以外のページで翻訳ツールを表示する」という欄が現れます。

右側のスイッチを切り替えます。

設定は以上です。スマホアプリでChromeアプリを使用していれば同様に可能です。

でも、これってChromeブラウザを使ってる人だけしか使えませんね。

また、WindowsとChromebookを使っている人のみ利用できると説明があります。

そこで別の方法が無いか調べてみました。

機械翻訳の方法2:Bing翻訳

Bing翻訳

https://www.bing.com/translator?from=&to=ja&setlang=ja

「Bing翻訳」で検索すればBingが提供している翻訳機能のページが見つかります。

そこで「テキスト」または「WebページのURL」を入力します。

WebページのURLの場合には、翻訳ページへのリンクURLが表示されます。

たとえばペンス大統領のハドソン研究所でのスピーチのサイトの場合は以下です。

f:id:Nathannate:20181008161124j:plain

https://www.bing.com/translator?from=&to=ja&setlang=ja

リンクURLをクリックすればページ遷移して日本語に変換されたものが見られます。

インターネットエクスプローラ上で右クリックすれば「Bingで翻訳」が出てくる場合もあります。

設定ができなければこっちのページをブクマしていた方が便利でしょう。

無料の機械翻訳の精度は、残念ながら低い

ここはぜひとも読んでほしいところです。

f:id:Nathannate:20181008173814j:plain

https://www.hudson.org/events/1610-vice-president-mike-pence-s-remarks-on-the-administration-s-policy-towards-china102018

Google  Chromeの機能で翻訳してみます。

f:id:Nathannate:20181008173836j:plain

https://www.hudson.org/events/1610-vice-president-mike-pence-s-remarks-on-the-administration-s-policy-towards-china102018

"with deeds,not words"は「言葉ではなく行動でもって」という意味であることは、たぶん中学生でもわかると思います。

しかし、自動翻訳では残念なことに「行動ではなく、言葉で」となっているのが分かります。

恐ろしくないでしょうか?

まったく逆の意味になっているというのは。

別の個所も見ていきます。

f:id:Nathannate:20181008174340j:plain

https://www.hudson.org/events/1610-vice-president-mike-pence-s-remarks-on-the-administration-s-policy-towards-china102018

こちらも機械翻訳ではまったく翻訳になっていません。

f:id:Nathannate:20181008174657j:plain

https://www.hudson.org/events/1610-vice-president-mike-pence-s-remarks-on-the-administration-s-policy-towards-china102018

洪水から洪水に…変わってねぇ!(笑)

直訳すれば「洪水から細流になった」などですが、水を用いた気の利いた言葉が私は思い浮かびませんので、「人的交流が乏しくなった」とか、「下火になった」とか、そういう訳になるのでしょう。

ここはセンスが問われますね。

これ、文脈から意味がなんとなく分かるのならいいですが、間違いない判断ができる人ってどれくらいいるんでしょうか?上記はなんとなく「中国がアメリカの大学に影響力を発揮しているな」というのは分かりますが、交流プログラムにどう作用するのかは文脈上からは分からないハズです。

ここで取り上げたところだけでなく、ところどころで文意がおかしくなる文章が散見されます。

なお、Bing翻訳だと、もはや笑いの種にするレベルです。

Bing翻訳、制度が低い、間違っている

https://www.microsofttranslator.com/bv.aspx?from=&to=ja&a=https://www.hudson.org/events/1610-vice-president-mike-pence-s-remarks-on-the-administration-s-policy-towards-china102018

こんな程度なので、おそらく誰もBingは英語⇒日本語翻訳には使っていないんじゃないでしょうか?他の言語の場合には精度が高い可能性はありますが。

機械翻訳をコピペするのは信用が落ちますよ

機械翻訳をそのまま見るのは、「なんとなく書いてあることが分かればいいや」という個人的な使用方法ならいいと思います。

でも、他人が見るような「コンテンツ」にしちゃう人が居るんですよね。

今回取り上げたペンス副大統領の演説も、Google Chromeの翻訳をコピペしたものをそのままブログにUPしてる人とかが居ました。

それって「このサイトは信用出来ません」って言ってるようなものですからね。

固有名詞や多義語を(「ある程度」のレベルであっても)正確に訳すことは現在の(無料で使える)機械翻訳では不可能なので、やはりそこは人力でどうにかするしかありません。

自動翻訳はある程度の英語力があれば便利

とはいえ、Google Chromeの翻訳は使いようによっては便利です(Bingは論外ですが)

【いったん自動翻訳をしてからGoogle翻訳と辞書とを併用して修正するスタイル】

これだと翻訳作業が短時間になるなぁと感じます。

Chromeのウェブページ全体翻訳をした文とGoogle翻訳を単文で行ったものとでは訳が違うということがあります。
※どうも、システム自体は同じようです。Google翻訳にサイトURLをぶち込めば同じ訳でした。

また、Google翻訳の場合、複数文をぶち込むよりは、単文ずつ訳した方が翻訳の精度は高いです。

もちろん厳密性はありませんし、作業者の元々の外国語力によって質は変わりますが。

たとえば以下の記事はそういう手法を一部取り入れています。

もちろん、非常に高い外国語能力があれば自動翻訳が逆に面倒になると思います。

でもそれって「そういうお仕事ができる人のレベル」なので、ほとんどの人は無関係なのかなと思います。

まぁ、でも、これでもNHKの同時通訳の精度よりは高いと思いますよ。

NHKの同時通訳って、固有名詞が間違っていたりしますからね。

まとめ:自動翻訳はそのままでは危険

【自動翻訳は意味が真逆になっている場合がある】

この事実は知っておいた方がいいんじゃないかと思ってこの記事を書きました。

以外とネット上では機械翻訳をそのまま読む人も多いようでしたので。

もしも仕事上、直接それを扱うわけではないが、「この記事の正確な理解が必要だ」という場合には、たとえばアイディービジネスなんかで翻訳してもらうのはいいんじゃないでしょうか?

人の手が加わりチェックが入ったものが、やっぱり間違いにくいものであるというのはどこも同じなんだと思います。

以上