もはある日記

岡山県の西端で、英日翻訳をしています。ここに「も」ステキなもの「は」いっぱい「ある」よ!

レビュー案件が Google 翻訳だった

ときどき、他の翻訳者さんが訳したもののレビューを引き受けているのですが、知らず知らずのうちに「Google 翻訳 + お粗末なポストエディット」のレビューをしてしまい、精神的に大変消耗しました…。

レビューが終わってから、「Google 翻訳のレビューやらされた」 っていう報告を最近 Twitter で見たなと思って恐る恐る確認してみたら…ビンゴ! 明日は我が身とはこのこと。私は、めちゃめちゃ下手クソな翻訳者だなぁ (怒怒怒) と感じるくらいで全然気づかなかったので、皆様、ご注意くださいませ。

 

自分の日本語感覚が狂うから機械翻訳のポストエディット (MTPE) はやらないぞ、という人も、いつの間にか「人間がやった (ということになっている機械) 翻訳」のレビューをやらされていることがありそうです。今回はおそらく翻訳者の問題ですが、人間翻訳のレビュー作業と偽って機械翻訳の MTPE をやらせる翻訳会社もありそう。自衛策、考えた方がいいですね。

 

 

あらまし

曰く、このプロジェクトに最初から参加している翻訳者さんだから、簡単にチェックしてちょっとブラッシュアップしてもらえれば、とレビュー案件の打診。対象ファイル冒頭の英語と日本語を簡単に突き合せて、それほど直す必要がなさそうだったので、XXXX ワードなら X 時間くらいで終わるな、と見積もって受注しました。

トライアルありで、定期的に今回のようなレビューも行っている翻訳会社からの依頼だったので、のほほんと構えていました。

しかし、レビュー対象は誤訳、訳抜け、訳揺れ、スタイルガイド違反、不統一、etc. のオンパレード。完全な訳し直しも多く、レビュー完了まで、納期を延ばしに延ばしてもらって、見積もりの 4 倍くらいの時間がかかりました。

要修正箇所が多すぎる時点で、レビュー作業はキャンセルして、新規翻訳として発注し直してもらうべきだったと反省しています。

Google 翻訳 + お粗末ポストエディットってどんなの?

私が遭遇したのは、Google 翻訳の出力に以下のような編集を加えたものでした。

  • Google 翻訳でうまく訳されない (英語のまま残ってしまう) 箇所を修正する。
  • 文末のスタイルを適宜変更する。
  • 代名詞を具体的なものに言い換える。
  • 語句の順序を入れ替える。
  • 語句を同義語句で言い換える。
  • 指定の用語集に合わせて用語を統一する。

機械翻訳の出力に編集を加えているので、「ポストエディット」と呼びましたが、こうやって並べ立ててみると、Google 翻訳バレしないための単なる偽装工作っぽいですね。

ほとんど Google 翻訳そのものと言えました。

Google 翻訳は実務翻訳で使いものになるのか?

ここまで読まれた方が気になるのはおそらく、Google 翻訳の出力は翻訳者/翻訳会社の納品物として認められるレベルなのか? ですが、

 

結論、ダメです。

 

Google 翻訳をちょっとポストエディットしたくらいでは、ダメダメです。

クライアントが期待しているクオリティには到達しないこと間違いなし。

 

マニュアルのような、比較的単純な文が多く、誤訳があっても重大な問題が発生しないであろうドキュメントであれば、MTPE もありだと思います。

それでも、要求を満たすクオリティに到達できるのは、MTPE の特性をよく理解した翻訳会社/ポストエディターの力があればこそです。

 

今回レビューしたファイルでは、30% の文に Google 翻訳が原因で発生した深刻度の高いエラー (次のセクション参照) があり、そのままでは納品できないので修正を加えました。エラーの種類/量は文書のジャンルなどに左右されると思いますが、やはり 30% 前後は発生してしまうのではないでしょうか。

※残り 70% の文は適切に訳せるなんて Google 翻訳ってすごい、と思われる方もいらっしゃるかもしれません。確かに Google 翻訳はすごい技術で、外国語で書かれた文の概要を知りたいときには役立ちます。しかし、翻訳者/翻訳会社に求められているのは (理想的には) エラーなしの翻訳物であり、Google 翻訳をちょっと編集しただけではエラーなしを実現できません。エラーの有無の確認をするのにも、キチンと原文を読める人が読んで判断する手間と時間がかかります。

 

さらに、そのままでも意味上の問題はない Google 翻訳文も、クライアントの好みではない素人感のある訳文だったため、ブラッシュアップを加える必要がありました。

最終的に、そのまま利用できたのは全体の 30% くらい。70% くらいの文に手を加えました。

具体的に、どんなエラーがあるのか

今回のお仕事で見つかったエラーをまとめてみました。

 

いずれも、人間が訳したときにも起こりうるエラーなので、ぱっと見は Google 翻訳 + ポストエディットによるものと見分けがつきません。

しかし、トライアルに合格し継続的に仕事を請けているプロの翻訳者の納品物がエラーだらけなのはやはりおかしいですから(Google 翻訳に限らず) 何らかの不正を疑うべきでした。

※以下で取り上げている例文は実施に仕事で遭遇したものではなく、説明をわかりやすくするために創作したものです。スクリーンショットは、2020 年 1 月 24 日時点の実際の Google 翻訳出力です。

 1. 構文解釈のミス

とりあえず原文にあるものを日本語にしました! といった感じの何を言っているのかよくわからない訳文。翻訳の素人が訳した文かな? という印象を受けます。「てにをは」は流ちょうで、日本語として一応読める文になっていたので、機械翻訳を疑う理由にはなりませんでした…。

1 文に複数のカンマ、and、to 不定詞、分詞構文が含まれているときに発生しがちです。

2. 訳抜け 

単語レベルでも、フレーズ レベルでも訳抜けがありました。and 以降の語句や、分詞句がごっそり抜け落ちているパターンもありました。1000w 中 1 語 (1 フレーズ) くらいでしょうか。

おっちょこちょいな翻訳者だなぁと思わせるくらいの、という絶妙な頻度でした。

3. 頻発する訳揺れ - 用語

語レベルの訳揺れ/表記揺れが頻発します。訳語統一に手間をかけない手抜きな翻訳者なんだな、と思いましたが、頻出用語で揺れるのはさすがに奇妙さを感じました。

下記は、原文の表記が変わるとつられて日本語表記も変わる例です。

  • electronic cigarettes - 電子的シガレット
  • e-cigarettes - 電子タバコ
  • e-cigs - 電子たばこ

他にも、Play の訳が「プレイ」と「再生」で常に揺れているなど、1 語に対して訳揺れしているパターンもありました。

4. 頻発する訳揺れ - フレーズ

CAT ツール指定案件だったので、本来発生しないはずのエラーなんですが、TM マッチ率の高い文が訳揺れしているのです。Google 翻訳だと、1 語違うだけで結果がこれだけ違うのですね。

  • Button A enables you to switch the color. (ボタンAを使用すると、色を切り替えることができます。)
  • Button B enables you to switch the color. (ボタンBでは、色を切り替えることができます。)

    f:id:I_tanja:20200124151355p:plain

5. 前後の文脈を無視した訳

最近では前後の文脈も理解した機械翻訳ができるシステムもあるらしいですが。

でもまだ人間ほどにはいかないですよね。

原文と訳文を突き合せて、1 文単位でみれば誤っていないものは、ポストエディットで修正されず、残ったままにされがちです。

下記は極端な例ですが、着物じゃなくて履物を脱いで欲しがっている確率が高いと思うのだけど (読む範囲を前後に広げればほぼ 100% 確定できる)。

f:id:I_tanja:20200124155803p:plain

6. 原文外の情報を無視した訳

翻訳対象物は、必ずしもテキストのみで構成されているわけではなく、一緒に見てほしい図や表が含まれている場合があります。マニュアルの場合は、読者が自分で製品を操作しながら読むことを前提としていることも多いでしょう。

なので、原文以外にも図表を見たり、製品を操作したりして調査しつつ訳す必要があります。

例えば下記は、Word 内のどこに [文字カウント] コマンドがあるかを説明した文です。英日突き合せただけでは、修正不要と判断されるでしょう (UI 名が正しいかどうかはさておき)。しかし、実際に Word で操作してみるとわかりますが、 [Word Count (文字カウント)] コマンドは [Review (校閲)]  タブ の [Proofing (構成)] グループにあるので、要修正なのです。

f:id:I_tanja:20200124164953p:plain

7. 過剰な用語統一

先述した「訳揺れ」と全く逆のことを言っているようですが。

ポストエディットの結果と思われる、過剰な用語統一が発生していました。

CAT ツールを使った作業の場合、納品前にツールの機能を使用して用語統一のチェックを求められることがあります。指定された用語集に記載の用語が原文で使われている場合、指定の訳語を訳文に含めないと警告メッセージが表示されます。

この警告を解消するためでしょうか、訳語が完璧に用語集と一致しているのです。訳し分けが必要な文脈でも。

例えば、シミュレーション ソフトウェアのドキュメントだと、integrate を適宜「統合」、「積分」に訳し分ける必要があるのですが、用語集に定義されている「統合」に統一しちゃうとかね。

ちゃんと頭で考えて適切に使い分けようよー。

8. 指示代名詞の誤解釈

 これもポストエディットの結果量産されているエラーでしょう。

this、that、it、they などが直前の名詞 (句) などに言い換えられていましたが、大体、解釈が誤っていました。関係代名詞も同様。

先述した構文解釈の誤りのような素人っぽい文です。

9. スタイルガイド違反/指示書違反

クライアントごとに、文章のスタイルの好みはいろいろです。翻訳時、文章は「である」調、リンク先タイトルは「日本語タイトル (英語タイトル)」形式で、全角文字と半角文字の間にはスペースを入れて…などと指示されることがあります。

Google 翻訳はそんな指示知ったこっちゃないですから、人間が修正を加えるしかありません。ですが、Google 翻訳をそのまま使うような人は、スタイルガイドや指示書をチェックする気もないのでしょうか、スタイルガイド違反がたくさん残っていました。

自衛策

どうすれば大ハズレのレビュー案件の被害を最小限に抑えることができるでしょう?

ぱっと思いつく方法はこれくらい…。他にもあったらお教えくださいませ。

  • 翻訳者の経歴/実績や過去のレビュー結果を教えてもらう。外注でレビューを引き受ける場合、翻訳者さんの個人情報を教えてもらうことはできませんが、可能な範囲で翻訳歴や専門分野、やりがちなミスなどがわかると、レビュー方針を決めるうえでもありがたいです。
  • 少し作業を進めて翻訳者の実績に見合わないほどエラーが多かったら、レビューを中断し、翻訳会社に報告/相談する。

その他いろいろ思うこと

  • 今回は最終的に Google 翻訳であることを突き止めて翻訳会社に報告したわけですが、それができたのは、翻訳対象が Web で一般公開されている文書だったからこそ。もし機密文書の翻訳だったら、情報漏洩を懸念して Google 翻訳にかけるのがためらわれ、Google 翻訳は発覚しなかったでしょう。
  • Google 翻訳でバレたから次は別の翻訳サービスを使おう、みたいに変な反省をされて、いたちごっこになったら面倒だなぁ。
  • 今まで Google 翻訳を使ったことがなかったけれど、思っていたより出来がよかったので結構関心しました。比較的平易なテキストでトライアルをやったら合格してしまう場合もあるんじゃないだろうか。文章が短かったら訳揺れが発生する可能性は少ないし、用語集やスタイルガイドなどの指定がなかったら指示違反のエラーも発生しないので、見抜きづらいかも。