Routledge Studies in Translation Technology and Techno-Humanities Controlled Document Authoring in a Machine Translation Age
「以下の书类を提出します」
この文を英语に訳してくださいと言われたらどうしますか。高校の英语の授業課題であれば、適当に主語を補完して、“I will submit the following document.”とすれば十分かもしれません。しかし、現実の产业翻訳であれば、この文がどのようなジャンル?分野のどのような文書のどのような場所に書かれているか、といったことを確認した上で訳す必要があります (というより、そのような確認をした上で翻訳が開始されるはずです)。例えば、この文が、自治体が発信する市民向けの文書において行政手続きを順を追って説明する箇条書きの一つだとします。またこの文の直後に、提出すべき書類が2つ書かれていたとします。そうすると、“Submit the following documents.”のように、命令文を使用し、「書類」は複数形で訳出する方法が候補にあがるでしょう。もちろん、これ以外にも翻訳の目的や準拠すべきスタイルガイドに照らしながら、最終的な訳文が作られます。
プロの翻訳者であれば、妥当な翻訳に到達するために、このような判断は「当たり前」にやっているはずです。それでは、機械翻訳ではどうでしょうか。本書では、機械翻訳を用いながら、文書の属性や要素を考慮した翻訳を実現する方法を提案し、その効果を検証しています。ポイントは、機械翻訳そのものに手を加えるのではなく、入力である日本语原文をうまく編集することです。例えば、上記の例では、箇条書きの動作ステップでは、翻訳前処理の段階で、原文を「~提出しろ」という命令文に書き換えておくことで、英语でも“Submit ...”と命令形で訳す可能性が上がります。単純ではありますが、文書の構造に応じた言语の表現形式を定め、執筆の段階で十分に表現を統制することで、機械翻訳の高度な活用が期待できます。なおここで、「文書の構造」や「言语の表現形式」とはそもそも何であり、どのような種類のものがあるかについては、プロの翻訳者の間でも、必ずしも明確な知識として共有されているわけではありません。それを言葉にし、地道に整理する作業が本書の第II部でなされています。
本書の研究では、現在主流の方式である深層学習を用いたニューラル機械翻訳は扱われていません。自然言语処理技术がめまぐるしく進展する中で、本書で扱う個々の技术自体は正直なところ時代遅れになりつつあります。しかし、現在の機械翻訳は、依然として文書の属性や要素を広範かつ明示的に考慮するものではありません。大量の訓練データからそれらを暗黙的に学んでいるともいえますが、翻訳結果についてなぜそれでよいのかを説明してくれるわけではありません。また、最近では、ChatGPTなど大規模言语モデルを活用した生成系AIサービスが注目され、言葉で具体的な指示を与えることでよりよい翻訳を出力する可能性も模索されています。文書や言语を精密に理解し制御するという本書で示した枠組みは、最新の技术を用いて、改めて検証する価値があるといえます。
なお、本書の研究の展開として、翻訳において参照されうる文書の属性や要素をより網羅的に整理する作業を進めており、その成果は、产业翻訳を主な対象とした翻訳プロセスのメタ言语を作る試みの一つとして书籍化されています。
(紹介文執筆者: 教育学研究科?教育学部 講師 宮田 玲 / 2023)
本の目次
1. Introduction
2. Related work
Part II. Controlled document authoring
3. Document formalization
4. Controlled language
5. CL contextualization
6. Terminology management
Part III. MuTUAL: An authoring support system
7. System development
8. Evaluation of the CL violation detection component
9. System usability evaluation Part
Part IV. Conclusion
10. Research findings and outlook
関连情报
第50回日本図书馆情报学会赏 (日本図书馆情报学会 2021年度)
第37回電気通信普及財団賞 (テレコム学際研究賞) (電気通信普及財団 2021年度)
书评:
Xie’an Huang & Hong Xu 評(『Language Resources and Evaluation』Vol.57 pp.1423–1430 2023年)
清田陽司 評 (『日本図書館情報学会誌』67巻3-4号 pp.167–168 2021年)