返回文章列表
AI

如何提高AI翻译的质量?

小站
2025-11-13
3周前
如何提高AI翻译的质量?

AI技术正重塑翻译行业,机器翻译(MT)与译后编辑(AI+PE)模式已成为主流。翻译质量管理需应对需求多元化、成本压力等挑战,同时借助AI实现自动化与精细化升级。语言服务企业(如语言桥)通过译前风险预判(如数据安全评估、术语提取)、译中人机协作(术语库联动、标准化PE流程)、译后工具质检(AI辅助QA、验收清单)的三阶段流程,结合客户反馈持续优化。质量评估模型从LISA、MQM向动态框架(如TAUS DQF)演进,目标不仅是纠错,更需通过根因分析推动体系完善。AI时代下,人工翻译角色向“专家回路”转型,通过技术、流程与资源的整合,有望平衡时间、成本与质量,实现高效语言服务。


中国翻译协会翻译服务专业委员会成立于2002年11月,是中国翻译协会的第九个分支机构,也是中国译协唯一一个由翻译服务企业组成的委员会。为进一步促进行业交流,推动行业高质量发展,委员会面向会员单位广泛征集翻译服务企业管理运营中的成功经验和有效做法,并联合译世界平台推出“译践”栏目,定期发布语言服务行业最佳实践案例,供行业内外人士参考交流。


本文为“译践”第36期,四川语言桥信息技术有限公司根据自身翻译质量管理体系三个阶段的发展,探讨AI时代下,通过译前预判、译中协作与译后工具实现自动化、高效化和持续改进的质量管理,以期为同行提供参考。


据中国翻译协会发布的《2024全球翻译行业发展报告》:“2023年,全球翻译行业整体发展稳定,增速乐观”;此外,“人工智能技术在翻译行业的应用深刻改变了翻译的生产模式”。根据美国语言公司协会(ALC)与全球语言行业知名研究机构Slator的调查,“58%的翻译机构在工作中使用机器翻译技术”。中国翻译协会的报告指出,就笔译领域而言,“翻译工作流程由传统人工‘译+审+校(TEP)’模式转变为人工智能翻译+译后编辑(AI+PE)模式”。


关于语言服务行业的发展和焦点的演变,翻译自动化用户协会(Translation Automation User Society, TAUS)曾给出非常前瞻且详尽的路线图,指出行业焦点从20世纪80年代采用纸笔翻译文档,到90年代的软件本地化,2000年代的软件全球化在网络同步发布,2010年代与企业系统的集成,2020年代嵌入到各种App中的无缝融合,再到2030年代将无处不在的翻译服务,不仅回顾了语言服务行业的发展脉络,还预测了整体趋势。


如何评估翻译质量,如何做好翻译质量管理,一直是语言服务行业和学术界的热门话题。对此,国内外学者展开了深入的研究。Sheila Castilho等指出:“在行业中,TQA(翻译质量评估)的目标是能够判断和测算出翻译内容的质量水平,确保达到规定标准,可以交付给客户、买方、最终用户等;而在研究中,TQA的目标通常是获得可展示质量显著变化的度量方法,往往体现为对之前工作的改进程度或不同翻译流程之间的改进幅度。”


对语言服务企业而言,翻译质量管理离不开翻译质量评估。在ChatGPT大时代背景下,翻译质量评估和管理面临更大的挑战,但也有很多提效和转型的机遇。挑战是:翻译业务多样化、质量需求多元化、成本时间压力巨大。机遇是:机器翻译(machine translation, MT)的质量越来越好,市场接受度在逐步提升,随着AI大模型的迅速发展,人工翻译的角色也处于转型之中。在AI时代,对每一位翻译而言,对每一个项目而言,提供翻译服务的本质,是在做翻译质量管理,而本文探讨的翻译质量管理,聚焦在笔译服务上。


一、翻译质量评估模型发展简述



在语言服务行业和学术界,如何开展翻译质量评估,一直是颇具争议的话题。在理论上,在实践中,从不同的视角或范式出发,都有不同的评估模型和方法。


就翻译质量评估模型而言,语言服务行业内影响较大的主要有LISA QA Model、SAE J2450、MQM模型,TAUS的动态质量框架(Dynamic Quality Framework, DQF)等。


LISA 模型由本地化行业标准协会(Localization Industry Standards Association,LISA)构建,以错误统计为基础,从语言和格式两方面对翻译质量进行评估。错误程度分为轻微、重大和严重三类,每一类都具有一定的权重,统计错误得分来评估翻译质量。


SAE J2450由国际自动机工程师学会(SAE International)发布,主要用于汽车制造业的翻译质量评估。该模型分为7个错误类型,分别是术语错误、语义错误、漏译、结构错误、拼写错误、标点符号错误、其他错误。


MQM模型由德国人工智能研究中心(German Research Center for Artificial Intelligence,DFKI)开发,目前是由欧盟资助的QTLaunchPad和QT21项目的组成部分。MQM模型将问题划分为7个主要维度,即术语、准确性、语言规范(第一版时采用流利度Fluency)、风格、区域惯例、受众适合度(第一版时采用真实性Verity)和格式。


TAUS在语言服务行业发展的趋势预测和工具的开发上,一直走在行业的前沿。由TAUS提出的DQF基于效用(Utility)、时间(Time)、情绪影响(Sentiment)三个参数,从文本内容类型、目的、用途这三个维度出发,动态地评估质量,以一种灵活的方式关注内容类型、目的和文本的交际语境,而没有采用一刀切的方法。后来,TAUS和DFKI与全球语言术语/翻译与采集联盟(LTAC Global)合作,创建了DQF:MQM。这是一个基于初版MQM和TAUS的DQF的错误类型集合。随后,DQF错误类型成为 MQM 的一个子集。2015年,随着应用程序接口(API)和DQF看板的发布,原本围绕DQF-MQM错误类型构建的质量框架,升级为翻译表现分析工具;如今,DQF看板已成为一体化的稳健工具,可提供各种维度的报告:句段层面、项目层面,或整合为机构内乃至行业内的基准,随时间推移,还能预测趋势。


语言服务企业在运用上述模型评估或保证质量的过程中,采用了不少工具手段。正如Joss Moorkens在Translation Quality Assessment: From Principles to Practice(《翻译质量评估:从原则到实践》)一书中所言:“语言服务企业(LSPs)在流程层面开展翻译质量保证(TQA)工作,其流程步骤是预先定义好的,与翻译工作同步完成,采用单独的质检软件或集成于计算机辅助翻译(CAT)工具中的质检模块,或采用某种评估模型在译后完成。”


在新时代背景下,MT、AI技术为翻译质量评估提供了便利,使得某些质量评估工作AI化变为可能。就语言服务行业而言,翻译原文的质量、项目周期、预算、译员/翻译团队的水平、翻译流程、翻译技术因素、客户要求等等因素都会影响翻译质量,所以在评估时应综合考虑。鉴于原文质量、时间、预算等因素,对语言服务企业而言,都是不太可控的外在因素,本文将主要从翻译流程、技术因素、客户要求等维度,阐述在翻译质量管理上的探索。

二、语言服务企业翻译质量管理体系的发展




本文作者长期在企业内从事质量管理工作,本部分的内容将结合作者在语言桥的质量管理实践展开,归纳起来大致经历了以下三个阶段。


在企业成立后的初期(2000–2010年),翻译流程就划分为译前、译中、译后三个阶段,分阶段对翻译项目进行质量管理,主要由项目经理负责统筹,译前做好术语替换、统一等术语管理工作,译中通过答疑解决翻译难点,译后以调整格式为主,辅以抽查作为质控手段,视为1.0时代。


在2.0时代(2010–2020),开启了全面质量管理,将质量相关方(营销等部门)都纳入整体的质量管理中,从更广的视角来看待翻译质量管理,同时确立了在内部执行的第一版质量评估标准:


错误分类具体类型说明质量扣分
准确性错误漏/增译、错译、数字错误按错误出现的位置和造成的影响,分为致命、严重、一般三个等级致命 10分;重大 5分;一般 1-3分
语言错误可读性差、语法错误、用词错误、拼写错误、标点错误基本在“轻度”“一般”等级1-3分
风格错误一致性错误、大小写错误、专业性欠缺一致性和专业性主要与术语相关,基本在“轻度”“一般”等级1-3分
其他错误格式错误、其他无法归类的错误与标签、排版等相关视严重程度1-5分

▲ 表1 内部质量评估标准1.0版


随着深度学习等技术的不断发展和应用,MT质量实现了质的飞跃。Slator在调查了人工翻译在翻译过程中与机器互动的多种方式之后,发布了Slator Machine Translation Expert-in-the-Loop Report(《机器翻译专家回路报告》),提出由MT辅助,人工翻译专家在流程中与MT互动的工作流模式,现已成为主导的翻译模式。


在MT普遍应用的同时,客户对质量的要求也越来越高。传统的质控方式已不足以满足当前市场的需求,因此需要不断创新,优化翻译质量管理,达到多方位、精细化和高效化。为此,本企业相应调整了翻译质量管理策略,将翻译稿件按照客户的质量要求(需求)分级,质量标准也更加细化、合格标准更高;译员的角色也从单一的翻译角色,转换为在翻译流程中担当起专家的角色(expert-in-the-loop),称为3.0时代(2021–2025)


这一管理策略的转变,也体现在翻译质量管理的职能演变上。在初期阶段,翻译质量管理的任务仅仅由项目经理承担,公司并没有设立专门的质量管理部门,到2014年,成立专门的质量管理部,负责集团翻译部门的质量管理;2018年起,对更多部门展开质量监督,到2023年,升级为质量中心,负责集团整体业务的质量管理,涵盖各个中心。


目前,本企业的翻译质量管理,仍以译前、译中、译后三个阶段为基础,以各质量相关方的参与为准绳,同时兼顾风险识别、根因分析和持续改进,并针对不同质量等级的项目,采取更加灵活的应对方式。


如今,语言服务企业已在生产流程中积极应用MT和大语言模型(large language model, LLM),将AI技术用于译前提取高频词和术语、译中查证术语、查询背景知识等,也在探索CAT、MT以及LLM的结合,提供更加高效、准确和智能化的语言服务。


为此,2023年,本企业的质量中心更新了质量评估标准,将其进一步细化,错误类型分类也更加合理,同时结合稿件所需的译后编辑程度,指定了衡量范围。


鉴于MQM、DQF模型,更适用于本地化项目,而本企业的稿件类型和客户需求非常多元,所以为避免错误大类过于复杂,就仅分为四类。由于更加重视准确性,所以将拼写错误也归在准确性错误里。同时,将准确性视为红线,在所有类型的稿件中,都强调需准确无误。如果出现准确性问题,则缺陷率必定超出规定范围,导致质量不合格。新质量评估标准的大致框架如下:


缺陷类别子类严重程度质量扣分轻度PE深度PE
准确性错误①信息错译致命5
严重3
一般1
信息漏译致命5
严重3
一般1
数字错误致命5
拼写错误/错别字严重3
术语问题致命5
严重3
一般1
正反错译致命5
敏感词/禁用词致命5
语言错误语法错误一般1
用词错误一般1
风格遵从性(风格指南、客户要求等)严重3
一般1
一致性错误一般1
大小写错误一般1
文体匹配一般2
本地化要求一般2
专业性一般1
可读性严重3
一般1
格式标签准确一般1
标点正确一般1
排版格式一般1
其他一般1

▲ 表2  内部质量评估标准2.0版


其中,参考了ISO 18587:2017对轻度PE和深度PE的定义。轻度PE是“获得仅可理解的文本,并没有试图产生与人类翻译相媲美的产品”;深度PE是“获得与人类翻译类似的产品”。根据Slator,轻度PE的目标是使翻译易于理解,事实准确,语法正确(即传达信息的主旨);轻度PE可能适用于内部沟通等稿件;深度PE的目标是提供准确的翻译,术语一致正确,语气和风格恰当;在完成深度PE后,文本应看起来就像是由专业语言学家从一开始就处理过的文本,深度PE通常用于出版类文本。


三、AI 时代下的翻译质量管理流程

随着AI技术的发展,翻译流程和翻译质量管理,也面临着巨大的革新。为此,本企业根据技术的发展,提出了以下质量管理新流程。


(一)译前风险预判和预处理


(1) 评估数据安全


与客户深度沟通,确认客户对安全性和保密性的要求。


(2) 选择机翻引擎,决定是否使用AI


如果有数据安全风险,一般选择内部自研的(垂域)机翻引擎执行预翻译。如果没有相关风险,则结合垂域质量表现,选择MT+AI的方式。


(3) 分析客户质量要求和原文,匹配最合适的流程和确定PE程度


客户的质量要求等级大致分为:浏览级、应用级、专业级、出版级。根据不同的质量要求等级,可匹配如下生产模式:传统的翻译-编辑-审校(TEP)、MTPE、MTPE+AI润色、MTPE+质检/审校/审校+质检。其中,审校是抽审,还是逐句审,是使用母语审校,还是中籍审校,都需要根据客户需求和实际场景确定。


同时,可以通过AI自动评估原文,给出原文质量评分,确定翻译策略或改进原文后再使用机翻。总之,通过自动化工具完成一些重复性、低价值的任务,以提效保质。


(4) 译前预处理


识别和提取关键术语


术语提取和识别可通过AI辅助完成。通过编写术语提取指令,让AI完成译前术语提取。经人工确认后,导入项目术语库。在项目预设置环节,结合术语保护和MT预翻,能确保关键术语的一致性。


明确质量要求和翻译须知


阅读并分析客户的翻译要求和参考文件,明确项目的质量要求和翻译须知,尽量用简洁明晰的语言表达,逻辑清楚,便于掌握。将参考文件做成平行语料,导入记忆库,方便译中参考。


编写风格指南和检查清单


针对长期持续性项目或重点项目,结合客户需求、质量要求、语言风格偏好,编写专属风格指南,约定语言风格(句式等)、行文规范(数量、缩略词规范等)、其他用语规范等。结合风格指南和执行中的风险点,输出检查清单(checklist),译后对照检查,识别错误,正确修改。


根据标签匹配资源


经过长期积累和项目实践,公司资源库里,专兼职译员都有相应的领域、质量等标签。分配项目时,能够匹配到最合适的译员和审校。


(二)译中人机协作


(1) 术语管理


借助公司自研CAT,生产角色在翻译过程中,可通过编辑器向术语库添加术语,同时术语库中的已有术语也会在编辑器中实时提示,供译员或质检人员参考。生产角色还可以搜索翻译记忆库,参考以往术语译法并向术语库添加术语。通过这些措施,能够确保翻译中术语的一致性。


(2) 记忆库管理


首先,利用自动译后编辑(Automatic PE,APE)技术,在大模型的支持下,可以对模糊匹配句段执行自动译后编辑,并保留修订痕迹。人工仅执行少量确认工作,可以减少重复繁杂任务中的人因错误。其次,翻译完的句段存入记忆库,遇到类似上下文时,可随时检索和参考,能提高效率和减少错误。团队成员也可检索和查看已入库译文,相互参考,确保整个项目的术语及翻译风格保持一致。


(3)  制定PE的标准化流程


根据Slator的《机器翻译专家回路报告》,MT可以快速提供初步的翻译结果,由译员对MT结果进行PE;译员先预判MT可能出现的问题,然后修改,这可以大大提高单位时间产量。同时,减少人工输入,也可以避免人工引入拼写错误、数字错误等低级错误。换言之,MT彻底革新了译员的工作方式,刷新了人均单位时间产量。而专家回路的引入也彻底革新了语言服务行业的项目管理和翻译流程。根据客户使用场景和用途的不同,出现了纯机翻(pure MT)、MTPE等全新的生产模式,例如轻度PE、深度PE、自动(automatic)PE、交互式(Interactive)PE、自适应(Adaptive PE)等类型。实际项目场景中,生产团队结合客户质量要求、源语言文本特点、工期、成本等因素,定制具体PE流程和检查项,提供符合客户需求且令客户满意的交付件。


(4)  执行自动质量评估(Automatic quality evaluation,AQE)


将MT质量自动评估结果,作为PE过程中人工检核的参考,提高PE效率和准确性。


(5)  质量抽查或验收


在生产环节中,质检人员、审校、项目管理人员或质量部门可以几乎同步进行质量抽查或验收。将发现的问题及时反馈给相关人员,在过程中就能改善质量。同时,质量部门也会记录问题并保持追踪,直至问题闭环。


(6)  过程管理


CAT存储了修订记录,质检人员等可以实时查看修改记录,通过修改痕迹和编辑率协助项目中的质量评估、质量控制等决策。


(三)译后妙用工具


(1)  QA(AI辅助定位)


一方面,利用编辑器中内嵌的QA模块,就数字、拼写、一致性、术语、标点、句段等检查项,翻译、质检人员可以逐一确认译文是否正确。另一方面,采用大模型对译文执行自动评测,输出质量评估报告,供质检人员等质控角色在项目中追踪质量或回稿后验收时参考。


(2)  对照检查清单完成验收


质检人员/项目管理人员对照检查清单,对收回的稿件进行验收,并最终定稿交付给客户。


结合上述分析,翻译流程迎来全新的模式,如图:                                              


翻译流程新模式


(四)客户反馈与持续改进


此外,正如在2.0时代提出的全面质量管理翻译相关方概念,翻译质量管理不应局限于对翻译部门的管理。要实现好的翻译质量,其实涉及更多的维度。Nimdzi提出的语言质量管理幅度,就囊括了语言服务企业的方方方面:质量模型、供应商管理、供应链、用户体验、技术、指标和财务。在3.0时代的翻译质量管理中,企业不仅深化译文质量管理,同时也纳入供应商、用户体验、流程规范管理等,将全面质量管理做得更深、更广、更落地。


通过客户意见或投诉,识别质量问题,分析根因,拟定改进措施,监督执行。根据抽查数据,形成质量看板,更直观、动态地展示客户与项目维度的质量情况,记录追踪团队和生产角色的个人质量表现。此外,以年度为单位,实施客户满意度调查,为客户提供更好的服务体验。


发现问题,只是质量管理的第一步。好的质量管理,不应局限在质量评估上,而是在质量评估的基础上,通过数据分析,根因分析,促进流程的改进,体系的完善,协助翻译部门和企业持续地改进,稳步提升质量,做好客户服务,为客户创造价值。


四、结语

简言之,AI时代下的翻译质量管理,在MT和AI的加持下,将更加的自动化和高效化。另一方面,AI时代下的翻译质量管理,是项目管理、知识管理、资源管理、技术研发、质量体系建设的有机结合。没有知识管理和资源管理的支撑,没有技术工具的助力,再好的质量体系框架也是空谈,而项目管理始终贯穿在质量管理的实施过程中。翻译质量评估的目的,不仅仅是发现错误,更是为了质量的持续改进。所以,翻译质量评估还需与根因分析、流程改进、体系建设相结合,才能真正地提升翻译质量。


此外,新时代对翻译的角色也提出了新的要求,翻译不再是单纯的把一种语言转换为另一种语言的写作人员,而是在MT或AI的助力下,识别问题,解决问题,擅于判断和选择的高级编辑人员,甚至发展为项目经理、语言顾问或专家。人工翻译与MT、AI技术需紧密结合起来。


本文内容仅供参考,不构成任何专业建议。使用本文提供的信息时,请自行判断并承担相应风险。

分享文章
合作伙伴

本站所有广告均是第三方投放,详情请查询本站用户协议