使用现有的人工翻译来辅助机器翻译到新语言

过去,我的公司使用专业的人工翻译人员将我们的软件从英语翻译成大约13种语言。虽然费用高昂,但质量很高。

我们正在翻译的应用程序包含行业术语。其中还包含很多句子片段和单个词语,这些在脱离上下文的情况下,很难被正确翻译。

我想知道是否有机器翻译系统或服务可以利用我们现有的专业翻译,更准确地将内容翻译成任何新语言。

如果一个行业术语、短语或句子片段已经从en-US翻译到es-AR、pt-BR、cs-CZ等,那么这些之前的翻译难道不能作为提示,用于确定在新语言中应选择的正确词汇吗?它们可以在某种意义上用于三角测量。最坏的情况,它们可以用来创建一个多数投票系统(例如,如果13种语言中有9种将一个短语翻译成新语言中的相同内容,我们就采用它)。

有谁知道有这样的机器翻译服务吗?


回答:

是的。自2014年以来,十年间发生了很多变化。

截至2023年,现在有十多家可定制的云API提供商,其中许多是自助服务的。

例如,谷歌翻译在2018年推出了定制服务,在2016年推出神经机器翻译之后,这使得提供服务变得更加容易。

来自machinetranslate.org/customisation的资料:

14个API支持定制。

您描述的定制类型,使用您自己的平行数据进行训练,是最常见的。如今,这通常是通过微调实现的。

主要的机器翻译API提供的基本定制类型包括:

  • 微调 – 使用平行数据训练模型
  • 自适应 – 类似于微调,但可以即时更新
  • 术语表 – 定义特定术语
  • 礼仪 – 正式或非正式的第二人称

还有其他提供的定制方法,比如选择特定的地区,如加拿大法语,或特定的领域,如时尚。

基本上,这是在简易性和控制性之间的权衡 – 很多这些方法基本上是一个参数或一个按钮点击,但引擎甚至无法希望像在您的训练数据上微调的模型那样反映您的风格。

警告:即使一个API支持定制,并且该API已集成到您的翻译管理系统中,该集成并不一定支持使用您定制的API版本。因此,在您投入时间进行定制之前,检查您的TMS集成,确保它确实允许您访问您的定制机器翻译。

例如,XTM中没有ModernMT的集成。有谷歌翻译的集成,但它仅通过微调支持定制,而不通过术语表支持。


完全披露:我是Machine Translate的创始人,也是该非营利基金会的一个主要贡献者,该基金会致力于让更多人更容易地使用机器翻译,并提供开放的信息和社区支持。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注