使用现有的人工翻译来辅助机器翻译到新语言

过去,我的公司使用专业的人工翻译人员将我们的软件从英语翻译成大约13种语言。虽然费用高昂,但质量很高。

我们正在翻译的应用程序包含行业术语。其中还包含很多句子片段和单个词语,这些在脱离上下文的情况下,很难被正确翻译。

我想知道是否有机器翻译系统或服务可以利用我们现有的专业翻译,更准确地将内容翻译成任何新语言。

如果一个行业术语、短语或句子片段已经从en-US翻译到es-AR、pt-BR、cs-CZ等,那么这些之前的翻译难道不能作为提示,用于确定在新语言中应选择的正确词汇吗?它们可以在某种意义上用于三角测量。最坏的情况,它们可以用来创建一个多数投票系统(例如,如果13种语言中有9种将一个短语翻译成新语言中的相同内容,我们就采用它)。

有谁知道有这样的机器翻译服务吗?


回答:

是的。自2014年以来,十年间发生了很多变化。

截至2023年,现在有十多家可定制的云API提供商,其中许多是自助服务的。

例如,谷歌翻译在2018年推出了定制服务,在2016年推出神经机器翻译之后,这使得提供服务变得更加容易。

来自machinetranslate.org/customisation的资料:

14个API支持定制。

您描述的定制类型,使用您自己的平行数据进行训练,是最常见的。如今,这通常是通过微调实现的。

主要的机器翻译API提供的基本定制类型包括:

  • 微调 – 使用平行数据训练模型
  • 自适应 – 类似于微调,但可以即时更新
  • 术语表 – 定义特定术语
  • 礼仪 – 正式或非正式的第二人称

还有其他提供的定制方法,比如选择特定的地区,如加拿大法语,或特定的领域,如时尚。

基本上,这是在简易性和控制性之间的权衡 – 很多这些方法基本上是一个参数或一个按钮点击,但引擎甚至无法希望像在您的训练数据上微调的模型那样反映您的风格。

警告:即使一个API支持定制,并且该API已集成到您的翻译管理系统中,该集成并不一定支持使用您定制的API版本。因此,在您投入时间进行定制之前,检查您的TMS集成,确保它确实允许您访问您的定制机器翻译。

例如,XTM中没有ModernMT的集成。有谷歌翻译的集成,但它仅通过微调支持定制,而不通过术语表支持。


完全披露:我是Machine Translate的创始人,也是该非营利基金会的一个主要贡献者,该基金会致力于让更多人更容易地使用机器翻译,并提供开放的信息和社区支持。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注