大家能推荐一些关于机器学习用于翻译的评估或指标吗?例如日语到英语等。如果可能的话,能否告诉我一些关于指标的论文。我是翻译领域的新手。谢谢!
回答:
尽管从2006年的这篇文章开始,批评和争论不断,BLEU(BiLingual Evaluation Understudy)得分仍然是机器翻译最常用的指标。根据维基百科页面,
BLEU 是一种用于评估从一种自然语言到另一种自然语言的机器翻译文本质量的算法。质量被认为是机器输出与人类输出的对应关系:“机器翻译越接近专业人类翻译,它就越好”——这是 BLEU 背后的核心思想。BLEU 是最早与人类质量判断高度相关的指标之一,并且仍然是最受欢迎的自动化且成本低廉的指标之一。
更具体地说,如果你想了解日英翻译,斯坦福大学 CS 224d 的一个课堂项目使用神经网络技术将简单的日语句子如「彼女は敵だった」翻译成英语,并使用 BLEU 作为评估指标。
如果你想要更多关于机器翻译的阅读材料,我建议从最近最有影响力的文章之一开始,即由 Yoshua Bengio 等人撰写的通过联合学习对齐和翻译的神经机器翻译。你还可以查看引用 BLEU 批评的顶级论文,以了解其他常用的指标。