机器翻译评测技术分析

发布时间:2020-12-06

机器翻译的评测技术对机器翻译的研究和发展具有重要的意义,有了评测,我们才可以评价各种机器翻译方法的优劣,并且为机器翻译方法的改进提高知道。北京找我翻译公司觉得我们也可以通过评测评价机器翻译系统的性能,因此机器翻译评测技术同样是机器翻译研究领域的一个重要课题。机器翻译的评测方式现阶段有两种:人工评测和自动评测。其中人工评测包括:译文用词是否准确;是否忠于原文的语法语义;以及译全率、流利度等等。人工评测主要是以译文的用词、语法、语义等为标准来判断译文是否忠实于原文,评测比较精准,同时具有主观性。


北京找我翻译提出目前机器翻译的自动评测标准主要有 IBM 的BLEU 标准[23]和NIST 提出的NIST 标准[24]。BLEU 方法是一种基于N-Gram 的自动评测方法,它的主要思想是统计共现的N 元词的个数,即比较在参考译文中和系统的翻译结果本人现的N元词的个数,一元词的共现代表了翻译的忠实度,表明原文中有多少词被翻译过来。二元以上的共现反映了译文的流利度。北京找我翻译公司觉得BLEU 方法还引入长度惩罚因子,考虑了译文长度对翻译质量的影响。IBM 的研究报告说明BLEU的评测效果和人工评测效果比较一致。NIST 评测技术是BLEU 评测技术的一个改进,每个N 元词被赋予权重,一个N 元词在参考译文中出现的次数越多,则这个N 元词包含了更多的信息量,权重更高。同时NIST 采用算术平均而不是几何平均,一元词的共现结果对评分结果影响更大,使得评价更能反映忠实度。NIST 还改进了长度惩罚因子,减少了译文句子长度对评分结果的影响。目前的机器翻译评测基本上采取人工评测和自动评测相结合的方法。