torchtext.data.metrics¶
bleu_score¶
- torchtext.data.metrics.bleu_score(candidate_corpus, references_corpus, max_n=4, weights=[0.25, 0.25, 0.25, 0.25])[source]¶
计算候选翻译语料库和参考翻译语料库之间的BLEU得分。基于https://www.aclweb.org/anthology/P02-1040.pdf
- Parameters:
候选语料库 – 候选翻译的可迭代对象。每个翻译是一个标记的可迭代对象
参考语料库 – 可迭代的参考翻译集合。每个翻译是一个词元的可迭代集合。
max_n – 我们想要使用的最大n元语法。例如,如果max_n=3,我们将使用单字词、双字词和三字词。
权重 – 每个n-gram类别的权重列表(默认为均匀分布)
示例
>>> from torchtext.data.metrics import bleu_score >>> candidate_corpus = [['My', 'full', 'pytorch', 'test'], ['Another', 'Sentence']] >>> references_corpus = [[['My', 'full', 'pytorch', 'test'], ['Completely', 'Different']], [['No', 'Match']]] >>> bleu_score(candidate_corpus, references_corpus) 0.8408964276313782