Rouge 和 bleu 是机器翻译、摘要生成以及阅读理解等领域经常用到的评估指标,这篇文章我们就来认识一下这两个指标: 相关文章:rouge: Rouge(recall oriented understudy for gisting evaluation)可以理解为bleu指标的改进版,它们均可用来衡量生成结果和标准结果的匹配程度,不同的是rouge基于召回率,bleu更看.
ROUGE scores for summaries using dif ferent similarity measures. OPT




