大模型长文本能力测试,又有新方法了!腾讯MLPD实验室,用全新开源的“数星星”方法替代了传统的“大海捞针”测试。相比之下,新方法更注重对模型处理长依赖关系能力的考察,对模型的评估更加全面精准。利用这种方法,研究人员对GPT-4和国内知名的Kimi Chat进行了“数星星”测试。结
本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。