站长之家 - 业界 2023-06-09 10:04

智源研究院推出FlagEval“天秤”大模型评测体系

站长之家(ChinaZ.com) 6月9日 消息:在今日的2023北京智源大会上,智源研究院宣布推出FlagEval(天秤)大语言模型评测体系。该体系从“能力、任务、指标”三维评测角度出发,结合超过600个维度对大模型进行全面测评。

据悉,天秤大模型的任务维度目前包含22个主观和客观评测数据集,共计超过84433道评测题目。

人工智能 AI 机器人 机械手 (2)

智源研究院院长黄铁军指出,大模型至少需要具备三个特点。第一,规模要大,需要达到百亿参数级别;第二,涌现性,能够产生预料之外的新能力;第三,通用性,不限于专门问题或者领域。

推荐关键词

24小时热搜

查看更多内容

大家正在看

大模型不需要眼前的共识

小红书的大模型有点怂