返回

站长之家 - 热点 2023-12-25 14:06

智源研究院开源代码生成训练数据集与评测基准TACO

站长之家(ChinaZ.com) 12月25日消息:TACO 是一个专注于算法的代码生成数据集，旨在为代码生成模型提供更具挑战性的训练数据集和评测基准。

与当前主流代码评测基准相比，TACO 在数据规模、数据质量和细粒度评测方案上具有明显优势。它包括更大规模的训练集和测试集，每个题目都具备多样化的解题答案，并提供了细粒度的标签，如任务主题、算法、编程技能和难度等级。

实验结果表明，当前流行的代码生成模型在 TACO 评测中与 GPT-4存在显著差异，说明这一领域仍有巨大的提升空间。

TACO 数据集不仅提供了一个挑战性的测试方法，还能作为研究和改进模型性能的训练数据。通过社区的共同努力，可以激发更多创新的解决方案，进一步推动代码生成领域的发展。

微信截图_20231225140816.png

具体特性如下：

规模更大:TACO 包括训练集（25443道题目）和测试集(1000道题目)，是当前规模最大的代码生成数据集。
质量更高:TACO 数据集中的每个题目都尽可能匹配多样化的解题答案，答案规模高达155万条，确保训练时模型不易过拟合以及评测结果的有效性。
提供细粒度标签:TACO数据集中每个题目均包含任务主题、算法、技能及难度等细粒度标签，为代码生成模型的训练与评测更精确的参考。

TACO 开源地址：

论文:https://arxiv.org/abs/2312.14852
智源开放数据仓库:https://data.baai.ac.cn/details/BAAI-TACO
GitHub:https://github.com/FlagOpen/TACO
Hugging Face:https://huggingface.co/datasets/BAAI/TACO

新鲜AI产品点击了解：https://top.aibase.com/

相关话题

推荐关键词

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

三折叠亮相！华为Mate XT非凡大师登上春晚

2025-01-281.3万阅读

宇树科技人形机器人亮相央视春晚：身穿大花袄扭秧歌太科幻了

2025-01-282.7万阅读

牌面拉满！小米汽车SU7 Ultra车模登上央视蛇年春晚

2025-01-282.6万阅读

华为首款百万级豪车！鸿蒙智行尊界S800登上《春晚》舞台

2025-01-282.8万阅读

华为影业上线大片《非遗春节鸿蒙新享》，华为浏览器实力抢镜！

2025-01-281.1万阅读

点赞破万的“国风蛇”！新年开屏暴击：这么美的图，都是谁画的啊！

2025-01-281.1万阅读

波兰人助力《战争机器》

2025-01-281.2万阅读

央视蛇年《春晚》正式开播：李子柒等人开场马丽要演沈腾丈母娘

2025-01-281.1万阅读

底部导航自定义功能再更新，网易云音乐「听劝版」来啦！

2025-01-286600阅读

首个非遗春节将至，浓浓年味藏在华为音乐里

2025-01-281.0万阅读

首个非遗春节来了！鸿蒙原生应用带你解锁南北春节新玩法

2025-01-287762阅读

DeepSeek遭大规模网络攻击周鸿祎：能攻破360服务器的黑客还没出生

2025-01-282.9万阅读

2025不到1个月票房破30亿！肖战《射雕英雄传》新片第一

2025-01-281.9万阅读

武汉可以刷公交卡的动车组蛇年换上了“新皮肤”：太炫！

2025-01-281.1万阅读

2025年第3周中国手机销量TOP 15：华为nova 13进前五

2025-01-281.3万阅读

小米SU7车模去年《春晚》被“薅走”：工程版造价极高

2025-01-288618阅读

马斯克母亲穿唐装出镜拜年：中国人热情好客备受感动

2025-01-282.3万阅读

无人机上岗：空中巡逻破解“幽灵”堵车！

2025-01-282.8万阅读

DeepSeek太火了！创始人说过年回家要躲起来

2025-01-282.1万阅读

赵明辞职微博认证改为前荣耀CEO 前华为悍将李健接任

2025-01-282.7万阅读