站长之家 - 业界 2024-04-17 17:16

千亿开胃菜 中国电信开源12B星辰大模型:性能提升30%

重大进展:中国电信开源 12B 规模 AI 巨模 TeleChat-12B

4 月 17 日,中国电信宣布开源其 120 亿参数规模的巨型人工智能模型 TeleChat-12B。这一举措标志着我国大模型技术发展取得又一次突破。

与先前发布的 70 亿参数版本相比,TeleChat-12B 在各方面均取得了显著提升。在内容理解、性能表现和应用场景方面,提升幅度约为 30%。尤其是在多轮对话推理和安全相关领域,能力提高超过 40%。

据悉,中国电信计划今年推出参数规模高达万亿级的超大型 AI 模型。

为保证模型的高性能,TeleChat-12B 将训练数据量从 1.5TB 扩展至 3TB,大幅提升了数据的质量和模型的性能。

此外,通过利用电信用户实际交互数据优化奖励模型和强化学习模型,TeleChat-12B 在问答场景中的表现得到进一步提升。

目前,TeleChat-12B 已广泛应用于文本创作、编程、网络故障分析和业务经营分析等多种实际场景。其中,在文本创作方面,该模型平均生成的文本长度超过 1500 字,采纳率高达 85.7%。

在服务企事业单位客户中,TeleChat-12B 支持企业经营分析、政务咨询、民生诉求响应等多样化场景,覆盖率达到 95%,多轮对话理解准确率为 90%。

除了在传统行业中的应用,TeleChat-12B 也在积极探索前沿领域的应用,如无人机智能编排和轻量化建设方面取得了新进展。

推荐关键词

24小时热搜

查看更多内容

大家正在看

拼多多AI大模型暗战