重大进展:中国电信开源 12B 规模 AI 巨模 TeleChat-12B
4 月 17 日,中国电信宣布开源其 120 亿参数规模的巨型人工智能模型 TeleChat-12B。这一举措标志着我国大模型技术发展取得又一次突破。
与先前发布的 70 亿参数版本相比,TeleChat-12B 在各方面均取得了显著提升。在内容理解、性能表现和应用场景方面,提升幅度约为 30%。尤其是在多轮对话推理和安全相关领域,能力提高超过 40%。
据悉,中国电信计划今年推出参数规模高达万亿级的超大型 AI 模型。
为保证模型的高性能,TeleChat-12B 将训练数据量从 1.5TB 扩展至 3TB,大幅提升了数据的质量和模型的性能。
此外,通过利用电信用户实际交互数据优化奖励模型和强化学习模型,TeleChat-12B 在问答场景中的表现得到进一步提升。
目前,TeleChat-12B 已广泛应用于文本创作、编程、网络故障分析和业务经营分析等多种实际场景。其中,在文本创作方面,该模型平均生成的文本长度超过 1500 字,采纳率高达 85.7%。
在服务企事业单位客户中,TeleChat-12B 支持企业经营分析、政务咨询、民生诉求响应等多样化场景,覆盖率达到 95%,多轮对话理解准确率为 90%。
除了在传统行业中的应用,TeleChat-12B 也在积极探索前沿领域的应用,如无人机智能编排和轻量化建设方面取得了新进展。