站长之家 - 业界 2023-10-23 09:43

中科院国家天文台开源天文大模型 StarWhisper

站长之家(ChinaZ.com)10月23日 消息:中科院国家天文台的开源星语 StarWhisper 天文大模型在甲骨文 AI 研究院与 LanguageX AI Lab 联合发布的 CG-Eval 上获得了总排名第二的成绩。该模型在数学推理和天文能力方面接近或超过了 GPT3.5Turbo。

星语StarWhisper是一个基于天文大模型StarGLM开发的开源项目,旨在提升大模型在天文通用知识和多模态任务上的能力,为未来可部署于望远镜阵列的科学具身智能——司天大脑打下基础。

image.png

项目地址:https://github.com/Yu-Yang-Li/StarWhisper

星语StarWhisper系列模型包括6B,7B,13B,14B,20B等规模,通过数据集清洗、监督微调、DPO等方法,缓解了大模型在天文领域的幻觉现象,提升了数学推理、代码能力等方面的表现。

星语StarWhisper可以通过AI-wisemodel平台下载模型权重后加载,也可以通过Wenda(闻达)实现多种天文相关的文本处理、知识库回答、AI绘画等任务。项目源码遵从Apache-2.0license,部分模型权重使用需遵从相应许可。

星语StarWhisper是司天工程的备选方案之一,司天工程是我国面向时域天文学所提出的“十五五”天文重大基础设施,一期计划在国内多个优选观测台址布置54台(18组)口径1米级的大视场望远镜,组成多波段同时监测网络。

核心功能:

  • 整合天文知识,缓解幻觉现象
  • 处理天文多模态任务,如图像生成与识别
  • 提升数学推理、代码能力等
  • 适配司天工程的观测Agent需求
  • 开源代码和部分模型权重

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看