站长之家用户 - 传媒 2024-08-21 16:17

加速原生创新，智谱携手昇腾、昇思打造自主创新原生模型

2024年8月19日，北京人工智能生态大会在中关村国家自主创新示范区会议中心颐和厅成功召开。智谱CEO张鹏作专题分享，简要介绍了昇腾对自主创新的智谱大模型的助力，以及正在打造的基于昇腾的第四代代码模型CodeGeeX4和多模态模型CogVLM2-video，华为昇腾计算业务副总裁刘鑫介绍昇腾原生进展。

智谱代码生成大模型CodeGeeX4的新版本基于昇腾AI与昇思AI框架训练，依托昇腾与昇思的多维混合分布式并行技术等软硬件能力等，将大幅提升模型开发、训练的效率及模型精度。

智谱CEO 张鹏

华为昇腾计算业务副总裁刘鑫

模型能力

1.代码生成大模型CodeGeeX4

第四代代码模型CodeGeeX4堪称代码生成大模型的“六边形战士”，已经发布的CodeGeeX4-ALL-9B 仅用百亿级参数实现模型精度超越业界主流产品。在NaturalCodebench等测试基准上，相对于更大的模型实现了性能反超。

CodeGeeX4单一模型实现编程开发全流程覆盖，包括需求设计、前端开发、后端开发、数据处理等场景，支持代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等全面能力。模型长序列达128K，支持中文、英文、俄语、法语、西班牙语等20+自然语言和300+编程语言。同时，在模型推理可实现单卡部署，较低24GB显存即可进行量化推理，用户可在本地私有化部署，保护企业代码安全。

2.多模态大模型CogVLM2-video（视频生成文本）

多模态大模型CogVLM2-video实现视频生成文本能力，支持2K序列长度、224×224分辨率的视频理解以及中英文回答等功能。测试实践显示，CogVLM2-video在多个视频问答任务上达到了state-of-the-art SOTA模型）的性能，并能够实现一分钟内的视频理解，在几个主流性能测试数据集（MVBench， VideoChatGPT-Bench and Zero-shot VideoQA datasets)中，CogVLM2-video也表现不俗，展现出全面竞争力，同时在多类主要指标上完成对其他模型的领先。

基于昇腾与昇思的新版本CodeGeeX4

CodeGeeX4在训练过程中，调用昇腾原生的融合算子，利用昇思MindSpore AI框架的提供的多维混合分布式并行能力，通过对流水交织并行、tensor模型并行的优化，解决内存瓶颈、降低计算空泡、提升通信效率，实现“计算、网络、存储”协同优化，对比同等规模参数的模型，训练效率20%提升，加速模型的迭代创新。

另外，该模型也采用MindSpore2.3版本原创的多级编译技术，开启O1编译选项增加自动算子融合优化，以接近动态图的启动时间获取了图模式下接近理论值的内存复用率，进而降低重计算比例，相对动态图获得15%的性能收益。

未来，智谱将与昇腾AI持续携手，打造更多领先的自主创新大模型，加速人工智能产业发展，助力中国千行百业的智能化转型，共同迈向智能新世界。

ChatGPT源码推荐：小狐狸ChatGPT付费创作系统完全开源源码

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

加速原生创新，智谱携手昇腾、昇思打造自主创新原生模型

推荐关键词

24小时热搜

大家正在看

百度今年将发布人工智能模型Ernie 5.0：大幅增强多模态能力

优刻得率先完成基于华为昇腾国产芯片的DeepSeek模型适配

AI日报：可生成汉字！智谱开源文生图模型CogView4；大模型工具Ollama存在严重漏洞；腾讯元宝下载量超DeepSeek

阿丘科技荣登苏州市人工智能大模型与高质量数据集双项榜单

全国人大代表周云杰：人工智能大模型创造美好生活、提振消费活力

全球首次！2B复现DeepSeek-R1「啊哈时刻」，UCLA等用纯RL实现多模态推理

Google 将使用人工智能来判断用户的年龄

360发布DeepSeek大模型一体机，打通大模型落地“最后一公里”

单机也可跑DeepSeek 671B满血大模型——海曦大模型一体机推新品

政策驱动下，AI代码生成的三大技术突破方向

李彦宏回应文心大模型4.5开源：DeepSeek让我们明白要将最优秀模型开源

北京将人工智能纳入课程：中小学校从今年秋季都要学！

DeepSeek超越150万模型：成全球最受欢迎开源大模型

“复制”DeepSeek，量化巨头为何能成大模型顶流？

国外权威认证！DeepSeek超150万模型，成最受欢迎开源大模型

智谱开源AI绘图CogView4，曾经的开源之光回来了。

全国两会聚焦人工智能：AI不是数字劳工，关键是数字共生

e签宝AI合同大模型已接入DeepSeek！

反超DeepSeek！阿里万相大模型登上全球开源榜首

DeepSeek给的压力太大，前国产大模型之光Kimi变阵