站长之家 - 原创 2026-05-22 16:51

AI日报:字节开源统一多模态大模型Lance 3B;智谱发布GLM-5.1高速版;CapCut与Gemini合作推出深度集成

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、字节跳动开源Lance 3B:用一个“脑子”同时搞定图视理解与生成

字节跳动开源了其原生统一多模态大模型Lance,以3B参数实现全功能覆盖,打破了理解模型与生成模型之间的技术壁垒。Lance通过共享上下文和能力解耦并行设计,实现了图像、视频的理解、生成与跨模态编辑的统一。

image.png

【AiBase提要:】

✨ Lance采用共享上下文和能力解耦并行设计,实现多模态任务统一。

🚀 3B参数量实现全功能覆盖,打破传统模型的技术高墙。

🔧 开源Apache2.0协议,平民级算力即可运行,降低部署成本。

2、智谱发布GLM-5.1高速版:400 tokens/s飙出全球API新极限

智谱发布GLM-5.1高速版API,以400tokens/s的速度刷新全球大模型API速度上限,实现旗舰级全尺寸能力与极致低延迟并存,通过系统级工程优化提升模型性能,推动AI应用的高效发展。

【AiBase提要:】

🧠 智谱GLM-5.1高速版API实现400tokens/s输出速度,刷新全球大模型API速度上限。

🚀 实现旗舰级全尺寸能力与极致低延迟并存,打破行业惯例。

🔧 通过系统级工程优化,包括推理引擎、调度系统和基础设施层的协同优化,提升模型性能。

3、CapCut 与 Gemini 合作推出深度集成:AI 创作工具实现智能互联

CapCut 与 Google Gemini App 合作,用户可在 Gemini 应用内直接调用 CapCut 的高级创意和编辑功能,进一步推动 AI 工具在内容创作领域的普及与创新。

image.png

【AiBase提要:】

🚀 CapCut 与 Google Gemini App 合作,用户可在 Gemini 应用内直接调用 CapCut 的高级创意和编辑功能。

💡 此次合作旨在打造更无缝、高效的 AI 创作体验,降低跨应用切换成本。

🌟 CapCut 表示未来创作方式将更加对话化、直观化,并实现智能集成。

4、OpenAI 发布 ChatGPT for PowerPoint:一句话生成 PPT,还能主动揪 Bug

OpenAI 推出 ChatGPT for PowerPoint 插件,使用户能够通过简单的指令快速生成和优化 PPT 内容,同时具备智能分析和修改功能,极大提升了办公效率。

image.png

【AiBase提要:】

✨ 零门槛全免费,全球用户均可体验 ChatGPT for PowerPoint 插件。

💡 支持从零新建 PPT、一键修改/润色页面,甚至能“复盘”方案。

🔒 引入关键操作确认机制,确保每一处修改都可控。

5、WordPress 7.0 正式发布:原生集成 AI 迈入智能建站新时代

WordPress 7.0 正式发布,原生集成AI能力,标志着网页搭建迈入智能化阶段。新版在内容创作、后台界面和移动端体验方面进行了全面升级,为用户带来更高效、流畅的建站与编辑体验。

image.png

【AiBase提要:】

🧠 原生集成AI能力,提升内容创作效率。

🎨 后台界面现代化,优化用户体验。

📱 移动端自定义功能增强,提升响应式编辑能力。

6、Spotify 联手环球音乐推出 AI 翻唱与混音:正版版权的“降维打击”来了

Spotify与环球音乐合作推出AI翻唱和混音功能,标志着音乐版权领域的一次重大变革。该功能基于合法授权,为用户提供了全新的创作方式,并通过合理的分成机制保障了艺术家的利益。这一举措不仅提升了Spotify的市场竞争力,也对其他AI音乐平台形成了有力的挑战。

【AiBase提要:】

🎧 Spotify与环球音乐达成AI翻唱和混音协议,为粉丝提供合法创作工具。

⚖️ 强调“知情同意、致敬署名和合理报酬”的黄金三原则,区别于其他AI平台的侵权模式。

📈 Spotify股价因AI战略暴涨13%,展现其在音乐版权领域的强大影响力。

7、拒绝“人机单聊”!UniClaw2026 公测:AI 正在迈入“多人社交模式”

北京本源万象人工智能科技有限公司推出的全新AI原生即时通讯产品UniClaw,其突破了传统单聊对话框模式,将AI从单人效率工具升级为群体协作的社交Agent,开启了AI的多人协作模式。文章还详细描述了UniClaw的三大核心角色以及开放的Agent应用社区。

【AiBase提要:】

✨ UniClaw作为AI原生即时通讯产品,打破了传统单聊对话框模式,开启AI多人协作模式。

🧠 AI智能体(Agent)在群组中承担信息中枢、沟通润滑剂和主动协调人的角色,提升协作效率。

🚀 开放的Agent应用社区降低了使用门槛,用户可一键引入特定功能的Agent,实现即插即用。

8、拒绝彩排,真刀真枪上舞台!美团LongCat-Video-Avatar1.5开源:全面击败主流闭源模型

美团龙猫大模型团队正式开源商用级数字人视频生成模型 LongCat-Video-Avatar1.5,该版本在唇形同步、物理合理性、长视频稳定性等方面实现全面跃升,并通过多项技术升级显著提升了模型的商业应用价值和用户体验。

image.png

【AiBase提要:】

🧠 模型将音频特征提取编码器从 Wav2Vec2 升级为 Whisper-large,提升音素变化与发音节奏的捕捉能力。

🔄 引入 GRPO 技术,优化手部与连续性对齐,解决手部畸变和动作不连贯问题。

🚀 采用 DMD 技术,推理效率提升 15 倍,生成一段 10 秒视频仅需约 1 分钟。

详情链接:https://github.com/meituan-longcat/LongCat-Video

ChatGPT源码推荐:小狐狸ChatGPT付费创作系统完全开源源码

推荐关键词

24小时热搜

查看更多内容

大家正在看