AI日报：快手上线可灵网页端并开源可图Kolors；达摩院AI视频平台“寻光”炸场；月之暗面推Kimi浏览器插件

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、可灵AI又放大招：上线Web端，增加首尾帧控制、运镜控制等功能

可灵AI最近发布了重磅新功能，包括Web端上线、画质提升、首尾帧和镜头控制功能加入，文生视频时长延长至10秒。更新内容涵盖基础模型升级、首尾帧控制、镜头控制、文生视频时长增加、图生视频功能增强和Web端上线。可灵AI能生成高清视频，支持1080p分辨率，提供个性化视频控制选项，让用户创作更丰富多彩的内容。网页端服务免费上线，未来还将支持语音唇形同步等功能。

【AiBase提要:】
🚀 基础模型升级，支持1080p分辨率，画质达到电影级水准。
💡 首尾帧控制，用户可定制视频起始和结束画面，提升个性化创作体验。
🎥 镜头控制功能增加，包括横移、摇镜头等，让视频更生动有趣。
详情链接:https://top.aibase.com/tool/keling-ai

2、快手开源图像生成模型可图Kolors

快手今天放出了一项重磅消息，开源了自家的图像生成模型“可图 Kolors”，这一模型经过数十亿的文本图像对训练，搭载了通用语言模型（GLM）作为文本编码器，支持中英双语提示词，具有长文本处理能力和海量数据训练。可图 Kolors 还特别优化了中国文化元素，支持中文文字生成，展现出强大的技术支撑和文化传承。

QQ截图20240708111705.jpg

【AiBase提要:】
🌟 中英双语支持: 采用通用语言模型（GLM）作为文本编码器，支持中英文提示词，能处理长达256个token的上下文。
🚀 长文本处理能力: 支持长达256个token的上下文长度，让创作者能够细致描绘心中所想，无论是复杂场景还是丰富故事。
💡 海量数据训练: 在数十亿个文本图像对上进行训练，模型拥有庞大的知识库，能够生成多样化且精准的图像。
可图入口:https://top.aibase.com/tool/kuaishouketudamoxingkolors
详细内容介绍：https://www.aibase.com/news/10085

3、快手推出AIGC微短剧《山海奇镜之劈波斩浪》

快手推出国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》，结合传统魅力与现代科技，为观众带来震撼的观看体验。通过大模型技术支持，呈现升级后的视觉效果，推动微短剧行业发展，引领“AIGC+微短剧”新潮流。

【AiBase提要:】
🎬 快手推出国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》
💡 微短剧以《山海经》为灵感来源，赛博风格复现上古神话世界中的神怪异兽和奇花异草
🌟 快手推出“星芒短剧×可灵大模型”创作者孵化计划，支持AIGC微短剧的创作
详细内容：https://www.aibase.com/news/10075

4、月之暗面推出 Kimi 浏览器插件支持点问笔、总结器等功能

Moonshot AI推出的Kimi浏览器插件为用户提供了点问笔和总结器两大功能，优化了用户在网页和应用中的体验。插件支持全局浮窗和侧边栏模式，方便用户在写作时进行持续对话和搜索。同时，Kimi还进行了体验优化，包括支持PDF文件打开、搜索引用溯源、内容复制等功能。双端同步更新还增加了计算器和问题推荐功能。

【AiBase提要:】
🖊️ 点问笔功能让用户通过划选文字获取即时解释和答疑
📝 总结器位于网页右下角，帮助用户快速总结全文内容
🔗 支持快捷键召唤Kimi，提供便捷操作和功能推荐
详情链接:https://kimi.moonshot.cn/extension/download

5、达摩院“寻光”炸场！可控编辑，轻松搞定AI视频工作流

AI视频创作领域迎来了一场革命性的变革，阿里达摩院推出的"寻光"平台在WAIC上震撼亮相，为创作者提供一站式AI视频创作解决方案，极大提高创作效率，重塑视频创作工作流。

【AiBase提要:】
✨ 一站式AI视频创作平台"寻光"推出，集剧本创作、分镜图设计、视频素材编辑于一体，简单高效
🔥 AI技术应用实现镜头角度调整、目标消除修改等一键完成，提升创作效率
💡 寻光平台支持剧本创作辅助、AI编辑功能、运镜控制、目标新增/消除/修改等多项强大功能
详情链接:https://top.aibase.com/tool/xunguangshipinchuangzuopingtai

6、书⽣·浦语2.5——InternLM2.5-7B模型宣布开源

2024年7月3日，上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型InternLM2.5-7B。该模型在推理能力、长文本支持和自主规划与工具调用方面有显著提升。

【AiBase提要:】
🚀 InternLM2.5-7B模型在推理能力方面表现出色，特别在数学评测集MATH上实现了100%的性能提升，准确率达到60%。
💬 模型支持处理高达1M tokens的上下文，优化了长文档理解与智能体交互。
🔍 具备搜索和整合上百个网页信息的能力，通过MindSearch多智能体框架，有效整合网络信息。
详情链接:https://github.com/InternLM/InternLM

7、阿里通义音频生成大模型 FunAudioLLM 开源支持情绪语音对话、有声读物等场景

阿里通义实验室最近开源了名为FunAudioLLM的音频生成大模型项目，旨在提升人类与大型语言模型（LLMs）间的自然语音交互体验。该项目包括两个核心模型: SenseVoice和CosyVoice，分别致力于语音生成和语音识别。FunAudioLLM支持多种人机交互应用场景，如多语言翻译、情绪语音对话、互动播客和有声读物等。

【AiBase提要:】
🔊 CosyVoice专注于自然语音生成，支持多语言、音色和情感控制，表现出色。
🔍 SenseVoice致力于高精度多语言语音识别和情感辨识，支持超过50种语言。
🔗 FunAudioLLM项目结合SenseVoice、LLMs和CosyVoice，支持无缝的语音到语音翻译和情感语音聊天应用程序。
详情链接:https://github.com/FunAudioLLM

8、清华大学开源CodeGeeX4-ALL-9B：多语言代码生成模型超越主要竞争对手

清华大学知识工程组和数据挖掘团队推出的CodeGeeX4-ALL-9B标志着代码生成模型发展的里程碑，具有无与伦比的性能、全面的功能和用户友好的集成，将推动软件开发的效率和创新。

【AiBase提要:】
🚀 CodeGeeX4-ALL-9B是CodeGeeX系列的最新创新成果，代表了多语言代码生成的巅峰，设定了新的性能和效率标准。
💡 模型拥有9.4亿个参数，在其类别中是最强大的之一，表现出色且具备仓库级别的代码问答功能，提高开发人员与代码库交互效率。
🔗 CodeGeeX4-ALL-9B在性能基准测试中表现卓越，超越了更大的模型，确立了自己作为领先模型的地位。
详情链接:https://huggingface.co/THUDM/codegeex4-all-9b

9、反AI图像盗窃工具Glaze需求量剧增吸引大批艺术家

Glaze工具应运而生，旨在保护艺术家的风格不被AI图像生成器抄袭。随着Meta计划利用用户数据进行AI训练，Glaze需求量急剧上升。然而，安全研究人员发现了绕过Glaze保护的方法，引发了对其有效性的质疑。

【AiBase提要:】
🖼️ 艺术家追捧的Glaze工具用于防范AI图像盗窃。
🔒 Glaze需求激增，因Meta计划利用用户数据进行AI训练。
⚙️ 安全研究人员发现绕过Glaze保护的方法，对其有效性产生质疑。
详情链接:https://top.aibase.com/tool/glaze

10、科幻照进现实？Open-TeleVision支持远程操控机器人

这篇文章介绍了加州大学圣地亚哥分校和麻省理工学院研究员们开发的Open-TeleVision项目，该项目实现了远程操控机器人的高科技场景，让人仿佛置身于电影《阿凡达》中。系统支持多种设备，提供沉浸式体验，通过VR头显实现隔空操控，极大地提升了操作的便捷性和真实感。

【AiBase提要:】
🌟 开源远程操作系统，支持多设备轻松上手，实时立体视频流让操控更精准。
🤖 通过VR头显模拟人类视觉和颈部活动，实现沉浸式体验，告别传统2D视频平庸。
🔧 使用逆运动学算法和Web平台实现高效远程操作，解决人形机器人自由度匹配问题，数据采集训练机器人自主完成任务。
详情链接:https://github.com/Improbable-AI/VisionProTeleop

11、中国AI论文数量全球第一，清华成论文发表热门之地

中国在全球人工智能研究领域以惊人速度崛起，论文数量占全球总量25%，位居世界第一，展现出在AI科技人才素质和技术创新能力上的重大突破。学术机构如中国科学院和清华大学超越世界顶尖学府，企业如谷歌、微软、腾讯、阿里巴巴在AI研究领域贡献突出，彰显中国AI研究的多元化和活力。

【AiBase提要:】
🌟 中国AI论文数量全球领先，占全球总量的25%，位居世界第一。
🏫 学术机构表现卓越，中国科学院和清华大学在AI论文被引用次数上超越了世界顶尖学府。
📈 企业贡献显著，谷歌、微软、腾讯、阿里巴巴等企业在AI研究领域贡献突出，展现了中国AI研究的多元化和活力。

12、AI 模型训练成本暴涨，2027 年或达 1000 亿美元！

据Anthropic首席执行官表示，当前AI模型训练成本高达10亿美元，未来三年有可能上升到100亿美元甚至1000亿美元。这一预测引发了人们对AI泡沫是否即将破裂的担忧。硬件和能源消耗成为训练成本的主要驱动因素，随着AI模型的发展，这两方面的支出将急剧增加。人力资源、数据采集和运行维护等方面也将耗费大量成本，如果这些问题不得到解决，2027年的AI训练成本有可能达到1000亿美元。

【AiBase提要:】
⭐ 当前AI模型训练成本高达10亿美元，未来三年有可能上升到100亿美元甚至1000亿美元。
⭐ 硬件和能源消耗成为训练成本的主要驱动因素，随着AI模型的发展，这两方面的支出将急剧增加。
⭐ 人力资源、数据采集和运行维护等方面也将耗费大量成本，如果这些问题不得到解决，2027年的AI训练成本有可能达到1000亿美元。

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

AI日报：快手上线可灵网页端并开源可图Kolors；达摩院AI视频平台“寻光”炸场；月之暗面推Kimi浏览器插件

推荐关键词

24小时热搜

大家正在看

大厂AI资产分拆进行时：可灵为字节、阿里探路？

快手装不下180亿美元的可灵AI

可灵AI估值千亿，快手“母凭子贵”：国产视频模型三强争霸

可灵AI拿下近30亿美元融资 BAT集体下注刷新全球视频单笔融资纪录

可灵AI NEXTGEN颁奖典礼在韩举行，搭建全球化青年AI影像创作成长沃土

AI日报：可灵AI将完成30亿美元融资；支付宝AI生活助理“阿宝”正式公测；Kimi K3 或于本月发布

快手拆了可灵，字节拆豆包还会远么

估值逼近快手，可灵分拆是一步好棋吗？

即梦和可灵，能不能接住AI短剧风口？

首个原生4K直出，可灵AI带来的“创作解放”

ARR 5亿美元，可灵真正的考验才刚刚开始？

快手Q1总营收337亿可灵AI爆发同比大增超300%

央视《焦点访谈》聚焦“手搓”经济，可灵AI盖坤：《纸手机》印证全民创作时代到来

可灵AI携中美韩三国导演亮相戛纳，打造AI影视工业化全球样本

可灵AI发布创作者计划3.0，从创作者支持到商业化赋能全面加码

AI日报：快手拟分拆可灵AI独立融资；360升级“安全龙虾”平台；网信办要求AI生成视频必须标注

全网播放量破亿的AI短片《纸手机》：可灵AI与中国式思念的一次双向奔赴”

月流水破2000万美元，可灵成全球最吸金的AI视频模型

快手2025年净利润206亿元！可灵AI用户规模破6000万

AI日报：谷歌Nano Banana 2正式上线；可灵3.0全球视频模型第一；周鸿祎直言AI眼镜难做

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

AI日报：快手上线可灵网页端并开源可图Kolors；达摩院AI视频平台“寻光”炸场；月之暗面推Kimi浏览器插件

推荐关键词

24小时热搜

大家正在看

大厂AI资产分拆进行时：可灵为字节、阿里探路？

快手装不下180亿美元的可灵AI

可灵AI估值千亿，快手“母凭子贵”：国产视频模型三强争霸

可灵AI拿下近30亿美元融资 BAT集体下注 刷新全球视频单笔融资纪录

可灵AI NEXTGEN颁奖典礼在韩举行，搭建全球化青年AI影像创作成长沃土

AI日报：可灵AI将完成30亿美元融资；支付宝AI生活助理“阿宝”正式公测；Kimi K3 或于本月发布

快手拆了可灵，字节拆豆包还会远么

估值逼近快手，可灵分拆是一步好棋吗？

即梦和可灵，能不能接住AI短剧风口？

首个原生4K直出，可灵AI带来的“创作解放”

ARR 5亿美元，可灵真正的考验才刚刚开始？

快手Q1总营收337亿 可灵AI爆发 同比大增超300%

央视《焦点访谈》聚焦“手搓”经济，可灵AI盖坤：《纸手机》印证全民创作时代到来

可灵AI携中美韩三国导演亮相戛纳，打造AI影视工业化全球样本

可灵AI发布创作者计划3.0，从创作者支持到商业化赋能全面加码

AI日报：快手拟分拆可灵AI独立融资；360升级“安全龙虾”平台；网信办要求AI生成视频必须标注

全网播放量破亿的AI短片《纸手机》：可灵AI与中国式思念的一次双向奔赴”

月流水破2000万美元，可灵成全球最吸金的AI视频模型

快手2025年净利润206亿元！可灵AI用户规模破6000万

AI日报：谷歌Nano Banana 2正式上线；可灵3.0全球视频模型第一；周鸿祎直言AI眼镜难做

可灵AI拿下近30亿美元融资 BAT集体下注刷新全球视频单笔融资纪录

快手Q1总营收337亿可灵AI爆发同比大增超300%