站长之家 - 业界 2024-10-15 15:48

AI日报:Adobe推出Firefly AI视频模型;Kimi推出多功能语音通话模式;智谱CogView3-Plus模型开源

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、Kimi推出多功能语音通话模式 支持更换声音语速调节

Kimi人工智能助手最近推出了备受期待的语音通话功能,为用户带来了丰富的互动体验。新功能集多样化应用和个性化体验于一身,提升交流效率,满足个性化需求。针对特定场景深化了功能应用,如英语陪练和模拟面试,为学习和职场提供创新解决方案。引入声音克隆技术增添趣味性,持续关注用户反馈,优化扩展语音服务应用范围。

image.png

【AiBase提要:】

🌟 Kimi 助手更新语音通话功能,提升用户互动体验。

🎤 支持实时字幕和可调节声音,交互更自然。

🤖 引入声音克隆技术,增加趣味性和应用场景。

2、智谱CogView3-Plus模型开源 文生图技术迎来新纪元

智谱技术团队发布了CogView3及其升级版CogView3-Plus-3B,标志着AI辅助艺术创作迈入新阶段。CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。开源仓库已开放,推动AI图像生成领域快速发展,文生图技术应用前景广阔。

image.png

【AiBase提要:】

🚀 CogView3及CogView3-Plus-3B开源,标志AI辅助艺术创作新阶段。

💡 CogView3性能惊人,比SDXL高出77%,推理速度仅为SDXL的十分之一。

💻 CogView3-Plus引入DiT框架和文本-图像联合注意力机制,提升性能、降低成本。

详情链接:https://top.aibase.com/tool/cogview3Plus

3、Adobe推出Firefly AI视频模型,Photoshop新增多个AI功能

Adobe在最新的MAX大会上推出了Firefly AI视频模型和多个增强版Photoshop工具,为用户带来了令人振奋的AI新功能。Firefly视频模型让用户通过文本提示创建或修改视频内容,为创作者们提供了全新的创作空间。同时,Photoshop新增的AI工具如移除工具和生成填充功能,让用户更轻松地编辑图像。Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。

【AiBase提要:】

📹 Firefly AI视频模型让用户通过文本创建和修改视频内容,为创作者们提供全新创作空间。

🖼️ Photoshop新增多项AI工具,如移除工具和生成填充,帮助用户更轻松地编辑图像。

🔍 Adobe承诺只使用授权内容训练模型,并推出内容凭证增加透明度。

详情链接:https://blog.adobe.com/en/publish/2024/09/11/bringing-gen-ai-to-video-adobe-firefly-video-model-coming-soon

4、ChatGPT大变身:新界面引入搜索功能

OpenAI近期对ChatGPT进行了重大更新,将其从单纯的对话助手转变为综合性信息平台。界面更新包括新增的Canvas功能和移动提示框位置,使用户体验更加便捷。引入的SearchGPT功能让用户可以访问实时网络数据,并与知名出版商合作确保信息可靠性。

image.png

【AiBase提要:】

🔍 新界面设计:新增Canvas功能和移动提示框位置,提升用户体验。

🌐 引入SearchGPT功能:按 / 键激活,访问实时网络数据,附有内联引用和链接。

💡 使用便捷:直观操作,提问后几秒内提供带有来源的答案,支持追问深入探讨话题。

5、火山引擎发布大模型训练视频预处理方案

火山引擎在近期的视频云技术大会上发布了大模型训练视频预处理方案,这一技术已成功应用于豆包视频生成模型,标志着AI视频生成技术的重大进展。

【AiBase提要:】

🔑 AIGC和多模态技术深刻改变用户体验

🔑 火山引擎探索AI大模型与视频技术融合,提供全方位解决方案

🔑 火山引擎开发的预处理方案优化算法和工程层面,提高模型训练效率

6、Midjourney即将推出在线编辑器,V7版本和个性化功能在路上

Midjourney最近公布了一系列令人兴奋的更新和即将推出的新功能,展示了公司在AI图像生成领域的快速发展和创新。团队正积极推进多个项目,注重提升质量和开发核心功能,而不是急于发布新产品。

image.png

【AiBase提要:】

🚀 Midjourney即将推出新的在线编辑器,用户可以导入图片并利用深度图和图像修复功能进行编辑。

💡 团队正在优化用户界面,以区分新功能与现有图片功能,并讨论首次发布时包含哪些功能。

🔧 Midjourney正在开发新工具,使用户更容易管理和切换多个个性化配置,引入更精细的风格个性化系统。

7、微软正打造 AI 伴侣,可以“看见” 和 “记住” 用户一切行为

最近,微软正致力于开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。这反映出人类对于倾诉、理解和陪伴的基本需求。同时,Windows 的新功能 Recall 可深入挖掘用户的数字历史,重现过去的点滴经历。Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。

【AiBase提要:】

🌟 微软正在开发一种能实时观察用户行为的 AI 伴侣,旨在建立深厚的互动关系。

📂 Windows 的新功能 Recall 能深入挖掘用户的数字历史,重现过去的点滴经历。

💬 Zoom 推出 AI 克隆功能,让用户派遣数字版自己参加会议,提高工作效率。

8、微软AI副总裁跳槽OpenAI 将致力于AGI研究

微软AI副总裁塞巴斯蒂安・布贝克离开微软加盟OpenAI,将致力于人工通用智能(AGI)的研究。这一转变标志着布贝克的职业转折,也为OpenAI的发展增添了强有力的支持。

【AiBase提要:】

🧠 布贝克离开微软,加盟OpenAI,专注于AGI研究。

🤝 微软与OpenAI关系复杂,既是投资者又是竞争对手,双方希望继续合作。

🚀 布贝克的加入将推动OpenAI在小型语言模型和AGI研究方面取得突破

9、惊艳!AI模型DIAMOND可模拟《反恐精英》,单张RTX3090就能运行

研究人员开发的AI模型DIAMOND能够模拟《反恐精英:全球攻势》游戏,运行在Nvidia RTX3090显卡上,每秒10帧的速度。尽管存在一些缺陷,但未来有望通过增加数据和计算能力来改善模型性能。

image.png

【AiBase提要:】

🎮 DIAMOND模型能模拟CS:GO游戏,运行速度达每秒10帧。

📊 仅使用87小时游戏数据训练,仍能模拟复杂游戏场景。

🐛 存在缺陷,如无限跳跃和路径偏离导致模拟崩溃,但未来有改善潜力。

详情链接:https://diamond-wm.github.io/

10、英伟达Blackwell GPU需求暴涨,未来12个月供应量完全售罄

英伟达最新一代Blackwell GPU引发了前所未有的需求,CEO黄仁勋透露未来12个月供应量已售罄,市场对高性能计算的渴望再次得到证实。

【AiBase提要:】

💡Blackwell GPU需求爆发,未来12个月内完全售罄。

🔍主要客户包括AWS、谷歌等大型科技公司,推动市场增长。

📈NVIDIA预计2024年将出货数十亿美元的Blackwell GPU,数据中心收入显著增长。

11、Nvidia股价再创历史新高,市值逼近3.4万亿美元

Nvidia本周股价再创历史新高,市值逼近3.4万亿美元,投资者备受振奋。CEO黄仁勋的个人财富已超1215亿美元,新一代Blackwell芯片需求火爆。Nvidia稳固主导AI芯片市场,市值仅次于苹果,展现强大实力。

【AiBase提要:】

🚀 Nvidia股价创下138.07美元新高,年内涨幅近180%。

📊 公司在AI芯片市场占有率高达70%至95%,市值达3.4万亿美元。

💡 CEO黄仁勋表示新一代Blackwell芯片需求“疯狂”,已售罄至明年。

ChatGPT源码推荐:小狐狸ChatGPT付费创作系统完全开源源码

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看

AI助手会成为AI OS吗