AI日报：Hedra图转说话视频免费开放；Deepmind发布超牛自动视频配音技术V2A；美图WHEE V2正式上线；开源版Sora可一键生成720p高清视频

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、Hedra的 Character-1开放使用

Hedra的Character-1开放使用，为创作者提供了通过文本和图片生成说话和唱歌视频的神器，开启了创作革命。它不仅是工具，更是一个全新的创作平台，让每个人都能拥有无限的视频创作机会。

【AiBase提要：】
⭐️ 动态视频生成：上传照片并配音频，即可让人物生动说话或唱歌。
⭐️ 多平台兼容：无论桌面还是移动设备，用户皆可轻松使用。
⭐️ 高质量保证：表情、姿态和语音同步，效果逼真令人满意。
详情链接:https://top.aibase.com/tool/hedra

2、Deepmind视频转音频技术V2A：实现自动为视频配乐、配音

谷歌Deepmind发布了V2A技术，利用视频像素和文本提示生成丰富的音轨，实现同步视听生成。用户可通过文字描述引导音频输出，系统采用自回归和扩散方法生成音频，确保与视频内容完美同步。训练过程中使用AI生成的注释帮助模型理解音频事件与视觉场景关联。尽管存在唇形同步挑战，V2A技术将接受严格评估测试后向公众开放。

【AiBase提要:】
🔊 自动为视频配乐、配音
🎶 利用视频像素和文本提示生成丰富音轨
🤖 训练过程中使用AI生成的注释
详情链接:https://top.aibase.com/tool/deepmind-v2a

3、B 站开源轻量级 AI 语言模型 Index-1.9B 模型

B 站最新开源的 Index-1.9B 模型引起了广泛关注，该模型包含基座模型、对照组和对话模型，具有19亿非词嵌入参数量，在多个评测基准上表现领先。

【AiBase提要:】
🔍 Index-1.9B base: 基座模型具有19亿非词嵌入参数量，在2.8T中英文语料上预训练，领先同级别模型。
🔍 Index-1.9B pure: 对照组与基座模型相同，但过滤了指令相关数据以验证对benchmark的影响。
🔍 Index-1.9B chat: 基于base模型通过SFT和DPO对齐后的对话模型，引入互联网社区语料，聊天趣味性更强。
详情链接:https://top.aibase.com/tool/index-1-9b

4、美图WHEE V2正式上线

美图公司推出全新AI改图编辑器WHEE V2版本，集合多种实用功能并融入AI技术，为用户提供便捷高效的一站式处理体验。新增AI绘画和AI改图功能，丰富用户编辑选择，支持多类型素材创意呈现。智能选择和提示词功能便利用户自然修改，支持自定义图片尺寸、图层内容，多种形式扩图。具备可视化多图层、精准语义识别、多元风格和细节控制，实现个性化高质量图像处理。

【AiBase提要:】
✨ 新增AI绘画和AI改图功能，丰富用户编辑选择，支持多类型素材创意呈现。
💡 智能选择和提示词功能便利用户自然修改，支持自定义图片尺寸、图层内容，多种形式扩图。
🎨 具备可视化多图层、精准语义识别、多元风格和细节控制，实现个性化高质量图像处理。

5、潞晨Open-Sora团队实现720p高清视频质量和生成时长突破

潞晨Open-Sora团队在720p高清视频质量和生成时长上取得了突破性进展，开源项目让视频生成变得简单，受到社区热烈欢迎。英伟达入股的AI公司Lambda Labs也基于Open-Sora模型权重打造数字乐高宇宙，开启创意新天地。技术报告深度剖析了模型训练核心和关键，解决视频模型训练痛点，提升生成质量和速度。

【AiBase提要:】
⚙️ Open-Sora团队实现720p高清视频质量和生成时长突破，开源项目简化视频生成流程
🌟 Lambda Labs基于Open-Sora模型权重打造数字乐高宇宙，创意无限
🔬 技术报告揭示模型训练核心细节，解决视频模型训练痛点，提升生成质量和速度
详情链接:https://github.com/hpcaitech/Open-Sora

6、百度曦灵数字人平台升级支持文生 3D 数字人、音色克隆等功能

百度智能云曦灵数字人平台即将迎来重大升级，提供高效低成本的2D/3D数字人生成，全面打通直播、短视频、对话等多个场景，大幅提升用户体验。曦灵平台展现出令人瞩目的数字人生成能力，快速精准地生成逼真的数字人，为企业、文旅、娱乐等领域带来全新IP创造可能。

【AiBase提要:】
🌟 高效低成本的2D/3D数字人生成，提升用户体验。
🎨 快速精准生成逼真的数字人，为多个领域带来IP创造可能。
🔊 提供音色克隆功能，生成定制音色用于数字人的播报和内容生产。

7、Meta发布多款模型:多模态模型Chameleon、文本生成音乐模型JASCO、音频水印技术AudioSeal

Meta最近发布了多项研究成果，包括多模态模型Chameleon、文本生成音乐模型JASCO、音频水印技术AudioSeal等，为AI领域带来了新的技术突破和应用前景。这些成果将推动AI技术的发展和应用，具有重要意义。

【AiBase提要:】
🌟 Meta发布了多模态模型Chameleon，支持处理文本和图像混合输入输出，提供新的解决方案。
🎶 新的语言模型训练方法Multi-Token Prediction提高了模型能力和训练效率。
🔊 文本生成音乐模型JASCO能接受各种条件输入，提供更好、更灵活的音乐控制。
详情链接:https://top.aibase.com/tool/meta-chameleonMulti-Token Prediction

8、谷歌推字母表生成器GenType 可用于创作封面艺术字体

GenType是谷歌推出的实验性产品，通过Imagen2模型驱动，用户可以创造个性化的字母形式，用于书写各种内容，特别适合制作标题或封面艺术。该工具提供了简单直观的操作界面，让用户快速上手，激发创造力和想象力。用户可以分享保存生成的字母表图片，并在在线画廊中浏览其他用户的作品，获取灵感和创意。

【AiBase提要:】
🎨 个性化字母创造: 用户可以输入任何提示，GenType转化为独特的字母表，展现个人创意。
🖌 艺术创作工具: GenType不仅是生成器，还是艺术创作工具，让用户创造无限可能的字母艺术。
📷 分享与保存: 提供方便的分享和保存选项，用户可将字母表保存为PNG格式图片，在社交媒体上分享
详情链接:https://top.aibase.com/tool/gentype

9、强得很！英伟达超越微软成为全球最有价值公司

英伟达股价飙升，超越微软、苹果和谷歌，成为全球市值最高的公司。公司计划推出新的Blackwell GPU架构，首席执行官表示将是世界上最强大的芯片，并每年发布新的AI芯片。英伟达在2024年股价上涨160%，市值达到3.335万亿美元。

【AiBase提要:】
📈 英伟达超越微软、苹果和谷歌，成为全球市值最高的公司。
💻 英伟达计划推出Blackwell GPU架构，首席执行官称将是世界上最强大的芯片，每年发布新的AI芯片。
💰 英伟达在2024年股价上涨160%，市值达到3.335万亿美元。

10、苹果宣布推出新的人工智能功能后为开发者推出“AI 培训”

苹果公司宣布推出新的人工智能培训课程，面向开发者学院的学生、导师以及校友等。这标志着苹果在AI技术领域的开放态度和重视程度逐渐增加。

【AiBase提要:】
🍎 苹果公司推出新的人工智能培训课程，专注于培养学生的专业编程技能。
📚 新课程将教授如何在苹果设备上构建、训练和部署机器学习模型。
💡 苹果的AI工具将被集成到多个平台，包括Xcode，帮助开发者更智能地编写代码。

11、Luma AI的Dream Machine生成作品被指涉嫌抄袭迪士尼IP

Luma发布的Dream Machine视频生成工具引发了关于模型透明度和数据来源的质疑，特别是涉嫌抄袭迪士尼作品。这引发了人们对这类模型最大的关注点之一，缺乏透明度。

【AiBase提要:】
🔍 模型透明度和数据来源引发质疑，是否按照迪士尼风格创作？
🚫 视频中出现的角色被指涉嫌抄袭迪士尼皮克斯作品，引发争议
💡 Dream Machine被吹捧为电影制作未来，提供高质量逼真镜头创作

12、AI画师接单被“抓包” 小红书博主“鉴Ai”视频获赞2.9万

小红书博主“天线嫂嫂（内裤大王）”在约画时发现画师使用AI技术，引发社交媒体关注。画师未提供线稿，博主怀疑作品为AI制作，揭露画稿盗图。AI绘画技术逼真度提高，难以区分人类和AI作品。AI技术发展带来版权和真实性挑战。

【AiBase提要:】
🔍 小红书博主发现画师使用AI技术，引发关注和讨论。
🎨 画师未提供线稿，博主怀疑作品为AI制作，揭露画稿盗图。
🤖 AI绘画技术逼真度提高，难以区分人类和AI作品。
详情：https://www.chinaz.com/ainews/9662.shtml

13、Snap 在 Augmented World Expo 上展示实时设备端图像扩散模型

Snap 在 Augmented World Expo 上展示了早期版本的实时设备端图像扩散模型，为 AR 创作者设计了生成式 AI 工具。该模型体积小且快速，能实时重新渲染帧。Snap 的团队致力加速机器学习模型，计划推广给创作者。Bobby Murphy 表示，这标志着增强现实迈入新方向，重新思考 AR 创造方式。Lens Studio5.0 提供新的生成式 AI 工具，帮助开发者更快创建 AR 效果，节省时间。

【AiBase提要:】
🔍 Snap 在 AWE 展示实时设备端图像扩散模型，为 AR 创作者设计生成式 AI 工具。
⚡ 模型体积小且快速，能实时重新渲染帧，Snap 团队致力加速机器学习模型。
🎨 Lens Studio5.0 提供新生成式 AI 工具，帮助开发者更快创建 AR 效果，节省时间。

14、扎心！一团队负责人用ChatGPT取代了60名员工最后自己也被解雇了

人工智能在工作场所的影响逐渐显现，一名负责内容创作团队的领导被ChatGPT取代后最终也被解雇，引发思考人工智能对就业市场的影响。

【AiBase提要:】
💔 人工智能替代人类工作的现实
🤖 ChatGPT取代人类团队进行内容创作
📉 作家、软件开发人员需求下降21%

15、ChatGPT等模型疯狂训练，2026年或迎来AI界“数据荒”

最近Epochai发布的研究报告警示AI界可能面临数据枯竭危机。随着大模型如ChatGPT消耗公开训练数据，数据可能在2026年到2032年间耗尽。报告提出四种新方法应对数据荒，包括合成数据、多模态学习、私有数据利用和与真实世界交互学习。

【AiBase提要:】
🔥 大模型如ChatGPT消耗公开训练数据，可能导致数据在2026年到2032年间耗尽。
🌟 Epochai提出四种新方法，包括合成数据、多模态学习、私有数据利用和与真实世界交互学习。
💡 合成数据可能存在质量参差不齐、过拟合等问题，但是是解决数据荒的一种途径。

16、L4GM：可在几秒钟内将视频目标对象生成4D高斯模型

研究团队提出了名为L4GM的大规模4D高斯重建模型，能从单视角视频输入生成动画对象，实现令人印象深刻效果。模型基于创新性数据集和简化设计，短时间内完成单向传递，保证高质量输出。

【AiBase提要:】
🔑 创新性数据集和简化设计实现短时间内完成单向传递
🔑 生成4D对象，展示高质量动画物体
🔑 构建多视角视频数据集，训练插值模型提高帧速率
详情链接:https://top.aibase.com/tool/l4gm

ChatGPT源码推荐：小狐狸ChatGPT付费创作系统完全开源源码

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

AI日报：Hedra图转说话视频免费开放；Deepmind发布超牛自动视频配音技术V2A；美图WHEE V2正式上线；开源版Sora可一键生成720p高清视频

推荐关键词

24小时热搜

大家正在看

AI日报：SD轻量级3.5 Medium模型免费开放商用；Hedra 推出全新语音克隆功能；微信灰度测试AI问答功能；ComfyUI新神器ComfyUI-Detail-Daemon

《驯龙高手：旅程》CG动画〈Once There Were Dragons〉正式发布

Hedra保姆级教程：如何让你的照片开口说话还带表情

Hedra有哪些功能免费吗？人物角色视频生成怎么使用方法详细教程指南

SK海力士5层堆叠3D DRAM新突破：良品率已达56.1%

OPPO A3 Pro全球版亮相阿联酋TDRA认证上市在即

进击的DramaBox：翻译短剧拿捏美国，霸总之后“战神”出海

tldraw官网体验入口免费在线AI即时协作绘图工具使用地址

StableDrag：简易点击编辑器可以轻松调整蒙娜丽莎脸部表情

新机器学习框架DRAGIN:用于大语言模型中的动态检索增强，胜过传统方法

中国台湾遇25年最大地震：美光、三星、SK海力士停止DRAM内存报价

DragAnything官网体验入口视频制作软件DragAnything如何使用

拖拽P图技术又升级了：StableDrag更稳、更准，南大、腾讯联合打造

快手发布革命性视频运动控制技术 DragAnything

快手出品！DragAnything：拖动锚点精准控制视频物体和镜头运动

StableDrag官网体验入口 AI图像处理编辑操作方法指南教程

图片编辑技术StableDrag发布拖动锚点即可编辑图像同时保持高质量

中国龙叫Loong而不是Dragon！《牛津英语词典》已收录“中国龙”

drayk.it官网体验入口 AI创作Drake风格歌曲在线工具使用地址

佰维发布CXL 2.0 DRAM，赋能高性能计算

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

AI日报：Hedra图转说话视频免费开放；Deepmind发布超牛自动视频配音技术V2A；美图WHEE V2正式上线；开源版Sora可一键生成720p高清视频

推荐关键词

24小时热搜

大家正在看

AI日报：SD轻量级3.5 Medium模型免费开放商用；Hedra 推出全新语音克隆功能；微信灰度测试AI问答功能；ComfyUI新神器ComfyUI-Detail-Daemon

《驯龙高手：旅程》CG动画〈Once There Were Dragons〉正式发布

Hedra保姆级教程：如何让你的照片开口说话还带表情

Hedra有哪些功能免费吗？人物角色视频生成怎么使用方法详细教程指南

SK海力士5层堆叠3D DRAM新突破：良品率已达56.1%

OPPO A3 Pro全球版亮相阿联酋TDRA认证 上市在即

进击的DramaBox：翻译短剧拿捏美国，霸总之后“战神”出海

tldraw官网体验入口 免费在线AI即时协作绘图工具使用地址

StableDrag：简易点击编辑器可以轻松调整蒙娜丽莎脸部表情

新机器学习框架DRAGIN:用于大语言模型中的动态检索增强，胜过传统方法

中国台湾遇25年最大地震：美光、三星、SK海力士停止DRAM内存报价

DragAnything官网体验入口 视频制作软件DragAnything如何使用

拖拽P图技术又升级了：StableDrag更稳、更准，南大、腾讯联合打造

快手发布革命性视频运动控制技术 DragAnything

快手出品！DragAnything：拖动锚点精准控制视频物体和镜头运动

StableDrag官网体验入口 AI图像处理编辑操作方法指南教程

图片编辑技术StableDrag发布 拖动锚点即可编辑图像同时保持高质量

中国龙叫Loong而不是Dragon！《牛津英语词典》已收录“中国龙”

drayk.it官网体验入口 AI创作Drake风格歌曲在线工具使用地址

佰维发布CXL 2.0 DRAM，赋能高性能计算

OPPO A3 Pro全球版亮相阿联酋TDRA认证上市在即

tldraw官网体验入口免费在线AI即时协作绘图工具使用地址

DragAnything官网体验入口视频制作软件DragAnything如何使用

图片编辑技术StableDrag发布拖动锚点即可编辑图像同时保持高质量