谷歌发布 “Vlogger” 视频模型框架：单张图片生成 10 秒视频

划重点:
⭐️ 谷歌发布新视频框架 “Vlogger”，可以通过单张图片和录音生成本人演讲视频。
⭐️ Vlogger 模型基于扩散模型，包含音频到人体动作和文本到图像模型。
⭐️ Vlogger 具备多样性和自然性，可应用于视频编辑和翻译等领域。

站长之家（ChinaZ.com）3月20日消息:谷歌最近发布了一项名为 “Vlogger” 的新视频框架，可以通过仅一张图片和录音即可生成一个本人演讲视频。

这一框架基于扩散模型，包含音频到人体动作和文本到图像模型两部分。其中，音频波形被用来生成人物的身体控制动作，包括眼神、表情、手势等，使生成的视频看起来自然且生动。该模型训练在一个包含80万个人物视频的大型数据集上完成。

Vlogger 的突出之处在于其多样性和完整性。与其他方法相比，Vlogger 不需要对每个人进行训练，也不依赖于面部检测和裁剪，生成的视频包括面部、唇部和肢体动作等。此外，Vlogger 还具有视频编辑和翻译等应用，能够让人物闭嘴、闭眼，甚至进行视频翻译。

虽然谷歌尚未发布具体模型，但通过展示效果和论文，可以看到 Vlogger 在视频生成领域的潜力和优势。然而，一些网友对其生成视频的画质、口型对不上等问题提出了质疑和吐槽。尽管如此，Vlogger 的发布仍引起了业界的广泛关注和讨论。

谷歌发布的 Vlogger 模型为视频生成领域带来了新的可能性，具备多样性和自然性，为视频编辑和翻译等应用提供了新的解决方案。随着技术的不断进步和完善，相信 Vlogger 将在未来有更广泛的应用和发展。

产品入口:https://top.aibase.com/tool/vlogger

站长之家GEO计费优化管理系统：把生成式引擎优化做成一笔笔看得见的账

2026-07-272.7万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

谷歌发布 “Vlogger” 视频模型框架：单张图片生成 10 秒视频

推荐关键词

24小时热搜

大家正在看

蚂蚁灵波定义视频生成第二赛道，开源LingBot-Video，融合7万小时具身数据

AI电商内容创作工具详解|电商图文视频生成、跨境电商智能运营工具使用指南

从生成到交付，音视频 Agent 要有生产级开发套件

2026年Vlog相机怎么选？5款微单推荐，满足视频创作与日常拍摄需求

荣耀更换logo上热搜：荣耀之环敢想敢不同

网友发现澎程汽车挂着小米Logo 雷军：澎程是小米的一个产品线

字节跳动发布 Seedance 2.5 视频模型可单次生成 30 秒视频

换上全新logo！荣耀官宣：Robot Phone 8月见

马斯克xAI正式更名为SpaceXAI：全新LOGO同步上线

字节跳动发布新一代视频模型：30秒一次生成还能去油腻感

阿里千问发布Qwen-Image-3.0：超长指令让复杂图文一键生成

蚂蚁灵波世界模型2.0正式发布！两大首创：小时级实时生成+Agent实时“陪玩”

如何提升AI生成3D模型的可用性？企业为什么需要系统化布局

站长之家GEO计费优化管理系统：把生成式引擎优化做成一笔笔看得见的账

长视频剧综赞助营销，为何搞不定AI产品？

Agentic 范式下的视频画质优化：火山引擎的新路径

豆包视频通话背后，火山引擎重构 Agent 时代多模态传输底座

9条破亿视频，新号涨粉百万，过去半年谁在制造AI爆款？

悦享控股(CHR.US) 消费级应用Klon AI 全球上线

可灵AI估值千亿，快手“母凭子贵”：国产视频模型三强争霸

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

谷歌发布 “Vlogger” 视频模型框架：单张图片生成 10 秒视频

推荐关键词

24小时热搜

大家正在看

蚂蚁灵波定义视频生成第二赛道，开源LingBot-Video，融合7万小时具身数据

AI电商内容创作工具详解|电商图文视频生成、跨境电商智能运营工具使用指南

从生成到交付，音视频 Agent 要有生产级开发套件

2026年Vlog相机怎么选？5款微单推荐，满足视频创作与日常拍摄需求

荣耀更换logo上热搜：荣耀之环敢想敢不同

网友发现澎程汽车挂着小米Logo 雷军：澎程是小米的一个产品线

字节跳动发布 Seedance 2.5 视频模型 可单次生成 30 秒视频

换上全新logo！荣耀官宣：Robot Phone 8月见

马斯克xAI正式更名为SpaceXAI：全新LOGO同步上线

字节跳动发布新一代视频模型：30秒一次生成 还能去油腻感

阿里千问发布Qwen-Image-3.0：超长指令让复杂图文一键生成

蚂蚁灵波世界模型2.0正式发布！两大首创：小时级实时生成+Agent实时“陪玩”

如何提升AI生成3D模型的可用性？企业为什么需要系统化布局

站长之家GEO计费优化管理系统：把生成式引擎优化做成一笔笔看得见的账

长视频剧综赞助营销，为何搞不定AI产品？

Agentic 范式下的视频画质优化：火山引擎的新路径

豆包视频通话背后，火山引擎重构 Agent 时代多模态传输底座

9条破亿视频，新号涨粉百万，过去半年谁在制造AI爆款？

悦享控股(CHR.US) 消费级应用Klon AI 全球上线

可灵AI估值千亿，快手“母凭子贵”：国产视频模型三强争霸

字节跳动发布 Seedance 2.5 视频模型可单次生成 30 秒视频

字节跳动发布新一代视频模型：30秒一次生成还能去油腻感