阿里图像生成视频模型I2VGen-XL代码发布

站长之家（ChinaZ.com）12月15日消息:阿里在11月份发布了论文，宣布将开源I2VGen-XL图像生成视频模型。如今，他们终于发布了具体的代码和模型。这一模型可以生成没有大幅人物动作的视频演示。

I2VGen-XL模型分为两个阶段。首先是基础阶段，该阶段通过使用两个分层编码器来保证连贯的语义，并保留输入图像的内容。其次是优化阶段，该阶段通过整合额外的简短文本来增强视频的细节，并将分辨率提高到1280x720。

代码地址:https://github.com/damo-vilab/i2vgen-xl

为了优化模型，研究团队收集了约3500万个单镜头文本视频对和60亿个文本图像对。通过这些数据，I2VGen-XL模型可以提高生成视频的语义准确性、细节的连续性和清晰度。

非遗贺春！AI与非遗交融，魔多蛇年春节AI模型创作大赛盛大启幕

2024-12-241.8万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

阿里图像生成视频模型I2VGen-XL代码发布

推荐关键词

24小时热搜

大家正在看

非遗贺春！AI与非遗交融，魔多蛇年春节AI模型创作大赛盛大启幕

AI大模型时代，人才的需求已经变了

灰豚AI数字人重磅突破，国内最强数字人AI口播软件大模型来袭

AI大模型时代下的天融信：安全领域的智能先锋

AI日报：字节重磅推出豆包视觉理解模型；AI“魔改”宠物跳舞爆火；OpenAI开放满血o1模型API；即梦AI上线海报生成功能

AI日报：ChatGPT AI搜索免费开放；谷歌AI视频模型Veo2优于Sora；Midjourney重磅上新个性化模型与情绪板

首次！大模型自动搜索人工生命，做出AI科学家的Sakana AI又放大招

AI日报：阿里通义开源多模态推理模型QVQ-72B；OpenAI考虑自研人形机器人；QQ音乐上线首个AI大模型音效

你还说这是AI？我们体验了一波生成亚洲人最好看的文生图大模型

AI新风向：思必驰“分布式大模型智能体系统”赋能产业未来

AI日报：AI假冒名人直播带货违法；OpenAI o3 模型能耗惊人；AI技术将助推iPhone销量

业内首个！京东发布“AI京医”大模型：准确率达99.5%

AI日报：可灵AI上线AI模特功能；字节今年AI投入近BAT总和；ChatGPT本月第二次大规模宕机；抖音引入音频审核大模型

可灵AI推出可图1.5模型画面质量、人像美感跃升新高度

AI日报：“即创”正式版上线；2024胡润中国AI企业50强榜单；通义万相推2.1视频模型；微软开源超强小模型Phi-4

AI日报：可灵AI API对口型能力全面开放；豆包大模型宣称追平GPT-4；百度2024年度AI提示词“答案”；通义千问视觉模型直降80%

AI日报：王炸！海螺AI推主体参考功能；商汤科技发布 “日日新” 融合大模型；独立Grok应用上架苹果商店

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;嫌犯用ChatGPT策划酒店爆炸案；阿里云上线AI程序员

AI日报：支付宝推AI创意生成平台；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中间帧；OpenAI准备o3推理模型

出圈就好！盘点2024年国内AI大模型产品的那些破圈姿势

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

阿里图像生成视频模型I2VGen-XL代码发布

推荐关键词

24小时热搜

大家正在看

非遗贺春！AI与非遗交融，魔多蛇年春节AI模型创作大赛盛大启幕

AI大模型时代，人才的需求已经变了

灰豚AI数字人重磅突破，国内最强数字人AI口播软件大模型来袭

AI大模型时代下的天融信：安全领域的智能先锋

AI日报：字节重磅推出豆包视觉理解模型；AI“魔改”宠物跳舞爆火；OpenAI开放满血o1模型API；即梦AI上线海报生成功能

AI日报：ChatGPT AI搜索免费开放；谷歌AI视频模型Veo2优于Sora；Midjourney重磅上新个性化模型与情绪板

首次！大模型自动搜索人工生命，做出AI科学家的Sakana AI又放大招

AI日报：阿里通义开源多模态推理模型QVQ-72B；OpenAI考虑自研人形机器人；QQ音乐上线首个AI大模型音效

你还说这是AI？我们体验了一波生成亚洲人最好看的文生图大模型

AI新风向：思必驰“分布式大模型智能体系统”赋能产业未来

AI日报：AI假冒名人直播带货违法；OpenAI o3 模型能耗惊人；AI技术将助推iPhone销量

业内首个！京东发布“AI京医”大模型：准确率达99.5%

AI日报：可灵AI上线AI模特功能；字节今年AI投入近BAT总和；ChatGPT本月第二次大规模宕机；抖音引入音频审核大模型

可灵AI推出可图1.5模型 画面质量、人像美感跃升新高度

AI日报：“即创”正式版上线；2024胡润中国AI企业50强榜单；通义万相推2.1视频模型；微软开源超强小模型Phi-4

AI日报：可灵AI API对口型能力全面开放；豆包大模型宣称追平GPT-4；百度2024年度AI提示词“答案”；通义千问视觉模型直降80%

AI日报：王炸！海螺AI推主体参考功能；商汤科技发布 “日日新” 融合大模型；独立Grok应用上架苹果商店

AI日报：可灵AI V1.6模型API开放；公众号上线 “AI配图” 功能;嫌犯用ChatGPT策划酒店爆炸案；阿里云上线AI程序员

AI日报：支付宝推AI创意生成平台；谷歌王炸推理模型Gemini2.0 Flash Thinking；Runway支持插入中间帧；OpenAI准备o3推理模型

出圈就好！盘点2024年国内AI大模型产品的那些破圈姿势

可灵AI推出可图1.5模型画面质量、人像美感跃升新高度