站长之家 - 业界 2025-12-22 16:32

PS天塌了!阿里开源全新图像模型Qwen-Image-Layered 可实现PS级图层

12月22日,阿里巴巴集团发布并开源了其最新的图像生成模型Qwen-Image-Layered”。该模型的核心突破在于,能够像专业图像处理软件一样,理解并生成具有分层结构的图像,从而实现了对图像内容进行精准、可分离的编辑。

据悉,传统视觉模型在处理图像时,通常将其视为一个不可分割的“扁平”像素集合,这导致对图像中任何元素的修改都可能引发整体画面的不可控变化。而新模型通过创新的自研架构,成功模拟了专业设计软件中的图层工作逻辑。它能够将图像智能分解为多个独立图层,并理解物体间的空间关系(如远近、遮挡),从而允许用户对特定图层进行移动、缩放或重绘等操作,同时保持其他部分的高度一致性。

这一技术进展,旨在解决当前AI图像生成领域长期存在的“编辑一致性”难题。在商业广告、UI设计、影视后期等对精度要求极高的专业领域,传统AI生图工具的随机性往往使其仅能作为创意参考。Qwen-Image-Layered模型通过引入对透明通道(Alpha Channel)的结构化理解与全新的模型架构,使得AI生成的图像从“一次性成品”转变为可灵活、精准调整的“素材库”,显著提升了其在专业工作流中的实用价值。

Qwen-Image-Layered模型架构示意图

Qwen-Image-Layered模型架构示意图

技术团队透露,为了使模型具备这种“分层思维”,其训练数据来源于海量的专业设计源文件,从中学习真实的图层组织逻辑。这种基于物理空间关系的理解方式,标志着视觉大模型的研究方向正从单纯的像素预测,向更深层的结构理解与重组演进。

行业观察人士认为,该模型的推出,有望为数字内容创作带来实质性变革。设计及影视制作人员可以直接在生成结果上进行局部、非破坏性的编辑,无需复杂的后期抠图与合成,这将大幅提升创作效率与灵活性。

目前,Qwen-Image-Layered模型已在主流开源社区平台公开,供开发者与研究机构免费下载并用于商业用途。数据显示,阿里巴巴开源的通义千问系列模型累计下载量已突破7亿次,服务企业客户超百万家,在中国企业级模型市场中占据领先地位。

推荐关键词

24小时热搜

查看更多内容

大家正在看