站长之家 - 业界 2023-12-21 14:10

AI图片编辑神器Anydoor:开启图片编辑的任意门 图片主体随意移动

划重点:

🌐 由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,通过一张照片将任何物品传送到另一张图片的世界中。

🚪 AnyDoor为图片编辑开启全新时代,实现零样本对象-场景合成。

🎨 设计师无需为合照缺人而烦恼,AnyDoor让贴图穿进背景图,实现自动摆姿势、站位的「魔法」。

站长之家(ChinaZ.com)12月21日 消息:随着数字时代图像编辑的飞速发展,来自香港大学、阿里巴巴和蚂蚁集团的新成果AnyDoor为图片编辑开辟了一扇全新的时代之门。

这是一项基于扩散技术的创新,具有将目标物体以和谐的方式传送到用户指定位置的神奇能力。与传统模型需要为每个物体调整参数不同,AnyDoor只需进行一次训练,就能在推断阶段轻松适应多样化的物体-场景组合。

这种具有挑战性的零障碍设置要求对某个对象进行充分的特征描述。为此,在常用的身份特征基础上,补充了细节特征,这些特征经过精心设计,既能保持纹理细节,又能允许多样化的局部变化(如光照、方向、姿势等),使对象能够与不同环境和谐融合。

此外,研究人员还提出从视频数据集中借用知识,从中观察单个对象在时间轴上的各种形态,以增强模型的泛化能力和稳健性。大量实验证明,我们的方法在效果上优于现有替代方案,并在虚拟试穿和物体移动等实际应用中展现出巨大潜力。

AnyDoor能实现的效果包括

1. 物体移动: AnyDoor可应用于高级任务,如物体移动,轻松实现场景中物体的位置变换。

比如把这张图里桌面上的位置任意变化:

image.png

2. 物体交换: AnyDoor可扩展为进行物体交换,为图像增添更多创意和趣味。

如下图,可以将图中两辆车的位置对调:

image.png

3. 多主体合成: 由于AnyDoor对于将物体放置在给定场景特定位置具有高度可控性,因此轻松扩展为多主体合成,创造更加丰富的画面。

比如把下图中所有的宠物狗都放到同一个草地上:

image.png

4. 虚拟试穿: AnyDoor可作为虚拟试穿的简单但强大基线。无需复杂的人体解析,能够保留不同衣物的颜色、图案和纹理。试穿衣服也能玩成贴画游戏版本,图中人物换上想要的衣服

image.png

这项技术创新为图像编辑领域带来了新的可能性,将在图像合成、效果图像渲染、海报制作、虚拟试穿等多个应用场景中发挥实际作用。

项目网址:https://top.aibase.com/tool/anydoor

论文网址:https://arxiv.org/pdf/2307.09481.pdf

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看

AI助手会成为AI OS吗

AI大神开始疯狂洗牌

字节AI凶猛上位

柜哥柜姐,AI的新工作

AI营销的风,还是吹到了A股