返回

站长之家 - 业界 2023-11-20 11:05

谷歌推出新图像控制方式可在StableDiffusion图像生成中保证内容特征一致性

站长之家（ChinaZ.com）11月20日消息:Google最近推出了一种新的图像生成技术，通过保证内容特征的一致性，可以生成具有相同视觉特征的连贯图像。这对于故事可视化、游戏开发和广告等领域非常重要，因为在生成过程中，角色或内容的一致性是必需的。

论文地址：https://arxiv.org/pdf/2311.10093.pdf

这项技术的实现方法包括三个步骤。首先是身份聚类，通过生成一系列图像，并将它们嵌入到语义空间中，使用聚类算法将这些图像分组，每个组代表一种可能的角色身份。这个过程旨在识别出一组视觉上一致的图像，从而确定角色的主要视觉特征。

接下来是身份提取，一旦确定了一组具有高内聚性的图像，就会在这些图像上训练模型，以提取出更一致的角色身份。这意味着模型将学习到特定角色的关键视觉特征，以便在未来的生成中更准确地重现这些特征。

相关话题

StableDiffusion

推荐关键词

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

VMware重磅官宣！Workstation和Fusion彻底全部免费：支持商用

2024-11-128801阅读

Passion在开封夜骑里具象化了：场面热血十足

2024-11-051.5万阅读

苹果Vision Pro或明年发布新版：搭载M5芯片

2024-11-041.4万阅读

Apple Vision Pro 新配件：Belkin 头带亮相售价49.95美元

2024-11-048198阅读

专注Robotaxi，才是真正的Robotaxi第一股

2024-10-291.6万阅读

黄健翔淘宝开播首场3D空间直播：通过Vision Pro即可“召唤”商品

2024-11-112.6万阅读

passion不停！雅迪冠能星舰S80线下高调首秀来了

2024-10-282.8万阅读

苹果发布iOS 18.2 Beta 2：Siri可付费升级ChatGPT Plus

2024-11-052.3万阅读

苹果发布iOS 18.2 Beta 2：Siri支持付费升级ChatGPT Plus

2024-11-052.4万阅读

金色传说！掠夺者携手OC LAB推出至臻限量版RGB CUDIMM

2024-11-018691阅读

双11购校园神器三星Galaxy Tab S10系列值得考虑

2024-11-051.0万阅读

知乎如何盈利这个问题，海对面的Reddit有了答案

2024-11-074496阅读

苹果发布iOS 18.2 Beta 4：iPhone重启相册加密失效Bug仍未修复

2024-11-212.2万阅读

首个可保留情感的音频LLM！Meta重磅开源7B-Spirit LM，一网打尽「音频+文本」多模态任务

2024-11-222.2万阅读

高效办公必备三星Galaxy Tab S10系列带来智能新感受

2024-11-211.1万阅读

旷视科技助力Robotaxi产业发展，推动自动驾驶技术新突破

2024-11-131.1万阅读

双11开门红买AI平板就选三星Galaxy Tab S10系列！

2024-11-013658阅读

又是一年冰雪季！TA就是冬季出游的无忧之选

2024-11-228115阅读

STT在元宇宙网络平台Statter Network的若干种应用场景

2024-11-071.8万阅读

小米澎湃OS2 Beta版即日起开始推送：小米14等六款机型尝鲜

2024-11-022.8万阅读