站长之家(ChinaZ.com)11月20日 消息:Google最近推出了一种新的图像生成技术,通过保证内容特征的一致性,可以生成具有相同视觉特征的连贯图像。这对于故事可视化、游戏开发和广告等领域非常重要,因为在生成过程中,角色或内容的一致性是必需的。
论文地址:https://arxiv.org/pdf/2311.10093.pdf
这项技术的实现方法包括三个步骤。首先是身份聚类,通过生成一系列图像,并将它们嵌入到语义空间中,使用聚类算法将这些图像分组,每个组代表一种可能的角色身份。这个过程旨在识别出一组视觉上一致的图像,从而确定角色的主要视觉特征。
接下来是身份提取,一旦确定了一组具有高内聚性的图像,就会在这些图像上训练模型,以提取出更一致的角色身份。这意味着模型将学习到特定角色的关键视觉特征,以便在未来的生成中更准确地重现这些特征。