站长之家(ChinaZ.com) 7月14日 消息:Stability AI 是推出图像生成模型 Stable Diffusion 的初创公司,他们正在推出一项将素描转化为图像的新服务。
这项名为 Stable Doodle 的素描转图像服务利用最新的 Stable Diffusion 模型,分析素描的轮廓并生成一个「视觉上令人愉悦」的艺术渲染图。该服务从今天起通过 ClipDrop 平台提供,这是 Stability 在今年 3 月通过收购 Init ML 获得的,后者是由前 Google 员工创立的人工智能初创公司。
「Stable Doodle 旨在为专业人士和新手提供服务,无论他们对人工智能工具的熟悉程度如何,」Stability AI 在一博客文章中写道。「通过 Stable Doodle,任何具备基本绘画技巧和在线访问权限的人都可以在几秒钟内生成高质量的原创图像。」
市场上存在许多素描转图像的人工智能工具,包括开源项目和带广告的应用程序。但 Stable Doodle 的独特之处在于它允许对图像生成过程进行更「精确」的控制,Stability AI 声称。
在底层,Stable Doodle 的驱动力是 Stable Diffusion 模型(Stable Diffusion XL),搭配了腾讯旗下一个研发部门应用研究中心(ARC)开发的「条件控制解决方案」。这个控制解决方案称为 T2I-Adapter,它既使 Stable Diffusion XL 能够接受素描作为输入,又引导模型实现对输出艺术作品更好的微调。
「T2I-Adapter 使 Stable Doodle 能够理解素描的轮廓,并根据模型定义的轮廓结合提示生成图像,」Stability AI 在博客文章中解释道。
除了素描,Stable Doodle 还接受用于指导图像生成过程的提示,例如「舒适的椅子,等距风格」或「穿着牛仔夹克的猫咪,数码艺术风格」。然而,定制化有一定限制——在推出时,Stable Doodle 只支持 14 种艺术风格。
Stability AI 设想 Stable Doodle 将成为设计师、插画师和其他专业人士「释放宝贵时间」和「提高效率」的工具。同时,该公司警告称输出图像的质量取决于初始绘图的细节、提示的描述性,以及所描绘场景的复杂程度。
「作为素描绘制的想法可以立即转化为作品,用于为客户创建设计、演示文稿和网站的素材,甚至可以创建标志,」该公司提出。「在未来,Stable Doodle 将使用户能够导入素描。此外,我们还将提供特定垂直领域的使用案例,例如包括房地产应用。」
借助 Stable Doodle 等工具,Stability AI 正在追逐商业收入的新来源,以应对其商业努力的低潮期。(Stable Doodle 是免费的,但受到限制。)今年 4 月,Semafor 报道称 Stability AI 正在耗尽资金,导致他们正在寻找高管以推动销售增长。
上个月,Stability AI 通过可转债(即可转换为股权的债务)融资 2500 万美元,使其总融资额超过 1.25 亿美元。但它尚未以更高的估值完成新的融资。该初创公司上次估值为 10 亿美元;据报道,Stability 计划在未来几个月内将估值增加至 40 亿美元。