站长之家(ChinaZ.com)9月21日 消息:9月20日,生数科技发布了自主研发的多模态通用大模型,并同时推出了两款应用产品:视觉创意设计平台 PixWeaver 和3D 资产创建工具 VoxCraft。
生数科技的多模态通用大模型采用底层融合的思路,将 Transformer 架构引入扩散模型,实现文本、图像、3D、视频等多模态知识的融合。该大模型具备语义理解强、训练速度快、可控性突出和兼容性出色的优点,基于自研的分布式架构,训练速度快、通信消耗低,研发效率提高。
经过多次迭代,大模型在图像生成、3D 模型生成和视频编辑等任务中展现出领先效果。图像生成支持中文语义理解,画面细节丰富;3D 模型生成在分辨率和多样性方面表现出色;视频生成支持逐帧级的元素编辑和风格迁移。
基于大模型的能力,生数科技推出了两款应用产品。PixWeaver 是一款视觉创意设计平台,支持根据文字描述生成多种风格图像,具备通用性强、中文理解准确和画面细节丰富的特点。VoxCraft 是一款支持快速创建3D 图像的工具,通过输入文本描述或上传2D 图像,可以高效自动化生成多元3D 资产。
此外,生数科技的大模型还面向游戏制作、影视制作、广告营销等多个行业提供服务能力,支持各类创意内容的生成。
体验地址:https://pw.shengshu-ai.com/