中国联通宣布开源其自主研发的"联通元景文生图模型”,该模型完全基于国产昇腾AI软硬件平台训练和推理,标志着我国文生图领域实现自主可控的新突破。
自主创新,技术领先
联通元景文生图模型突破性地融合了复合语言编码模块,增强了对中文长文本、多属性对应和中文特色词汇的理解,显著提升了生成图像的精度和质量。
该模型在昇腾AI大算力集群上完成训练和推理,并开源代码和模型,助力推动国产文生图技术的进步。
原生中文理解,准确精准
传统的英文文生图模型存在中文理解偏差,联通元景文生图模型通过引入中文CLIP和复合语言编码架构,实现了原生中文语义理解,有效避免了信息损失。
预训练海量中文图文对数据,赋予模型精准理解中文专属名词和特色词汇的能力,生成更贴合实际的图像。
昇腾AI赋能,一体化适配
联通元景文生图模型与国产昇腾AI基础软硬件平台深度融合,实现从微调训练到推理的一体化适配。
支持自定义数据集,实现跨平台平滑迁移;推理接口与Diffusers对齐,支持单卡和多卡推理,提升效率。
广泛应用,赋能多领域
联通元景文生图模型已广泛应用于文创、服装、工业设计等领域,支撑了中华器灵、服装大模型等多个案例。
全面开源,推动创新
联通元景文生图模型已在GitHub、Hugging Face、魔搭、始智等社区全面开源,加速推动国产文生图技术的发展。