站长之家(ChinaZ.com)11月23日 消息:元象XVERSE宣布推出多模态数字人,其多模态数字人方案具有以下特点:形象逼真、能听会道、灵活生动和情智兼备。
在形象逼真方面,元象通过自研的渲染引擎和制作模块,实现了高品质的皮肤渲染、逼真的头发和眼球效果,以及真实的布料光照。
在能听会道方面,元象提供了语音识别、全双工语音交互和语音合成等一站式服务,实现了准确快速的语音识别和自然流畅的语音交互。
在灵活生动方面,元象的数字人可以通过表情驱动、手势驱动和舞蹈生成等技术实现灵活多样的动作表达。
在情智兼备方面,元象通过自研的大模型和角色扮演聊天系统,使数字人具备智商和情商,并能进行情感和思维交流。
此外,元象的多模态数字人方案具有以下特点和优势:
1. 好看、聪明、可定制:与传统的数字人相比,元象的多模态数字人采用更多的 CG 渲染和动画技术,使人物形象更精细,渲染品质更高。同时,通过 AI 驱动全流程交互,数字人具备智商和情商,表情动作更灵活生动。此外,数字人的形象、表情、声音、聊天风格等都可以灵活定制,提升交互时长和深度。
2. 低延迟、交互流畅:元象通过优化全链路算法和计算效率,实现了极低的延迟,用户语音交互的平均延迟仅为2秒,大幅降低了用户等待的时间,提升了交互体验。
3. 多终端、易分享传播:元象的多模态数字人方案以 Web 为载体,用户可以通过电脑、手机和 VR 等多个终端轻松接入,实时感受高品质渲染效果。数字人的内容也可以轻松转发和分享,快速传播和扩大影响力。
4. 一站式、客户省心省力:元象提供一站式技术服务,从外观建模到文本语音交互,全程支持数字人制作,客户只需输入需求,元象就能按需输出数字人,高效省力。
元象表示,多模态数字人的应用场景包括虚拟 IP、聊天陪伴、解说导览、客服培训和在线直播等。对于每个场景,元象的多模态数字人方案都能提供个性化定制的服务,实现与用户的互动和沉浸体验。
未来,元象将继续提升数字人渲染效果、丰富交互功能,并深化大模型与数字人的结合,打造更智能、更灵动的数字人。