国产4o大模型，秒懂国风李子柒

声明:本文来自于微信公众号量子位，作者:金磊，授权站长之家转载发布。

又一个国产版《Her》，就这么水灵灵地来了。

作为一个实时语音对话的功能，效果好不好，实测见分晓。

我们直接以近期的大热点——李子柒复出作为话题，来上一番对话:

可以看到，这个AI对于“李子柒复出”这样相对较新的话题，信息的掌握也是较为全面。

它先是用“太震撼了”来表达了对这件事的整体感受，并且精准、高度总结内容为:

用中国非物质文化遗产漆器为主题的视频，这个选择本身就是对传统文化的致敬。

当问及对视频内容更具体的感受，国产《Her》仿佛一个李子柒的人类粉丝:

依旧保持高标准，每一帧都像一幅画面;她的视频总能让人感受到一种宁静与美好。

不仅如此，国产《Her》甚至还能对网友们的讨论做总结，包括李子柒为了做了漆器，背后所付出的努力和刻苦精神。

而且从整个对话过程来看，这个AI在语言表达方式上也是与人类无异，例如语气和自然的停顿等等;即使是随意地打断，也是完全OK的哦~

同样的话题，我们给到GPT-4o这边:

嗯，GPT-4o知道李子柒，但是知道的不多。

无论是中文还是英文提问，由于它的知识是截止到了2023年10月，所以对于实时的新闻热点，GPT-4o是无法hold住的。

那么这个国产《Her》，何许AI也?

不卖关子，它正是来自昆仑万维的Skyo，基于天工大模型4.04o版（Skywork4o）打造。

那么除了能够跟踪时事热点，Skyo还能解锁哪些能力?

更多实测，Let’s go on~

聊天随意打断，话题不掉地上

OpenAI大约半年前发布GPT-4o实时语音对话功能的时候，现场和网上观众较为震惊的，便是它不论如何被打断，都能马上接上话。

虽然在刚才李子柒的例子中，我们已经体现了一些“随时打断”的能力，所以我们这次再加一点难度。

随时打断，中英切换

我们这次测试的话题是去西雅图旅行，来看下Skyo能给出什么样的建议:

在我们提出了简洁的需求之后，Skyo便唰唰唰地开始制定旅程计划了。

而当它提到西雅图标志性景点太空针塔时，我们进行了第一次打断（00:50），Skyo也随即停止了回答，开始聆听新问题。

当Skyo要继续拓展对太空针塔的介绍，我们随即第二次打断（01:09）;第三次打断（01:38）我们直接用英文进行提问:

OK， sounds good， by the way， can you recommand some Seattle dishes I should try?

然后Skyo也是听懂了英文需求，立即开始推荐当地著名的咖啡餐厅。

这一轮的随时打断+中英文切换，Skyo，通过。

不让话掉到地上

在真实生活中，很多i人在与人沟通交流过程中，或许会出现接不上话的情况。

那么如果我们以话题终结者的姿态与Skyo交流，又会是什么效果?来，开整:

我们先是以“电影”为由头，主动开启了一个话题。

但Skyo在反问的时候，我们连续两次冷漠回答了“没有”（00:27）、“也没有”(00:47)。

第一次话题被终结，Skyo很巧妙地把话题从电影转向了音乐或书籍;二次话题被终结，Skyo联系上下文（因为是我们以电影开启的话题），它就开始讲述自己对电影的看法了。

总而言之，把话掉地上，这事儿在Skyo这边是不能存在的。

情感陪伴，“人”声可变

自打对话类AI大模型问世以来，情感陪伴，无疑成了很多用户的一种刚需。

那么Skyo是否也能在人们难受之际带来一份心灵的慰藉呢?

请看VCR:

在我们提出“被老板骂了”这样的情景之后，Skyo会用自己的方式来引导我们看开一些。

而当被要求切换女声声音时（00:42），Skyo也是有求必应，秒变女声，然后有理有据地罗列观点进行心理开导。

由此可见，Skyo作为新晋国产实时语音对话产品，在多个维度的测试中都属于达标了的那种。

那么接下来的一个问题:

怎么做到的?

Skyo实时语音对话助手是一个多模态大模型项目，应用了端到端实时语音对话建模技术。

其强大的记忆功能使其能够在对话中追踪并回忆用户的偏好与历史信息，从而提升多轮对话的准确性。

这种精细的技术积累，使得Skyo在高强度的对话交互中依然保持卓越的稳定性与流畅性。

除此之外，Skyo采用了全双工和低延迟的实时语音对话架构。

全双工意味着该助手能够同时进行听和说的操作，用户无需按下对话开始和结束按钮即可实现无缝交流，这就让人机的互动变得更加自然和高效。

在技术测试中，Skyo以其低延迟的实时响应接近人类思考的反应时间，体现了在对话响应速度方面的显著优势。

在互动能力方面，Skyo拥有较好的情感理解与个性化记忆功能。

它不仅可以记录用户的历史偏好，还能根据用户需求提供个性化的互动体验，例如提供温暖的女声或更具情感色彩的回应。

这使得Skyo在非正式、非固定场景下，能够保持一种尊重且平等的人机交互体验。

Skyo的卓越性能依赖于其多模态模型的应用，使其能够在多种场景中保持高质量的交互体验。

例如，用户可以与助手讨论最新的科技新闻，助手能够根据用户的请求，从科技资源库中检索相关信息并进行异步交互，增强用户的互动感与沉浸体验。

此外，Skyo系统的自研特性使其在互联网语音交互与应用场景中具有出色的适应性。

通过自研的数据积累与语音交互技术，Skyo实现了实时、高效且个性化的沟通体验，使得用户在每次对话中都能感受到近乎无障碍的人机互动与温暖陪伴。

以上就是昆仑万维“炼”成Skyo背后的秘籍了。

又拼上一块多模态“拼图”

最后，我们聊回到实时语音对话助手本身。

虽然GPT-4o可以说是率先打开了这一市场的大门，但时至今日类似的产品仍然存在诸多痛点。

例如现有产品在多语言支持方面仍有不足，难以满足全球用户的需求;再如它们虽然在语义理解和生成方面表现出色，但在情感理解和个性化记忆方面仍有待提升。

此外，实时语音对话助手在响应速度和流畅性方面也需要进一步优化，以此来确保用户体验的连贯性和自然性。

但最重要的一点，或许还属消息的实时性了，毕竟我们平时聊天也都更倾向于谈谈一些新鲜的事物。

从这次的实测中不难发现，Skyo在诸多维度上已经符合要求，是在实时语音对话助手领域发展中打了个样的那种。

至于对昆仑万维在大模型时代自身的发展，Skyo可以说是有拼上了一块多模态的“拼图”。

这一点，把它在每个节点的产品铺开来看，便可一目了然了。

首先就是其大底座天工大模型系列，包括天工1.0、天工2.0、天工3.0，近期还将邀测天工大模型4.0O1版，具备中文逻辑推理和反思能力。

其次在其它模态上，还包括AI搜索（天工AI搜索）、AI音乐(天工SkyMusic)、AI社交(linky)、AI视频(AI短剧平台SkyReels)等。

加上此次的Skyo，昆仑万维称得上是国内在多模态与工程能力，以及布局全面型上的佼佼者了。

One More Thing

据了解，Skyo即将集成在天工AI的APP中。

届时，除了我们展示的能力之外，还会有生成音乐、主动交流以及更多个性化交互等众多新能力哦~

那么这样的实时语音对话助手，是否聊到你的心趴上了呢?

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

国产4o大模型，秒懂国风李子柒

聊天随意打断，话题不掉地上

随时打断，中英切换

不让话掉到地上

情感陪伴，“人”声可变

怎么做到的?

又拼上一块多模态“拼图”

One More Thing

推荐关键词

24小时热搜

大家正在看

AI日报：xAI面向开发者推出API；天工AI发布AI高级搜索功能；Claude 3.5 Haiku上线

天工AI写作助手怎么使用方法详细教程指南天工ai人工智能官方网站地址入口

19岁烤牌姑娘走红：每天工作至少12小时让母亲过上更好的生活

19岁女孩3点起床赶集帮妈妈卖烤牌：每天工作12个小时

AI日报：海螺AI上线图生视频功能；天工AI搜索新增彩页，还打算带你赚钱；ChatGPT新版灰测

手机铰链系统首次实现内外弯折！华为Mate XT非凡大师首创天工铰链系统

华为Mate XT首发华为天工铰链系统：非牛顿流体业界最大UTG玻璃

华为Mate XT非凡大师搭载5600mAh大电池，首发华为天工铰链系统

你一天工资全买优衣库能买多少件！世界优衣库价格对比：日本最便宜

AI日报：“毒舌AI”每小时赚近4千美元；Flux生成网红因太逼真爆火；国产机器人“天工”升级；Grok 2 大模型测试版将发布

世界首富也没躺平自由！马斯克凌晨3点睡9点起每周七天工作

手机散热天花板！一加Ace 3 Pro首发第二代天工散热系统

AI日报：天工推OpenAl用户“一键搬家计划”；ChatGPT桌面版来了；豆包拿下AI高考国内第一；宠物AI写真“猫猫守护神”走红

昆仑万维宣布天工平台日活跃用户超百万

昆仑万维：天工AI每日活跃用户DAU超过100万

昆仑万维开源2千亿稀疏大模型天工MoE，全球首创能用4090推理

用GPT-3.5生成数据集！北大天工等团队图像编辑新SOTA，可精准模拟物理世界场景

AI日报：AMD向英伟达亮剑推出最强AI芯片；斯坦福AI团队承认抄袭国产大模型；suno将推“哼歌”功能；昆仑万维开源2千亿稀疏大模型天工MoE

专家建议：5天工作制应该进行调整试点四天半工作制

全球首个！我国发布人形机器人“天工”：可拟人奔跑 6公里/小时

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

国产4o大模型，秒懂国风李子柒

聊天随意打断，话题不掉地上

随时打断，中英切换

不让话掉到地上

情感陪伴，“人”声可变

怎么做到的?

又拼上一块多模态“拼图”

One More Thing

推荐关键词

24小时热搜

大家正在看

AI日报：xAI面向开发者推出API；天工AI发布AI高级搜索功能；Claude 3.5 Haiku上线

天工AI写作助手怎么使用方法详细教程指南 天工ai人工智能官方网站地址入口

19岁烤牌姑娘走红：每天工作至少12小时 让母亲过上更好的生活

19岁女孩3点起床赶集帮妈妈卖烤牌：每天工作12个小时

AI日报：海螺AI上线图生视频功能；天工AI搜索新增彩页，还打算带你赚钱；ChatGPT新版灰测

手机铰链系统首次实现内外弯折！华为Mate XT非凡大师首创天工铰链系统

华为Mate XT首发华为天工铰链系统：非牛顿流体 业界最大UTG玻璃

华为Mate XT非凡大师搭载5600mAh大电池，首发华为天工铰链系统

你一天工资全买优衣库能买多少件！世界优衣库价格对比：日本最便宜

AI日报：“毒舌AI”每小时赚近4千美元；Flux生成网红因太逼真爆火；国产机器人“天工”升级；Grok 2 大模型测试版将发布

世界首富也没躺平自由！马斯克凌晨3点睡9点起 每周七天工作

手机散热天花板！一加Ace 3 Pro首发第二代天工散热系统

AI日报：天工推OpenAl用户“一键搬家计划”；ChatGPT桌面版来了；豆包拿下AI高考国内第一；宠物AI写真“猫猫守护神”走红

昆仑万维宣布天工平台日活跃用户超百万

昆仑万维：天工AI每日活跃用户DAU超过100万

昆仑万维开源2千亿稀疏大模型天工MoE，全球首创能用4090推理

用GPT-3.5生成数据集！北大天工等团队图像编辑新SOTA，可精准模拟物理世界场景

AI日报：AMD向英伟达亮剑推出最强AI芯片；斯坦福AI团队承认抄袭国产大模型；suno将推“哼歌”功能；昆仑万维开源2千亿稀疏大模型天工MoE

专家建议：5天工作制应该进行调整 试点四天半工作制

全球首个！我国发布人形机器人“天工”：可拟人奔跑 6公里/小时

天工AI写作助手怎么使用方法详细教程指南天工ai人工智能官方网站地址入口

19岁烤牌姑娘走红：每天工作至少12小时让母亲过上更好的生活

华为Mate XT首发华为天工铰链系统：非牛顿流体业界最大UTG玻璃

世界首富也没躺平自由！马斯克凌晨3点睡9点起每周七天工作

专家建议：5天工作制应该进行调整试点四天半工作制