今天,百度公布了文心一言的邀请测试方案。百度的创始人、董事长兼首席执行官李彦宏和百度首席技术官王海峰出席了发布会,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解以及多模态生成五个场景下的综合能力。
据悉,从3月16日开始,首批用户将可以通过邀请测试码,在文心一言官网上体验产品;之后,更多用户将陆续开放申请。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。自3月16日起,用户可以搜索“百度智能云”进入官网,预约加入文心一言云服务测试。
从现场展示来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性和流畅性都逐渐接近人类水平。但是,李彦宏也多次强调,这类大型语言模型仍然需要进一步改进和完善。未来,文心一言还将不断发展,进步空间很大。
在文学创作场景中,文心一言可以根据对话问题总结知名科幻小说《三体》的核心内容,并提出五个续写《三体》的建议角度,体现了问答、分析和创作生成的综合能力。此外,文心一言还可以准确回答《三体》作者、电视剧角色扮演者等实际问题。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题,文心一言还可以基于推理能力给出正确答案。
在连续三次内容创作生成中,文心一言既能准确理解人类意图,又能清晰地表达,这是基于庞大数据规模而产生的“智能涌现”。文心一言大型模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
文心一言还具备一定的思维能力,能够学习数学推演和逻辑推理等相对复杂的任务。例如,在“鸡兔同笼”这类锻炼人类逻辑思维的经典问题中,文心一言能够理解问题并有正确的解题思路,按照正确的步骤逐步计算出正确答案。
在多模态生成方面,李彦宏在现场展示了文心一言生成文本、图片、音频和视频的能力。文心一言还可以生成四川话等方言的语音。虽然由于成本较高,文心一言的视频生成能力尚未向所有用户开放,但未来将逐步推广应用。
随着人工智能时代的到来,IT技术的技术栈也发生了根本变化,从过去的三层变为现在的“芯片-框架-模型-应用”四层。李彦宏认为,百度AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端的优化,大幅提高效率。特别是在框架层和模型层之间,具有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。
据李彦宏预测,大型语言模型将带来三个产业机遇。首先是新型云计算公司,其主流商业模式从IaaS变为MaaS。文心一言将根本性地改变云计算行业的游戏规则。文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用程序。
第二类是进行行业模型精调的公司,这是通用大型模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大型模型能力,为行业客户提供解决方案。
第三类是基于大型模型底座进行应用开发的公司,即应用服务提供商。李彦宏断言,对于大部分创业者和企业来说,真正的机会是基于通用大型语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,这些公司可能会成为未来的新巨头。
总体而言,百度的文心一言展示了基于大型语言模型的强大能力,而这也意味着未来人工智能技术将会更快地向前发展。百度AI全栈布局的优势在于,在技术栈的四层架构中实现端到端的优化,以便更好地支持人工智能应用程序的开发。我们期待看到文心一言在将来的市场中的表现,同时也期待看到更多的人工智能技术创新,为我们的生活带来更多的改变。