4月7日,据科技领域消息,近期人工智能模型应用热度持续攀升,其中模型调用所产生的计算资源成本成为业界关注焦点。在此背景下,国产模型MiniMax 2.7因其表现,在相关调用榜单中位居前列。
MiniMax 2.7模型发布已有一段时间,其开源计划一直备受开发者社区期待。近日,官方在技术社区中公布了最新进展,对延期表示歉意,并解释因低估了相关工作量导致进度延迟。据悉,目前团队正进行最后的基础设施适配工作,预计将于本周末正式发布开源版本。
MiniMax 2.7模型开源后将提升可访问性
此次开源行动被认为具有多重意义。对开发社区而言,这意味着能够更灵活地部署与应用该模型;对普通用户来说,开源有望促进更广泛的技术接入与成本优化,从而使得相关应用的使用费用更为亲民。
此前,在行业出现限制第三方平台接入的动向时,MiniMax方面曾公开表示,其技术架构在设计之初就支持跨平台使用,并强调开放生态对技术创新的重要性。
MiniMax 2.7版本于3月18日正式亮相,距离其上一代主力版本发布仅间隔一个多月,迭代速度较快。官方称,该版本是其技术体系深度参与自身演进过程的成果。
据介绍,MiniMax 2.7主要在以下三个维度实现了性能提升:
1. 软件工程能力:在包括完整项目交付、日志分析、代码安全及机器学习等实际软件开发场景中表现突出。在SWE-Pro基准测试中取得56.22%的得分。同时,在端到端项目交付(VIBE-Pro 55.6%)与复杂系统理解(Terminal Bench 2得分57.0%)测试中也展现了相应能力。
2. 专业办公场景:提升了模型在专业领域的知识处理与任务执行能力。在GDPval-AA评估中获得1495的ELO评分。该版本对Excel、PPT、Word等办公软件的复杂编辑与多轮高保真修改能力显著增强,并能在处理长达2000个标记的复杂指令时,保持97%的技能遵循率。在特定功能评测中,其表现已接近行业先进水平。
3. 交互与情境适应:该模型具备优秀的身份一致性保持与情境理解能力,不仅在生产力场景有所突破,也为互动娱乐等创新应用提供了技术基础。
模型在多项专业测试中表现优异