站长之家 - 业界 2026-03-03 11:22

DeepSeek V4 Lite悄然更新:2000亿小参数性能逼近美国顶流

3月3日消息,尽管在春节档期间未见新版本发布,但DeepSeek于2月11日推出了一款名为“DeepSeek V4 Lite”的模型。该模型参数量为2000亿,相较于主流大模型规模较小。

该模型的主要特点是支持长达100万字的上下文处理能力。此前有用户反馈,除了超长上下文这一优势外,其整体表现并未引起广泛关注,部分原因在于其参数规模与主流模型存在差距。

然而,自发布以来,该模型持续进行迭代优化。2月27日,已有技术社区用户注意到其性能显著提升。近日再次更新后,来自Linux Do社区的资深开发者HCPTangHY在测试后表示,其表现“相当出色”,在其进行的多项基准测试中已达到国内同类模型的领先水平。

有观点认为,若持续投入研发,此类开源模型有望对闭源生态形成竞争压力。

DeepSeek V4 Lite模型性能更新示意

DeepSeek V4 Lite模型近期性能提升引发关注

根据测试数据显示,3月2日更新后的版本,其综合评分较2月27日版本有进一步提升,性能已接近国际顶尖模型Sonnet 4.6的水平。在包括“天气卡片”生成在内的多项前端应用与交互测试中,新版模型在功能实现与视觉呈现方面均表现稳定。

回顾过去一年的技术发展,国内大模型在对话交互领域已与闭源模型差距缩小,但在多模态理解、复杂编程、数学推理及智能体构建等方面仍存在追赶空间。近期国内多家机构虽发布了升级版本,但同期国际厂商也推出了新一代产品,技术竞争持续激烈。

行业分析指出,国内研发机构在追赶过程中面临多重挑战,包括研发投入规模、计算资源储备以及数据积累等方面与国际领先企业存在客观差距。后者往往拥有更长时间的技术沉淀或更庞大的用户数据基础。

值得注意的是,国际同行在数据获取与研发投入上力度极大,此前甚至出现过因数据收集方式引发法律纠纷的案例,侧面反映出该领域竞争的激烈程度。

作为国内技术探索的代表之一,DeepSeek的进展受到业界关注。分析人士认为,若当前2000亿参数的“轻量版”模型已展现出接近顶尖水平的潜力,其完整版本的技术表现更值得期待,或将进一步影响全球该领域的技术竞争格局。

推荐关键词

24小时热搜

查看更多内容

大家正在看