阿里云通义千问开源Qwen2系列模型：性能显著提升包含5个尺寸

站长之家（ChinaZ.com）6月7日消息:阿里巴巴悄悄发布了 Qwen2系列模型，这是 Qwen1.5升级后的重大更新。

Qwen2系列包含了5个不同规模的预训练和指令微调模型，分别是 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。这些模型在处理长文本时支持不同的上下文长度，最大可达128K tokens。

微信截图_20240607083029.png

Qwen2系列在多语言方面做了优化，增加了27种语言的高质量数据，并针对常见的语言转换问题进行了优化。模型在多项评测中表现优异，包括自然语言理解、知识、代码、数学和多语言理解等能力，显著超越之前的 Qwen1.5和其他开源模型。

在代码和数学能力方面，Qwen2系列持续提升，特别是在多种编程语言上的表现和数学解题能力方面有显著提升。模型还能处理长文本任务，其中 Qwen2-72B-Instruct 能完美处理128k 上下文长度内的信息抽取任务。

在安全性方面，Qwen2-72B-Instruct 模型与 GPT-4表现相当，显著优于 Mistral-8x22B 模型。所有模型均已开源在 Hugging Face 和 ModelScope 上，可在各种应用场景中使用。未来，Qwen 团队还将继续训练更大的模型，探索模型及数据的 Scaling Law，并将 Qwen2扩展成多模态模型。

点击体验:https://top.aibase.com/tool/qwen2

Qwen2完全指南：阿里通义千问模型使用方法教程与免费使用地址入口

2024-06-072.5万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

阿里云通义千问开源Qwen2系列模型：性能显著提升包含5个尺寸

推荐关键词

24小时热搜

大家正在看

全球最强开源模型Qwen2发布，阿里云为开闭源之争画下休止符

Qwen2完全指南：阿里通义千问模型使用方法教程与免费使用地址入口

AI日报：快手版Sora可灵开放测试；阿里悄悄开源Qwen2系列模型；Grok 1.5V或将接入Midjourney；柯南动画风AI特效刷屏抖音

Qwen2有哪些功能免费吗？阿里通义千问怎么使用方法详细教程指南

学习曲线4：更精进的AI模型与不断演进的语言

开源超闭源！通义千问Qwen2发布即爆火，网友：GPT-4o危

OpenAI推出ChatGPT大学教育版：数据不用于训练模型

苹果推出降噪语言模型DLM 用于纠正ASR系统中的错误

Meta新模型NLLB获Nature盛赞，200种濒危语言高质量翻译，「不让任何语言掉队」

OpenAI推出大学教育版本ChatGPT Edu 数据将不用于训练模型

智谱AI与中国银联成立大语言模型联合实验室

ollama是什么？带你了解本地部署大型语言模型的开源框架

Llama3-V: 全新开源视觉大语言模型出世

谷歌发布革命性模型训练方法HyperDreamBooth 20秒完成模型训练

Llama3-V：全新开源视觉大语言模型正式亮相

大模型理解复杂表格，字节&中科大出手了

英特尔团队提出L-MAGIC新技术通过结合语言模型让图像扩散模型生成高质量360度场景

Mistral AI推首个代码生成模型Codestral 支持多种编程语言

DeepSeek-Coder-V2代码语言模型免费吗？AI编程辅导代码生成使用方法详细教程指南

OpenAl成立安全和保障委员会称已经开始训练下一代前沿模型

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

阿里云通义千问开源Qwen2系列模型：性能显著提升 包含5个尺寸

推荐关键词

24小时热搜

大家正在看

全球最强开源模型Qwen2发布，阿里云为开闭源之争画下休止符

Qwen2完全指南：阿里通义千问模型使用方法教程与免费使用地址入口

AI日报：快手版Sora可灵开放测试；阿里悄悄开源Qwen2系列模型；Grok 1.5V或将接入Midjourney；柯南动画风AI特效刷屏抖音

Qwen2有哪些功能免费吗？阿里通义千问怎么使用方法详细教程指南

学习曲线4：更精进的AI模型与不断演进的语言

开源超闭源！通义千问Qwen2发布即爆火，网友：GPT-4o危

OpenAI推出ChatGPT大学教育版：数据不用于训练模型

苹果推出降噪语言模型DLM 用于纠正ASR系统中的错误

Meta新模型NLLB获Nature盛赞，200种濒危语言高质量翻译，「不让任何语言掉队」

OpenAI推出大学教育版本ChatGPT Edu 数据将不用于训练模型

智谱AI与中国银联成立大语言模型联合实验室

ollama是什么？带你了解本地部署大型语言模型的开源框架

Llama3-V: 全新开源视觉大语言模型出世

谷歌发布革命性模型训练方法HyperDreamBooth 20秒完成模型训练

Llama3-V：全新开源视觉大语言模型正式亮相

大模型理解复杂表格，字节&中科大出手了

英特尔团队提出L-MAGIC新技术 通过结合语言模型让图像扩散模型生成高质量360度场景

Mistral AI推首个代码生成模型Codestral 支持多种编程语言

DeepSeek-Coder-V2代码语言模型免费吗？AI编程辅导代码生成使用方法详细教程指南

OpenAl成立安全和保障委员会 称已经开始训练下一代前沿模型

阿里云通义千问开源Qwen2系列模型：性能显著提升包含5个尺寸

英特尔团队提出L-MAGIC新技术通过结合语言模型让图像扩散模型生成高质量360度场景

OpenAl成立安全和保障委员会称已经开始训练下一代前沿模型