苹果推出300亿参数多模态AI大模型MM1.5：拥有图像识别、自然语言推理能力

科技巨头苹果公司近日宣布推出其最新的多模态人工智能（AI）大模型，命名为“MM1.5”。该模型拥有300亿个参数，是苹果公司在人工智能领域最新突破的标志。

MM1.5构建在MM1架构的基础上，重点关注混合不同类型数据的训练周期对模型性能的影响。该模型提供一系列参数规模，从10亿到300亿不等，并具有图像识别和自然语言推理能力。

与前代相比，苹果公司改进了MM1.5的数据混合策略，从而增强了模型对图像理解、视觉推理和多图像推理任务的能力。此外，苹果公司还引入了高质量的OCR数据和合成图像描述，显着提高了模型对包含大量文本的图像的理解。

除了通用模型之外，苹果公司还推出了专门用于视频理解和移动设备用户界面（UI）理解的MM1.5变体。MM1.5-UI模型未来有望成为iOS背后的苹果“AI”，能够处理各种视觉任务，包括总结屏幕功能和通过对话与用户交互。

虽然MM1.5在基准测试中表现出色，但苹果团队仍在继续优化该模型，以增强其对移动设备UI的理解能力。通过融合更多数据和开发更复杂架构，苹果公司旨在打造一个更高效、更强大的苹果“AI”。

中聚AI女娲大模型：专注企业服务的智能AI，让企业难题一点就通！

2024-11-122.6万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

苹果推出300亿参数多模态AI大模型MM1.5：拥有图像识别、自然语言推理能力

推荐关键词

24小时热搜

大家正在看

大模型应用开发，AI 厂商开启新一轮“群雄逐鹿”？

实时互动情感陪伴，Soul App升级多模态大模型探索AI社交新可能

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

AI日报：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造对话AI智能体；Mistral推最强开源多模态模型Pixtral Large

不做Sora背后：百度的多模态路线是什么？

AI日报：科大讯飞星火多模态交互大模型上线；Anthropic发布提示词优化新功能；腾讯AI智能工作台ima上线Windows版

时代的眼泪！苹果要彻底封杀3.5mm接口：相关转接设备已停售

超GPT-4o，1240亿参数！最强开源多模态模型 Pixtral Large！

OpenAI科学家震惊TED大会：让AI模型思考20秒，提升10万倍性能！

中聚AI女娲大模型:如何利用AI帮助企业提升核心竞争力?

1.25mm极窄边框！努比亚Z70 Ultra搭载1.5K真全面无孔屏

大模型的苦，创业的AI 科学家最懂

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

Meta推出新一代智能触觉系统机械手可实现多模态环境感知

猿辅导集团副总裁程群：AI时代，大模型在教育场景的创新与应用

指令层级，帮助AI大模型防御恶意攻击

大模型走到AI战略分岔口，字节们面临偏航危机

图像伪造照妖镜！北大发布多模态LLM图像篡改检测定位框架FakeShield

AI日报：快手推“可灵AI”独立APP；百度将推AI智能眼镜；智谱AI开源CogVideoX v1.5并上线“新清影”；Krea AI上线Lora训练功能

中聚AI女娲大模型：专注企业服务的智能AI，让企业难题一点就通！

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

苹果推出300亿参数多模态AI大模型MM1.5：拥有图像识别、自然语言推理能力

推荐关键词

24小时热搜

大家正在看

大模型应用开发，AI 厂商开启新一轮“群雄逐鹿”？

实时互动 情感陪伴，Soul App升级多模态大模型探索AI社交新可能

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

AI日报：阿里云逆天大模型Qwen2.5-Turbo；ElevenLabs支持打造对话AI智能体；Mistral推最强开源多模态模型Pixtral Large

不做Sora背后：百度的多模态路线是什么？

AI日报：科大讯飞星火多模态交互大模型上线；Anthropic发布提示词优化新功能；腾讯AI智能工作台ima上线Windows版

时代的眼泪！苹果要彻底封杀3.5mm接口：相关转接设备已停售

超GPT-4o，1240亿参数！最强开源多模态模型 Pixtral Large！

OpenAI科学家震惊TED大会：让AI模型思考20秒，提升10万倍性能！

中聚AI女娲大模型:如何利用AI帮助企业提升核心竞争力?

1.25mm极窄边框！努比亚Z70 Ultra搭载1.5K真全面无孔屏

大模型的苦，创业的AI 科学家最懂

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

Meta推出新一代智能触觉系统机械手 可实现多模态环境感知

猿辅导集团副总裁程群：AI时代，大模型在教育场景的创新与应用

指令层级，帮助AI大模型防御恶意攻击

大模型走到AI战略分岔口，字节们面临偏航危机

图像伪造照妖镜！北大发布多模态LLM图像篡改检测定位框架FakeShield

AI日报：快手推“可灵AI”独立APP；百度将推AI智能眼镜；智谱AI开源CogVideoX v1.5并上线“新清影”；Krea AI上线Lora训练功能

中聚AI女娲大模型：专注企业服务的智能AI，让企业难题一点就通！

实时互动情感陪伴，Soul App升级多模态大模型探索AI社交新可能

Meta推出新一代智能触觉系统机械手可实现多模态环境感知