站长之家 - 业界 2024-09-20 14:59

AI日报:​​阿里推新多模态大模型Ovis;Kyutai开源实时语音对话模型Moshi;Apple Intelligence测试版现已开放

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里国际推出最新多模态大模型 Ovis,看菜品就能提供烹饪步骤

阿里国际AI团队发布了多模态大模型Ovis,为各行业带来新机遇。Ovis具备强大的图像理解和数据处理能力,可处理文本、图像等多种数据,表现出优秀综合实力。其在OpenCompass评测中获得综合排名第一,超越竞争者。Ovis采用Apache2.0开源协议,开发者可自由使用与改进。

image.png

【AiBase提要:】

🌟 Ovis是多模态大模型,处理文本和图像等多种数据,展现综合能力。

🚀 Ovis在OpenCompass评测中获得综合排名第一,超越竞争者。

🔓 Ovis采用Apache2.0开源协议,模型和代码在GitHub上公开,开发者可自由使用与改进。

2、革命性AI对话系统Moshi问世:机器也能说人话了?

在数字化时代,Kyutai实验室开发的全双工语音对话系统Moshi正在颠覆传统语音对话系统,实现更自然、更流畅的人机对话体验。Moshi结合文本语言模型、神经音频编解码器和多流音频语言模型,展现出卓越的性能表现。同时,Moshi注重安全性,确保系统不生成有害内容,保护用户隐私。这标志着人机互动方式的重大革新,展示了未来对话系统的无限可能。

【AiBase提要:】

🌟 Moshi是全双工语音对话系统,将对话视为语音到语音的生成过程,解决了传统语音对话系统的问题。

🔑 Moshi的核心技术包括Helium文本语言模型、Mimi神经音频编解码器和多流音频语言模型,实现了对话中的重叠、打断和插入语处理。

💡 Moshi具备内心独白功能,预测时间对齐文本令牌,提高语音生成质量,增强对话能力。

详情链接:https://huggingface.co/kyutai/moshiko-pytorch-bf16

3、Apple Intelligence测试版现已开放

苹果发布了 iOS18.1、iPadOS18.1和 macOS Sequoia15.1的公开测试版,其中包括即将推出的 Apple Intelligence 功能,如文本重写工具、闪亮的新 Siri 设计、用于从照片中删除对象的“清理”工具等等。用户可通过苹果的测试版软件计划网站注册以获得测试资格,并在设备设置中下载安装测试版更新。新功能仅限部分设备使用,包括 iPhone15Pro、iPhone16和 iPhone16Pro,以及配备 M1或更新芯片的 iPad 和 Mac。

image.png

【AiBase提要:】

🔧 文本重写工具、新 Siri 设计、照片清理工具等功能即将推出。

📱 仅限部分设备使用,包括 iPhone15Pro、iPhone16和 iPhone16Pro,以及配备 M1或更新芯片的 iPad 和 Mac。

📅 苹果计划于10月发布 iOS18.1、iPadOS18.1和 macOS Sequoia15.1的正式版本,用户可在正式版本发布后体验新功能。

4、机器人公司1X推出世界模型

1X Technologies推出的新生成模型在机器人系统训练中提高了效率,解决了学习"世界模型"的重要挑战。该模型能预测机器人动作对世界的影响,生成多种未来场景,预测复杂的物体互动。

image.png

【AiBase提要:】

🌟 世界模型是能够预测机器人行为与环境互动的虚拟模拟器。

🤖 通过真实数据学习,模型能够在数百万种场景中进行评估,增强了机器人智能。

💰 为推动研究,推出了1X 世界模型挑战赛,并提供奖金激励。

5、亚马逊推出一大波生成式 AI 工具,购物体验全面升级

亚马逊最近发布了一系列令人瞩目的生成式 AI 工具,旨在提升消费者和第三方卖家的购物体验。其中包括个性化产品推荐、免费 AI 视频生成工具以及聊天机器人“阿梅莉亚”,为用户和卖家带来更便捷的购物和营销体验。

image.png

【AiBase提要:】

🌟 个性化产品推荐,根据客户的搜索和购买历史提供个性化推荐。

🎥 免费 AI 视频生成工具助力卖家提升视频营销效果,满足消费者对品牌视频内容的需求。

🤖 聊天机器人“阿梅莉亚”提供个性化建议和业务分析,帮助卖家了解业务状况。

6、OpenAI将最新AI模型o1扩展到企业和教育领域

OpenAI推出最新AI模型o1-preview和o1-mini,专为处理复杂推理任务而设计,为企业和教育机构带来新的可能性。这些模型通过模拟人类思维过程,解决复杂问题,提供更严谨的思维方式。企业客户可获得巨大飞跃,将AI视为解决高风险问题的伙伴。教育领域也受益,学生和研究人员可以利用尖端AI工具解决难题。o1模型配备增强安全功能,保障客户数据安全。

【AiBase提要:】

🚀 o1-preview和o1-mini模型专为处理复杂推理任务而设计,模拟人类思维过程,解决难题。

💡 o1模型在回应之前花费更多时间处理信息,o1-preview在数学奥林匹克中解决83%问题。

💻 o1-mini模型专为编程任务设计,提供成本效益选择,适用于生成和调试复杂代码等任务。

7、OpenAI在新一轮融资据悉要求投资者至少出资2.5亿美元

OpenAI正在进行一轮巨额融资的后期谈判,其估值可能达到1500亿美元。据知情人士透露,该公司已要求投资者至少出资2.5亿美元。这表明该公司对这轮融资的需求非常迫切。

【AiBase提要:】

🔍 OpenAI估值或将达到1500亿美元

💰 投资者至少需出资2.5亿美元

🚀 新一轮融资将为OpenAI提供资金支持

8、Instagram宣布将用AI对新的青少年帐户进行年龄验证

Instagram最近宣布将通过人工智能技术对用户进行年龄验证,旨在更好地识别青少年用户,这一举措有望提升用户安全和隐私保护。

【AiBase提要:】

🌟 Instagram推出AI年龄验证,识别青少年用户。

🔒 Yoti合作验证年龄,96%虚报用户被阻止。

🚨 政府可能介入,实施强制措施如果AI效果不佳。

9、OpenAI招募机器学习工程师,开拓多智能体研究新领域

OpenAI最近宣布招募机器学习工程师,成立多智能体研究团队,旨在提升AI推理能力。新推出的o1模型需要用户适应时间,但在科学和数学领域表现出色。

【AiBase提要:】

🔍 OpenAI正在招募机器学习工程师,组建新的多智能体研究团队。

🚀 新推出的o1模型旨在提升AI的推理能力,用户需时间适应。

🏆 o1系列模型在科学和数学领域表现出色,解决复杂问题的能力显著增强。

10、英特尔AI加速器Gaudi3下周发布,挑战NVIDIA统治地位!

英特尔即将发布Gaudi3AI加速器,旨在挑战NVIDIA在AI芯片市场的统治地位。该加速器被称为AI英雄,具备高能效和快速运算能力,预计将超越NVIDIA的H100GPU。英特尔在2024年计划中稳步推进,展望2025年推出的Falcon Shores将进一步提升其在AI领域的竞争力。

【AiBase提要:】

🌟 Gaudi3加速器具备高能效和快速运算能力,预计超越NVIDIA H100GPU。

⚡️ 英特尔声称Gaudi3的能效是前代产品的两倍,将挑战NVIDIA的统治地位。

🚀 展望2025年,Falcon Shores将结合AI能力与强大GPU,增添英特尔在市场上的竞争优势。

相关话题

推荐关键词

24小时热搜

查看更多内容