站长之家 - 业界 2024-07-05 14:57

AI日报:百度文心4.0免费开放;AI lab开源超强多模态大模型;对标GPT-4o!商汤发布日日新5o

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、百度文心智能体平台免费开放文心4.0版本

百度文心智能体平台最新推出的文心大模型4.0版本免费开放给公众使用,极大地扩展了平台的功能和应用范围。该版本在理解力、生成力、逻辑推理和记忆能力等方面取得显著进步,综合能力与GPT-4相媲美。百度创始人李彦宏在世界人工智能大会上强调智能体作为AI应用的前景,认为搜索是智能体分发的关键渠道。文心智能体平台的零代码开发模式降低了普通用户开发智能体的难度,为开发者提供了易于开发、易于分发、易于盈利的优势。

image.png

【AiBase提要:】

🚀 文心大模型4.0版本免费开放给开发者使用,功能和应用范围大幅扩展。

💡 文心4.0版本在理解力、生成力、逻辑推理和记忆能力等方面取得显著进步,与GPT-4相媲美。

💻 文心智能体平台提供零代码开发模式,降低了普通用户开发智能体的难度,为开发者提供了易于开发、易于分发、易于盈利的优势。

详情链接:https://top.aibase.com/tool/wenxinzhinengtipingtai-agentbuilder

2、Meta 发布 AI 重磅炸弹:多标记预测模型现已开放研究

Meta 迈出了重要一步,发布了采用多标记预测方法的预训练模型,可能改变大型语言模型的开发和部署方式。这种新技术有望提高人工智能效率,加速人机协作编码的趋势,对语言理解和上下文产生更细致的影响。

【AiBase提要:】

🚀 新技术采用多标记预测方法,有望提高性能并缩短训练时间。

💡 模型同时预测多个未来单词,可能改善语言结构和上下文理解。

🔗 Meta 在Hugging Face上发布模型,加速创新和人才获取,助力人工智能领域竞争。

详情链接:https://top.aibase.com/tool/multi-token-prediction

3、商汤科技发布“日日新5o”:对标GPT-4o 实现实时流式多模态交互

商汤科技在2024年世界人工智能大会上发布了国内首个所见即所得模型“日日新5o”,实现了实时的流式多模态交互,与GPT-4o相当。该模型整合声音、文本、图像和视频等跨模态信息,能够进行实时的理解和响应。

image.png

【AiBase提要:】

🚀 “日日新5o”模型实现了实时的流式多模态交互,能够识别胸卡、描述小狗玩偶外观、对图画进行评价。

💡 “日日新5.5”是“日日新5.0”的升级版,综合性能提升30%,特别在数学推理、英文能力和指令跟随方面有显著提升。

🔑 商汤推出“大模型0元Go”计划,为企业用户提供免费服务、赠送Tokens包、提供搬家顾问帮助用户迁移,实现零服务成本。

4、上海AI lab开源超强多模态LLM InternLM-XComposer-2.5

昨天,上海AI实验室开源了一款名为InternLM-XComposer-2.5的多模态大型语言模型,展现出在超高分辨率图像理解、细粒度视频理解和多轮图像对话等方面的超凡能力。该模型对网页制作和图文混排文章进行了特别优化,填补了国内多模态LLM领域的空白,为创作者提供了更大的创作空间。

【AiBase提要:】

⚙️ 长上下文处理: IXC-2.5支持处理超长文本和图像输入,原生支持24K标记的输入并可扩展到96K,为用户提供更大的创作空间。

👁️ 多样化视觉能力: IXC-2.5不仅支持超高分辨率的图像理解,还能进行细粒度的视频理解和多轮多图对话,展现出难以想象的能力。

✨ 生成能力: IXC-2.5能够生成网页和高质量的图文文章,将文本和图像的结合提升到一个新的高度。

项目地址:https://top.aibase.com/tool/internlm-xcomposer-2-5

完整内容点此查看:https://www.aibase.com/news/10053

5、斯坦福大学出品!OccFusion:可完整渲染出被遮挡的人体

OccFusion是斯坦福大学提出的新方法,旨在实现遮挡人体的高保真度渲染。该方法经过三个阶段的处理,利用高效的3D高斯分片和2D扩散模型监督实现,在评估中表现出色,达到了遮挡人体渲染的最新水平。

image.png

【AiBase提要:】

🌟 OccFusion是一种新方法,旨在实现遮挡人体的高保真度渲染。

🌟 该方法包括三个阶段:初始化、优化和细化,通过高效的3D高斯分片和2D扩散模型监督实现。

🌟 在ZJU-MoCap和OcMotion序列上评估,OccFusion表现出色,达到了遮挡人体渲染的最新水平。

详情链接:https://top.aibase.com/tool/occfusion

6、苹果开放4M模型演示 轻松拆解图片所有信息

苹果公司在Hugging Face上放出了一颗重磅炸弹,开放了去年的论文4M模型的演示。这一模型能够处理和生成多种模态内容,包括文本、图像和3D场景。通过上传一张照片,用户可以轻松获得照片的所有信息,如主要轮廓、色调和尺寸等。苹果展示了强大的AI实力,并希望围绕4M构建生态系统,但也面临数据实践和AI伦理挑战。

QQ截图20240705100442.jpg

【AiBase提要:】

🔍 4M模型能处理和生成多种模态内容,包括文本、图像和3D场景。

🛠️ 4M采用"大规模多模态屏蔽建模"训练方法,实现模态间的无缝对接。

💡 4M使用全球最大的开源数据集CC12M,采用弱监督伪标签的方法,证明自身能直接执行多模态任务。

详情链接:https://huggingface.co/spaces/EPFL-VILAB/4M

7、中国生成式AI专利数量超过美国 6 倍

中国在生成式AI领域取得了巨大成就,专利数量超过美国6倍,展现出强大的创新实力和领先地位。腾讯、平安保险集团和百度等中国公司在GenAI专利数量上表现突出。中国的顶级学术机构和技术生态为生成式AI的发展提供了有力支持,获得学术界和媒体的认可。

image.png

【AiBase提要:】

🔸 中国在2014年至2023年期间申请的生成式AI专利数量达到38210个,超过了美国的6倍。

🔸 腾讯、平安保险集团和百度是GenAI专利数量最多的中国公司。

🔸 中国的顶级学术机构和技术生态为生成式AI的发展提供了强大支持,中国在该领域的领先地位得到了学术界和媒体的认可。

详情链接:https://www.wipo.int/web-publications/patent-landscape-report-generative-artificial-intelligence-genai/index.html

8、魔法般的LivePortrait:将照片变为生动视频,精准操控眼睛和嘴唇动作!

LivePortrait是一项黑科技,让静态照片动起来,突破传统动画制作难题,高效精确。它能生成逼真的动画,控制眼睛和嘴唇动作,提升用户创意空间。让照片活起来,讲述自己的故事。

【AiBase提要:】

🎨 LivePortrait让静态照片变为流畅动态视频,颠覆传统动画制作,处理多人物肖像无缝拼接,自然流畅。

⚡ LivePortrait解决传统动画制作难题,高质量高效率,精确控制眼睛和嘴唇动作,微表情逼真。

🔗 LivePortrait采用先进技术方法,生成速度快,支持多风格肖像,提供更多创意空间。

详情链接:https://top.aibase.com/tool/liveportrait

9、WAIC 开幕日精彩集锦丨AI 界大佬们都分享了哪些观点?

7月4日在上海举办的2024年世界人工智能大会暨人工智能全球治理高级别会议上,AI行业专家们就AI的发展方向和应用落地展开深入讨论。会议反映出AI行业正向实际应用转变,关注如何让AI技术产生实际价值。同时,AI安全与伦理问题、产业变革与机遇也成为讨论焦点。

【AiBase提要:】

🔍 AI应用落地成为关注焦点,重点转向实际应用,如何让AI技术产生实际价值成为关注焦点。

🚀 AI发展重点转向实际应用,商汤科技CEO强调应用是推动AI进入"超级时刻"的关键,突破需要高质量数据、流畅交互和可控性。

⚖️ AI安全与伦理问题受到重视,AI风险主要来自网络风险扩大、社会结构颠覆和存在风险,需要平衡控制AI和发挥潜力。

10、科幻小说照进现实?Clone Robotics:一个制造类似西部世界仿生机器人的公司

Clone Robotics是一家制造仿生机器人的公司,通过仿生设计和生物力学原理推动技术发展,产品具有高度仿真、耐用性和经济性。他们的核心产品包括Clone Hand和Clone Torso,能执行各种复杂操作任务,提供广泛的应用场景。公司代表了人类与机器人和谐共存的未来生活方式。

【AiBase提要:】

🤖 Clone Robotics是一家制造仿生机器人的公司,产品具有高度仿真、耐用性和经济性。

🌐 核心产品包括Clone Hand和Clone Torso,能执行各种复杂操作任务,提供广泛的应用场景。

🔗 公司代表了人类与机器人和谐共存的未来生活方式。

详情链接:https://top.aibase.com/tool/clone-incorporated

11、好莱坞视觉特效提供商获得2亿美元投资

DNEG集团成功获得来自阿布扎比投资者的2亿美元战略投资,将加速AI创作者工具的开发,估值超过20亿美元。这一投资有望降低电影制作成本,推动中东地区内容生产生态系统的发展。

【AiBase提要:】

🌟 DNEG集团获得2亿美元战略投资,加速AI创作者工具的开发,估值超过20亿美元。

🌟 电影制作成本不断攀升,AI CGI工具有望帮助降低成本,创造更逼真的效果。

🌟 投资将促使DNEG集团在阿布扎比设立办公室和视觉体验中心,推动中东地区内容生产生态系统的发展。

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看