🤖📈💻💡大模型动态
百川智能发布Baichuan2-192K大模型,可处理35万汉字
百川智能发布了Baichuan2-192K大模型,拥有全球最长的上下文窗口,处理约35万个汉字,超越了Claude2。
百川大模型官网:https://top.aibase.com/tool/baichuandamoxing
【AiBase提要】
🚀 Baichuan2-192K大模型发布,处理长文本、问答等多项任务。
📊 超越Claude2,上下文窗口长度超过4.4倍。
🌐 内测中,合作伙伴包括法律、媒体、金融等领域,全面开放不久。
昆仑万维开源百亿级大语言模型「天工」Skywork-13B 系列
昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,提供超大规模中文数据集,包括两个模型,以支持大模型的商用应用和降低商业门槛。
【AiBase提要】
📚 昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列。
🌐 提供超大规模的高质量中文数据集,包括两个模型: Skywork-13B-Base 和 Skywork-13B-Math。
💼 大模型即将全面开放商用,为应用和开源社区发展提供技术支持,降低商业门槛。
📰🤖📢AI新鲜事
DALL·E3更新,新增种子功能允许用户精修生成图片
OpenAI悄悄更新了DALL·E3,增加了一种种子功能,允许用户精细编辑生成的图像,包括添加元素、改变视角和调整光线和颜色。
【AiBase提要:】
🌱 OpenAI推出DALL·E3的新种子功能,用户可以通过特定种子修改生成的图像。
🎨 用户可以在生成的图像中添加元素、更改颜色等操作,类似于Photoshop。
🚀 这一功能似乎是最近才更新的,展示了OpenAI不断努力改进DALL·E3的愿望。
ChatGPT Plus会员可上传和分析文件,实现多模态支持
ChatGPT Plus会员在最新测试版中可上传和分析文件,不再需要手动切换模式,同时引入多模态支持,提供更多应用场景。
【AiBase提要:】
📌 ChatGPT Plus会员无需手动模式切换,可以上传和分析文件。
📌 新功能将ChatGPT Enterprise计划的办公功能引入了独立的个人聊天机器人订阅。
📌 ChatGPT不仅限于文本文件,还可以处理多媒体内容,如图片生成。
谷歌Bard升级,实时生成回复不用等待
谷歌的聊天机器人Bard升级,提供更快速的实时回复选项,改进了用户的互动体验,同时允许用户自定义回答风格。
【AiBase提要:】
🚀 谷歌Bard升级,提供更快速的实时回复选项,减少用户等待时间。
🔁 用户可以选择实时回答或完成后回答的选项,提高互动体验。
🖋️ 用户还可以自定义回答风格,使Bard的回复更符合他们的口味。
英国皇家天文学家称外星生命可能是超级智能AI
英国的皇家天文学家警告,外星生命可能是高度智能的AI,而非有机生命,这与人工智能时代的来临有关。
【AiBase提要】
🚀 英国皇家天文学家警告,外星生命可能比预期更智能。
🤖 外星生命可能是非有机智能,与宇宙中缺乏与人类相似生命有关。
🌌 探测AI外星生命可能困难,因为它们可能不依赖达尔文选择进化。
谷歌向AI初创公司Anthropic投资20亿美元
谷歌投资20亿美元巩固在人工智能领域的地位,与Anthropic建立战略伙伴关系,加速AI创新,竞争激烈,亚马逊等巨头也重大投资。
【AiBase提要:】
💰 谷歌向Anthropic投资20亿美元,强化在人工智能领域的地位,推动行业变革。
🤝 谷歌的投资不仅是财务支持,还是战略合作,旨在加速Anthropic的人工智能创新,同时增强Google Cloud在AI领域的地位。
🌟 亚马逊也对Anthropic进行40亿美元的重大投资,加剧人工智能领域的竞争,科技巨头竞相投资以确保领先地位。
🤖📱💼AI应用
阿里云通义千问APP上线,支持创意文案等功能
阿里云旗下通义千问APP正式上线,提供创意文案、办公助理、学习助手和趣味生活等多种核心功能。
AiBase提要:
1. 🚀 阿里云通义千问APP正式上线,拥有多种核心功能,包括文案创作、办公助理、学习助手和趣味生活支持。
2. 📅 该APP中的通义千问大模型已通过备案,允许广大用户登录官网进行体验。
3. 🌐 阿里云的通义千问APP将帮助用户更智能、更便捷地满足多方面需求,包括文案创作、学习助手等。
图库巨头Getty Images拥抱AI技术 推出生成式AI服务
Getty Images采取双重策略,起诉侵权AI图像生成公司,并推出名为“Generative AI”的新服务,以为商业客户提供AI图像生成,避免知识产权风险。
【AiBase提要:】
📸 Getty Images采取法律行动起诉侵权AI图像生成公司,捍卫知识产权。
🔧 推出“Generative AI”服务,与Nvidia合作,为商业客户提供商业可行的AI图像生成,避免知识产权风险。
📷 AI生成的内容不会被添加到Getty Images的图像库,以保持图像库的权威性和可信度。
3D产品预览应用React Native3d Store 线上购物更立体了
React Native3d Store是一款先进的React Native应用,通过沉浸式3D预览展示产品,提供互动购物体验,利用现代技术如three.js、react-three-fiber、expo-gl等,使用户能旋转、缩放和平移3D模型,提升在线购物的互动性。
项目地址:https://github.com/alexandrius/react-native_3d_store
【AiBase提要:】
😎 React Native3d Store是一先进的React Native应用,提供沉浸式3D产品预览和互动购物体验。
😎 应用采用现代技术,包括three.js、react-three-fiber,使3D模型更逼真,用户可探索产品细节。
😎 兼容最新Expo版本,致力于提供最佳的3D购物体验,彻底改变了在线购物方式。
GPT Pilot:AI驱动的开发工具,可从零开始编写可扩展的应用程序
GPT Pilot是一款AI驱动的工具,能从开发人员提供的应用描述中生成可扩展的应用程序代码,支持需求澄清、技术选择、任务拆解、代码实现以及持续审核与修复。
项目地址:https://github.com/Pythagora-io/gpt-pilot
【AiBase提要:】
🤖 GPT Pilot是AI驱动的开发工具,能根据应用描述生成应用程序代码。
🤖 它协助开发者明确应用需求、选择技术栈、拆解任务、生成代码,实现高效开发。
🤖 GPT Pilot支持任务持续迭代和修复,促进开发者与AI的合作,代表未来应用开发的新方向。
👨💻💡🎯聚焦开发者
首个人体动捕基模型SMPLer-X面世
SMPLer-X是首个人体动捕基模型,通过训练450万实例,实现了人体全身姿态与体型估计,同时能捕捉身体和面部动作,对数据缩放和模型缩放进行了探索,在学术数据集上表现出强大性能。
项目地址:https://caizhongang.github.io/projects/SMPLer-X/
【AiBase提要:】
1. 首次提出了动捕大模型SMPLer-X,用来进行人体全身姿态与体型估计,成功刷新了七个关键榜单。
2. SMPLer-X不仅能够捕捉身体动作,还可以输出面部和手部动作,并估计体型。
3. 研究探索了数据缩放与模型缩放,对32个学术数据集进行排名,展示了在各种测试和榜单中的强大性能。
苹果研究人员推出Ferret:多模态语言模型突破性进展
苹果与哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型,解决了地理信息和语义知识融合问题,实现了引用和定位图像中元素的能力,性能优于传统模型。
AiBase提要:
1. 苹果的Ferret模型解决了地理信息和语义知识融合问题,使其能够引用和定位图像元素。
2. Ferret采用多模态大语言模型(MLLM),处理自由文本和引用区域,性能优于传统模型。
3. 研究人员创建了GRIT数据集,评估Ferret在引用描述、引用推理和对话中的定位任务上表现出卓越性能,性能平均优于其他MLLM模型20.4%。
Monarch Mixer(M2):比Transformer更低成本的模型架构
Monarch Mixer(M2)是一种新的模型架构,通过采用Monarch矩阵替代传统Transformer的注意力和MLP,实现更低成本取得更优的性能,挑战了传统Transformer的优越性。
论文地址:https://arxiv.org/abs/2310.12109
代码地址:https://github.com/HazyResearch/m2
【AiBase提要】
🌟 Monarch Mixer(M2)采用Monarch矩阵替代注意力和MLP,降低了成本,在多任务上媲美传统Transformer。
🌟 具备次二次复杂度,处理更长序列和高维度表征,同时保持计算效率。
🌟 M2不仅节省参数,还具有更高的硬件效率,是潜在的传统Transformer替代选择。
多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生
中科大研究提出“啄木鸟”框架,可降低多模态大模型的“幻觉”问题,提高准确性,无需重训,为解决大模型问题提供了新方法。
项目地址:https://github.com/BradyFU/Woodpecker
【AiBase提要:】
😎 “啄木鸟”框架是一种免重训、即插即用的通用架构,通过诊断并纠正多模态大模型的“幻觉”问题,提高准确性。
😎 这一方法包括关键概念提取、问题构造、视觉验证、视觉断言生成,以及幻觉纠正,无需特定数据微调或重新训练模型。
😎 在实验中,“啄木鸟”成功降低了多模态大模型的“幻觉”,提高了答案的准确性,为解决大模型问题提供了有效工具。
ChatGPT源码推荐:小狐狸ChatGPT付费创作系统完全开源源码