欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
📰🤖📢AI新鲜事
马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放
【AiBase提要:】
🚀 马斯克旗下xAI公司开源了3140亿参数的混合专家模型「Grok-1」及权重和网络架构。
🌐 Grok-1从头开始训练,没有针对任何特定应用进行微调,基于大量文本数据进行训练。
💻 xAI遵守Apache2.0许可证开源Grok-1权重和架构,GitHub已揽获3.4k星标,需足够GPU内存。
Grok-1开源地址:https://top.aibase.com/tool/grok-1
别等OpenAI了,全球首个类Sora抢先开源
【AiBase提要:】
⭐️ 国产Sora全面开源,成本仅1万美元,训练细节/模型权重公开;
⭐️ Open-Sora1.0采用Diffusion Transformer架构,结合时间注意力层;
⭐️ Open-Sora1.0并不擅长生成人像和复杂画面。
Open-Sora开源地址:https://top.aibase.com/tool/open-sora
月之暗面开放Kimi Chat200万字上下文的内测申请
【AiBase提要:】
⭐ KimiChat开放内测申请,拥有200万字上下文输入功能。
⭐ 支持量子速读和录音整理,中文处理能力强。
⭐ KimiChat是月之暗面科技推出的智能聊天机器人APP。
苹果与谷歌洽谈合作 计划将Gemini模型引入iPhone
【AiBase提要:】
⭐ 苹果计划引入谷歌Gemini模型提升iPhone人工智能技术支持
⭐ 合作将为iPhone带来更智能、便捷的使用体验
⭐ 这一合作将推动人工智能在消费电子产品中的应用
英伟达洽谈收购以色列人工智能公司Run:ai
【AiBase提要:】
⭐ 英伟达正与Run:ai深入谈判,商讨收购事宜,交易价值数亿美元。
⭐ Run:ai提供针对GPU的AI优化和编排平台,支持多种ML工具和框架。
⭐ Run:ai与NVIDIA合作,为DGX系统提供服务。
Midjourney修改服务条款,信心十足迎接版权诉讼?
【AiBase提要:】
🔍 Midjourney悄悄修改服务条款,信心十足面对版权官司。
📜 作为AI模型,Midjourney坚持"合理使用"原则。
⚖️ 改变服务条款风格显示公司信心,但或将面临重创。
零一万物开放笛卡尔向量数据库搜索内核 Binary下载 免费商用
【AiBase提要:】
🔍 零一万物决定全面开放笛卡尔向量数据库搜索内核
🔍 可执行超高精度、超快速度检索,辅助大模型在RAG等方面达到更佳性能
🔍 Infra团队成员自2013年开始研究向量引擎,服务过数千万级别DAU产品应用
GitHub链接:https://github.com/01-ai/Descartes
🤖📱💼AI应用
专为Stable Diffusion1.5设计!新IPadapter模型可模仿图片构图
【AiBase提要:】
⭐ 新IPadapter模型可模仿图片构图,而不复制原图的风格和内容。
⭐比如你上传一张美女举牌的图片,它会参考这个构图,根据你的提示词生成一张构图一样但内容完全不一样的图片,比如一个帅哥举着一条鱼。
⭐该模型相比Controlnet更加灵活,可用于复制小红书、抖音等平台等爆款
HeyGen平替?上传一段视频argil即可完成形象+声音克隆
【AiBase提要:】
⭐上传一段视频,等待训练完成即可完成形象+声音克隆
⭐训练完成后输入文字即可生成与视频人物一致的对口型视频
⭐argil具有快速编辑功能,比传统方法快5倍,用户可保持社交媒体活跃度。
排队地址:https://top.aibase.com/tool/argil-ai
更多精选数字人工具合集:https://qqi2gjmnk4.feishu.cn/wiki/SkLmwmNwfiQzeBkjvNkc2CBFn5g
ComfyUI图像放大插件SUPIR发布v2版本 加载速度更快了
【AiBase提要:】
⭐ SUPIRv2版本支持更广泛的硬件,模型加载更高效,内存使用优化。
⭐ 提供更多采样选项,功能更灵活,支持Lightning模型处理。
⭐ 基于SDXL img2img管道,包含ControlNet,提升图像处理速度和质量。
拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
【AiBase提要:】
🔹 华人研究「Drag Your GAN」,改变图片合成。
🔹 南大、腾讯联合StableDrag提高拖拽编辑稳定性和精确性。
🔹 研究者实例化了两种图像编辑模型,StableDrag-GAN和StableDrag-Diff。
Unicorn Studio:一款基于WebGL的设计工具 一键给图片或视频加炫酷效果
【AiBase提要:】
🌟 用户可以利用WebGL给图片或视频加上各种炫酷的效果
🌟 利用33种强大效果,用户可创造独特效果,直接集成到网站上
🌟 可在浏览器中快速运行,通过高分辨率图像和视频导出,获得多种输出
机器学习工具Magi:自动为漫画生成文本 帮助视障读者更容易地阅读漫画
【AiBase提要:】
⭐️ Magi智能识别漫画页面上的面板、人物和文字块
⭐️ Magi展示了在聚类人物和关联文本方面的优越能力
⭐️ Magi开创漫画对视障读者更具可访问性的先例
大模型“路由器”OpenRouter 一键调用GPT、Claude等多个大模型
【AiBase提要:】
⭐OpenRouter为用户提供了多样化的AI模型选择,帮助简化LLM调用过程,实现无代码网页应用的封装。
⭐OpenRouter推出了多种模型,如Claude3Haiku、Command-R和GPT-3.5Turbo,满足用户不同需求。
⭐OpenRouter还提供OpenChat,一个使用“C-RLFT”进行微调的开源语言模型库,可以实现角色扮演和创作等功能。
今日Midjourney提示词:樱花树下的柯基
图源备注:图片由AI生成,图片授权服务商Midjourney
Hyper-realistic style photography, cherry blossoms falling in spring, very cute Corgi, naughty and funny, C4D rendering --ar 3:2 --s 50 --v 6.0 --style raw