站长之家 - 业界 2024-03-18 15:48

今日AI:马斯克开源模型Grok-1;不等OpenAI!国产类Sora抢先开源;iPhone很快可直接使用Gemini模型;Kimi Chat超长上下文免费用

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240318160622.png

📰🤖📢AI新鲜事

马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放

image.png

【AiBase提要:】

🚀 马斯克旗下xAI公司开源了3140亿参数的混合专家模型「Grok-1」及权重和网络架构。

🌐 Grok-1从头开始训练,没有针对任何特定应用进行微调,基于大量文本数据进行训练。

💻 xAI遵守Apache2.0许可证开源Grok-1权重和架构,GitHub已揽获3.4k星标,需足够GPU内存。

Grok-1开源地址:https://top.aibase.com/tool/grok-1

别等OpenAI了,全球首个类Sora抢先开源

image.png

【AiBase提要:】

⭐️ 国产Sora全面开源,成本仅1万美元,训练细节/模型权重公开;

⭐️ Open-Sora1.0采用Diffusion Transformer架构,结合时间注意力层;

⭐️ Open-Sora1.0并不擅长生成人像和复杂画面。

Open-Sora开源地址:https://top.aibase.com/tool/open-sora

月之暗面开放Kimi Chat200万字上下文的内测申请

image.png

【AiBase提要:】

⭐ KimiChat开放内测申请,拥有200万字上下文输入功能。

⭐ 支持量子速读和录音整理,中文处理能力强。

⭐ KimiChat是月之暗面科技推出的智能聊天机器人APP。

申请试用入口:https://top.aibase.com/tool/kimi-chat

苹果与谷歌洽谈合作 计划将Gemini模型引入iPhone

【AiBase提要:】

⭐ 苹果计划引入谷歌Gemini模型提升iPhone人工智能技术支持

⭐ 合作将为iPhone带来更智能、便捷的使用体验

⭐ 这一合作将推动人工智能在消费电子产品中的应用

英伟达洽谈收购以色列人工智能公司Run:ai

【AiBase提要:】

⭐ 英伟达正与Run:ai深入谈判,商讨收购事宜,交易价值数亿美元。

⭐ Run:ai提供针对GPU的AI优化和编排平台,支持多种ML工具和框架。

⭐ Run:ai与NVIDIA合作,为DGX系统提供服务。

Midjourney修改服务条款,信心十足迎接版权诉讼?

【AiBase提要:】

🔍 Midjourney悄悄修改服务条款,信心十足面对版权官司。

📜 作为AI模型,Midjourney坚持"合理使用"原则。

⚖️ 改变服务条款风格显示公司信心,但或将面临重创。

零一万物开放笛卡尔向量数据库搜索内核 Binary下载 免费商用

【AiBase提要:】

🔍 零一万物决定全面开放笛卡尔向量数据库搜索内核

🔍 可执行超高精度、超快速度检索,辅助大模型在RAG等方面达到更佳性能

🔍 Infra团队成员自2013年开始研究向量引擎,服务过数千万级别DAU产品应用

GitHub链接:https://github.com/01-ai/Descartes

🤖📱💼AI应用

专为Stable Diffusion1.5设计!新IPadapter模型可模仿图片构图

image.png

【AiBase提要:】

⭐ 新IPadapter模型可模仿图片构图,而不复制原图的风格和内容。

⭐比如你上传一张美女举牌的图片,它会参考这个构图,根据你的提示词生成一张构图一样但内容完全不一样的图片,比如一个帅哥举着一条鱼。

⭐该模型相比Controlnet更加灵活,可用于复制小红书、抖音等平台等爆款

模型下载地址:https://top.aibase.com/tool/ip-composition-adapter

HeyGen平替?上传一段视频argil即可完成形象+声音克隆

QQ截图20240318112810.png

【AiBase提要:】

⭐上传一段视频,等待训练完成即可完成形象+声音克隆

⭐训练完成后输入文字即可生成与视频人物一致的对口型视频

⭐argil具有快速编辑功能,比传统方法快5倍,用户可保持社交媒体活跃度。

排队地址:https://top.aibase.com/tool/argil-ai

更多精选数字人工具合集:https://qqi2gjmnk4.feishu.cn/wiki/SkLmwmNwfiQzeBkjvNkc2CBFn5g

ComfyUI图像放大插件SUPIR发布v2版本 加载速度更快了

【AiBase提要:】

⭐ SUPIRv2版本支持更广泛的硬件,模型加载更高效,内存使用优化。

⭐ 提供更多采样选项,功能更灵活,支持Lightning模型处理。

⭐ 基于SDXL img2img管道,包含ControlNet,提升图像处理速度和质量。

项目地址:https://top.aibase.com/tool/comfyui-supir

拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造

图片

【AiBase提要:】

🔹 华人研究「Drag Your GAN」,改变图片合成。

🔹 南大、腾讯联合StableDrag提高拖拽编辑稳定性和精确性。

🔹 研究者实例化了两种图像编辑模型,StableDrag-GAN和StableDrag-Diff。

项目地址:https://github.com/XingangPan/DragGAN

Unicorn Studio:一款基于WebGL的设计工具 一键给图片或视频加炫酷效果

image.png

【AiBase提要:】

🌟 用户可以利用WebGL给图片或视频加上各种炫酷的效果

🌟 利用33种强大效果,用户可创造独特效果,直接集成到网站上

🌟 可在浏览器中快速运行,通过高分辨率图像和视频导出,获得多种输出

排队地址:https://top.aibase.com/tool/unicorn-studio

机器学习工具Magi:自动为漫画生成文本 帮助视障读者更容易地阅读漫画

【AiBase提要:】

⭐️ Magi智能识别漫画页面上的面板、人物和文字块

⭐️ Magi展示了在聚类人物和关联文本方面的优越能力

⭐️ Magi开创漫画对视障读者更具可访问性的先例

产品入口:https://top.aibase.com/tool/magi

大模型“路由器”OpenRouter 一键调用GPT、Claude等多个大模型

【AiBase提要:】

⭐OpenRouter为用户提供了多样化的AI模型选择,帮助简化LLM调用过程,实现无代码网页应用的封装。

⭐OpenRouter推出了多种模型,如Claude3Haiku、Command-R和GPT-3.5Turbo,满足用户不同需求。

⭐OpenRouter还提供OpenChat,一个使用“C-RLFT”进行微调的开源语言模型库,可以实现角色扮演和创作等功能。

官网入口:https://top.aibase.com/tool/openrouter

今日Midjourney提示词:樱花树下的柯基

3_1710747333660_ai2023_Hyper-realistic_style_photography_cherry_blossoms_fallin_2dee1c3f-6f96-4e8b-bbcb-8ca78b284792.png

图源备注:图片由AI生成,图片授权服务商Midjourney

Hyper-realistic style photography, cherry blossoms falling in spring, very cute Corgi, naughty and funny, C4D rendering --ar 3:2 --s 50 --v 6.0 --style raw

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看