站长之家 - 业界 2024-03-22 16:02

今日AI:Gemini Pro1.5向所有人开放;Stable Diffusion核心团队集体离职;HeyGen5.0上线视频翻译功能;剪映内测视频翻译功能

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240322161437.png

🤖📱💼AI应用

Gemini Pro1.5及其百万上下文功能现已向所有人开放

QQ截图20240322154001.png

【AiBase提要:】

⭐ Gemini Pro1.5加入视频模态的长上下文功能,AI可以处理更复杂的视频内容。

⭐ 博主体验Gemini Pro1.5后表示,描述准确且清晰,展示强大处理能力。

⭐ Gemini Pro1.5百万上下文功能的开放将推动AI领域发展,为用户带来更丰富体验。

体验地址:https://top.aibase.com/tool/google-ai-studio

Suno正式发布V3音乐生成模型 所有人都可用

image.png

【AiBase提要:】

⭐ 音质得到显著提升,带来更清晰动听音频体验。

⭐ V3提供更丰富音乐风格选择,满足不同需求。

⭐ 用户指令响应显著改进,确保音乐结尾流畅自然。

官网地址:https://top.aibase.com/tool/suno-ai

剪映内测视频翻译功能仅限移动端体验

【AiBase提要:】

🚀剪映推出全新视频翻译功能,进一步巩固其领先地位。

📱内测仅限移动端体验,审批速度较快,可在短时间获得资格

🔒视频翻译功能仅支持用户本人视频,需声音认证。

内测申请地址:https://bytedance.larkoffice.com/share/base/form/shrcnq7rM9EEJytIW5LKyUpVaee

HeyGen发布5.0版本上线实时数字人聊天和视频翻译功能

QQ截图20240322100113.png

【AiBase提要:】

⭐全新用户界面设计,更容易找到想要使用的功能

⭐引入全新视频编辑工作室,编辑更加灵活

⭐上线实时数字人聊天功能,视频翻译等功能

产品入口:https://top.aibase.com/tool/heygen-5-0

零一万物API开放 多模态中文图表体验超越GPT-4V

【AiBase提要:】

⭐️ 零一万物API正式开放,包含三款强大模型,支持通用聊天、多文档阅读理解等功能。

⭐️ 多模态模型Yi-VL-Plus中文图表体验超越GPT-4V,支持图表识别、信息提取、问答和推理。

⭐️ Yi-34B-Chat-200K模型开放,准确率高达99.8%,用于长文本理解、小说内容总结和论文要点提取。

地址:https://platform.lingyiwanwu.com/playground

视频转视频框架AnyV2V 可修改源视频主题、风格等

QQ截图20240322150433.png

【AiBase提要:】

⭐️ 支持对源视频进行深度修改,加入文本提示、主题或风格

⭐️ 核心目标是简化视频编辑为两个步骤

⭐️ 整合各种图像编辑工具,实现新视频生成外观和动作与原视频保持一致

论文地址:https://arxiv.org/html/2403.14468v1#S6

MIT研究员推新AI图片生成框架DMD:AI 单步生成高质量图像 速度快30倍

image.png

【AiBase提要:】

⭐️ MIT研究人员开发了比传统扩散模型快30倍的单步AI图像生成器,质量仍高。

⭐️ 新方法结合了教师 - 学生模型,通过匹配蒸馏实现单步图像生成。

⭐️ 框架加速了图像生成,潜在益处涉及设计工具、药物发现和3D建模等领域。

论文网址:https://arxiv.org/abs/2311.18828

微软NaturalSpeech语音合成推出第三代 生成语音更自然了

【AiBase提要:】

⭐️ NaturalSpeech3采用属性分解扩散模型和数据/模型扩展,提高语音合成质量和自然度

⭐️ FACodec和属性分解扩散模型是NaturalSpeech3的关键技术

⭐️ NaturalSpeech3在语音质量、相似性、韵律和可懂度方面超越了现有TTS系统

论文:https://arxiv.org/abs/2403.03100

Demo 演示: https://speechresearch.github.io/naturalspeech3

📰🤖📢AI新鲜事

开源AI掌机01Light爆火,让远程操控电脑变得触手可及

image.png

【AiBase提要:】

⭐01Light能够识别屏幕内容学习用户习惯,提供个性化需求满足。

⭐ 用户按下按钮讲话,01Light思考回应需求,实现远程语音控制电脑操作。

⭐ 完全开源的01Light能提高工作效率,节省时间,随时随地操控电脑。

官网:https://top.aibase.com/tool/01-light

项目地址:https://github.com/OpenInterpreter/01

Stable Diffusion核心团队集体离职 AI巨头Stability AI面临财务危机

【AiBase提要:】

⭐️ Stable Diffusion核心团队集体离职,引发科技界广泛关注。

⭐️ Stability AI可能因财务困境挑战,团队领导离职名单中。

⭐️ Stable Diffusion项目开源成功,但给公司商业模式带来挑战。

百度5款大模型上新,更小更便宜!还可1分钟零代码打造Agent应用

image.png

【AiBase提要】

⭐ 做一个“英语作文批改小帮手”应用,只需在AppBuilder中输入应用名称或功能,平台即可生成应用。

⭐ 百度推出5款大模型,轻量化、性价比更高,适用于各种场景下的Agent应用。

⭐ 千帆AppBuilder升级,支持一键分发到多个主流渠道,加入新的基础组件如向量数据库VDB1.0。

产品入口:https://top.aibase.com/tool/baiduzhinengyunqianfanappbuilder

微软将以6.5亿美元收购Inflection AI 获得后者大模型的使用权

【AiBase提要:】

⭐ 微软同意支付6.5亿美元收购Inflection AI,获取大模型使用权。

⭐ 微软将雇佣Inflection AI大部分员工,包括联合创始人。

⭐ Inflection-2.5是Inflection最新人工智能模型,性能接近GPT-4。

中国首部AI全流程微短剧《中国神话》启播 央视频AI频道上线

【AiBase提要:】

🎬 央视频推出全流程AI微短剧《中国神话》,六集展现经典神话故事。

📺 央视频AI频道正式上线,推动视听产业创新升级。

🤖 AI技术应用助力央视频推动中国传媒业发展。

月入25万,批量AI美女,收割中年男人的钱包

图片

【AiBase提要:】

⭐ 中年男人愿意花钱,AI美女们抓住了这一商机。

⭐ AI美女主播以低单价产品吸引中老年男性用户,通过带货视频获利丰厚,受欢迎程度高。

⭐ AI带货产业链庞大,但也存在虚假宣传和维权问题。

案例:https://www.chinaz.com/2024/0322/1605183.shtml

————

今日Midjourney提示词:淘宝服装模特

2_1711094141451_ai2023_A_beautiful_Chinese_female_model_wearing_round_framed_gl_d73a8207-946d-4c83-9eb6-648463f7d7b5.png

图源备注:图片由AI生成,图片授权服务商Midjourney

A beautiful Chinese female model wearing round framed glasses, with a delicate Asian face, wearing a light gray linen short sleeved shirt and Short pants, Japanese style shirt ,hands in pockets, front view, and a beige background,full bodyshot, Studio lighting, soho, shot on Canon EOS5D Mark IV ,8k --ar3:4--v6.0

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看