AI日报：Runway Gen 3可生成3D巨幅字幕效果；Google Vids 上线测试；百度网盘推宝宝AI长相预测；Luma AI推首尾帧视频生成

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://top.aibase.com/

1、炸裂！Runway Gen 3可以生成电影片头3D巨幅字幕效果了

Runway最新推出的Gen-3Alpha视频生成模型在保真度、一致性和动作表现方面有重大改进，不仅生成稳定光影，还展现强大想象力。内测博主展示了3D巨幅字幕效果，Gen3即将对所有人开放使用。模型精细控制运动，审美强大，想象力丰富，符合物理规律，生成速度快。

【AiBase提要:】
⚙️ Runway Gen3 可模仿漫威电影片头效果制作3D巨幅字幕效果
💡 极度稳定的光影效果，保持高质量输出，即使在高速移动场景中
🎥 控制模式包括 Motion Brush、高级摄像头控制、导演模式，生成速度快，审美强大
详情链接:https://top.aibase.com/tool/gen-3-alpha

2、百度网盘一刻相册App推出宝宝AI长相预测功能

百度网盘一刻相册App推出了AI长相预测功能，用户上传照片即可预测宝宝未来样子，训练数据贴合中国宝宝特征，操作简单快速。未来将开发更多实用AI功能，征集用户意见。

【AiBase提要:】
👶 预测宝宝未来样子，训练数据贴合中国宝宝特征，操作简单快速。
📸 上传照片即可得到高清预测图像，提供多种时尚滤镜效果供选择。
🔮 未来将开发更多实用AI功能，如预测孩子不同成长阶段的样子，征集用户意见。

3、谷歌推出AI视频编辑应用Google Vids 上线测试

谷歌最新推出的AI视频编辑应用Google Vids在测试中展现出强大的功能和用户友好的特点，为用户提供了高效、便捷的视频编辑工具。该应用集成Gemini大模型，帮助用户轻松创建视频内容，降低了视频制作门槛，未来有望成为视频创作者的得力助手。

【AiBase提要:】
✨ Google Vids集成Gemini大模型，可帮助用户创建幻灯片、编写视频脚本，并制作分镜头脚本。
🎥 用户通过添加或删除元素来编辑视频，最终导出为MP4文件，入口位于Google Docs文档处理工具中。
🚀 Google Vids的上线测试丰富了Google Workspace套件，展示强大的AI技术能力，为用户提供便捷的视频编辑工具。

4、Luma AI新功能：首尾帧生成视频与向后延长5秒

Luma AI推出了新功能，让视频创作充满无限可能，虽然偶尔会有硬切换画面，但这正是剪辑的魅力所在，让每一秒充满惊喜和创意。未来的视频生成将基于这种延长操作完成，实现智能个性化的视频创作。

【AiBase提要:】
✨ 视频延长魔法：首尾帧生成视频能力，向后延长5秒，让每一帧充满无限可能
💡 创新视频功能“Extend”：智能分析视频内容，保持原有风格和对象一致性的基础上延长视频长度
🌟 Dream Machine模型发布：支持文本和图片输入，生成高质量视频，模拟现实物理特性，免费开放体验
详情链接:https://top.aibase.com/tool/dream-machine

5、全新Solos AirGo Vision智能眼镜发布

Solos公司在香港智能眼镜峰会上发布了全新的Solos AirGo Vision智能眼镜，集成了ChatGPT-4o的可穿戴AI大脑，让用户的双眼瞬间升级为超能力。这款智能眼镜不仅支持实时问答和视觉提示，还具备多语言翻译功能，模块化设计，售价为249美元。

【AiBase提要:】
⭐ 集成 ChatGPT-4o 的多模态 AI 功能，支持实时问答和视觉提示
⭐ 支持超过10种语言的实时翻译，轻松打破语言障碍
⭐ 模块化设计，可替换不同样式的传统框架，售价为249美元

6、商汤如影AI视频生成平台推出央视记者王冰冰AI数字人

商汤科技的AI数字人“AI冰冰”在《2024中国・AI 盛典》中首次亮相，展现了出色的多语言能力和逼真的视觉效果。数字人技术在传媒行业具有巨大潜力，能够拉近人物IP与受众之间的距离。

【AiBase提要:】
✨ 商汤科技创造的AI数字人“AI冰冰”在舞台上展现出专业且自然的表现，得益于SenseNova大模型技术。
🌐 如影平台的AI视频生成技术实现了高清复制和自然的表情、嘴型、动作效果，展示出卓越的语言能力。
🔥 商汤如影提供强大的核心技术支持，使AI冰冰能够展现逼真的视觉效果和流畅的多语种表达能力。

7、知乎宣布推出独立AI搜索平台「知乎直答」

知乎最近推出了全新AI产品「知乎直答」，旨在提升问答效率和质量，缩短用户与优质回答之间的距离，增强社区创作者内容的流通。这一举措预示着问答社区将进入更智能和个性化的新时代。

QQ截图20240701090057.png

【AiBase提要:】
🚀 知乎直答是基于知乎丰富问答数据开发的AI产品，提供简略和深入两种答案生成方式，支持用户快速找到所需内容或专家。
💡 产品定位为生产力工具和发现世界的连接器，帮助用户通过提问来探索世界的能力。
🔮 未来计划推出App版本，引入多模态能力，与知乎社区深度融合，探索对外合作，为整个问答领域带来新的发展方向。
详情链接:https://zhida.zhihu.com/

8、WhatsApp最新Android测试版2.24.14.7推出选择Meta AI Llama模型功能

WhatsApp最新测试版引入了选择Meta AI Llama模型的功能，用户可以根据需求自定义AI交互体验，体验更快速简单的回应或处理更复杂的查询。该功能展示了WhatsApp在AI领域持续创新的决心。

【AiBase提要:】
🔍 WhatsApp最新Android测试版2.24.14.7通过Google Play Beta计划推出选择Meta AI Llama模型功能。
🧠 用户可以选择默认的Llama3-70B模型获得更快速简单的回应，或选择高级的Llama3-405B模型处理更复杂的查询。
📈 WhatsApp计划提供更先进的Llama3-405B模型预览版，每周有使用次数限制，达到限制后用户将回到默认模型继续对话。

9、苹果可能在今年秋季宣布与谷歌 Gemini 的交易

苹果计划在今年秋季推出与谷歌 Gemini 的整合交易以及测试版的 Apple Intelligence，将人工智能作为直接盈利途径。第三方AI服务可能成为苹果的过渡选择，同时苹果将逐步推出自己的生成式AI系统。

【AiBase提要:】
🍎 苹果计划整合谷歌 Gemini 到设备中，推出测试版的 Apple Intelligence。
💡 苹果将人工智能作为直接盈利途径，不仅仅是推动硬件销售的功能。
🤖 第三方AI服务可能成为苹果的过渡选择，同时苹果将逐步推出自己的生成式AI系统。

10、GPTPdf：使用类似GPT-4o的多模态LLM分析PDF文件

近日，一款名为gptpdf的开源项目在github赞火，使用了类似 GPT-4o 的 VLLM 模型解析 PDF 文件并转换为 Markdown 格式。该项目代码简洁高效，只有293行，却能完美解析排版、数学公式、表格、图片、图表等各种内容。费用每页平均成本为0.013美元。

【AiBase提要:】
🔍 使用类似 GPT-4o 多模态模型解析 PDF 文件，转换为 Markdown 格式。
💻 代码简洁高效，仅293行。
🌟 解析结果几乎完美包括排版、数学公式、表格、图片、图表等内容。
详情链接:https://top.aibase.com/tool/gptpdf

11、AI音频魔法师Resona V2A 可自动为视频配音效

在AI技术大行其道的时代，Resona V2A技术横空出世，像一位神奇的魔术师，让视频自动开口，唱出属于自己的旋律。这不仅是技术突破，更是创意者的福音。Resona V2A一键生成音频，快速高效，创意者得力助手。高性价比，成本降低99%，提供高质量音频解决方案。

【AiBase提要:】
🔮 视频自动开口，唱出属于自己的旋律，技术突破与创意者福音。
⚙️ 一键生成音频，快速高效，加快音频生成速度，创意者投入更多时间和精力到视频创意设计。
💰 成本降低99%，高性价比的音频解决方案，满足不同用户需求。
详情链接:https://top.aibase.com/tool/resona-v2a

12、AI换装黑科技 MMTryon虚拟试穿框架可按需搭配一键叠穿

中山大学和字节智创数字人团队联合推出的MMTryon虚拟试穿框架颠覆了传统换装方式，实现一键生成模特试穿效果，质量高且操作简便。其服装编码器和多模态多参考注意机制让换装更精确灵活，打破了传统算法束缚，获得新SOTA。MMTryon不仅可试穿单件服装，还支持组合换装，无需分割，通过文本指令即可实现高质量虚拟换装。

【AiBase提要:】
👗 一键生成模特试穿效果，质量高且操作简便
🔥 打破传统算法束缚，获得新SOTA，支持组合换装
💡 利用服装编码器和多模态多参考注意机制，换装更精确灵活
详情链接:https://arxiv.org/abs/2405.00448

ChatGPT源码推荐：小狐狸ChatGPT付费创作系统完全开源源码

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

AI日报：Runway Gen 3可生成3D巨幅字幕效果；Google Vids 上线测试；百度网盘推宝宝AI长相预测；Luma AI推首尾帧视频生成

推荐关键词

24小时热搜

大家正在看

突发！Runway的Gen-3向所有人开放，媲美Sora！

AI玩法又升级！X博主通过Runway“穿越”《模拟人生》

Runway正式发布全新Gen3模型，AI视频的王，它回来了。

我测了12个小时的RunwayGen3，发现这就是AI视频的No.1

Gen-3 Alpha功能介绍及免费使用指南 Runway最新AI生成视频体验地址入口

Gen-3 Alpha有哪些功能免费吗？Runway视频生成AI模型怎么使用方法详细教程指南

Gen-3 Alpha完全指南：Runway AI视频生成模型使用方法教程与免费体验地址入口

AI日报：新王诞生！Runway重磅发布Gen-3 Alpha；Luma AI发布Extend功能；DeepSeek又开源了一个模型；ElevenLabs可为视频自动配音

AI日报：Runway的Gen-3 Alpha正式开放使用；百度文心大模型4.0 Turbo限时免费；英伟达发布直播神器；爆火Character AI惨遭阉割

阿里图片编辑项目MimicBrush 可通过AI技术完美融合两张图片（附MimicBrush产品地址）

马斯克称需为中国生产特供版Cybertruck

全球首台警用版Cybertruck现身迪拜！将用于日常巡逻

苹果watchOS 11史诗级更新：Apple Watch终于可以自动监测睡眠了

在中国上路会很难马斯克：将提供“特供版”Cybertruck皮卡

True Fit利用生成式AI帮助在线购物者找到合身的衣服

现实世界资产 (RWA) 代币化：金融领域的范式转变

南卡Runner Pro5骨传导耳机全新发布，行业首创彻底解决风噪痛点！

跨境收款平台有哪些？Airwallex有牌照加持，更安全可靠

苹果watchOS 11发布：运动打分、实时活动上线

全球资产RWA交易所，品质创新服务亚太用户受青睐

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

AI日报：Runway Gen 3可生成3D巨幅字幕效果；Google Vids 上线测试；百度网盘推宝宝AI长相预测；Luma AI推首尾帧视频生成

推荐关键词

24小时热搜

大家正在看

突发！Runway的Gen-3向所有人开放，媲美Sora！

AI玩法又升级！X博主通过Runway“穿越”《模拟人生》

Runway正式发布全新Gen3模型，AI视频的王，它回来了。

我测了12个小时的RunwayGen3，发现这就是AI视频的No.1

Gen-3 Alpha功能介绍及免费使用指南 Runway最新AI生成视频体验地址入口

Gen-3 Alpha有哪些功能免费吗？Runway视频生成AI模型怎么使用方法详细教程指南

Gen-3 Alpha完全指南：Runway AI视频生成模型使用方法教程与免费体验地址入口

AI日报：新王诞生！Runway重磅发布Gen-3 Alpha；Luma AI发布Extend功能；DeepSeek又开源了一个模型；ElevenLabs可为视频自动配音

AI日报：Runway的Gen-3 Alpha正式开放使用；百度文心大模型4.0 Turbo限时免费；英伟达发布直播神器；爆火Character AI惨遭阉割

阿里图片编辑项目MimicBrush 可通过AI技术完美融合两张图片（附MimicBrush产品地址）

马斯克称需为中国生产特供版Cybertruck

全球首台警用版Cybertruck现身迪拜！将用于日常巡逻

苹果watchOS 11史诗级更新：Apple Watch终于可以自动监测睡眠了

在中国上路会很难 马斯克：将提供“特供版”Cybertruck皮卡

True Fit利用生成式AI帮助在线购物者找到合身的衣服

现实世界资产 (RWA) 代币化：金融领域的范式转变

南卡Runner Pro5骨传导耳机全新发布，行业首创彻底解决风噪痛点！

跨境收款平台有哪些？Airwallex有牌照加持，更安全可靠

苹果watchOS 11发布：运动打分、实时活动上线

全球资产RWA交易所，品质创新服务亚太用户受青睐

在中国上路会很难马斯克：将提供“特供版”Cybertruck皮卡