欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、最强开源模型来了!Llama3.1以405B参数领先GPT-4o
在人工智能的世界里,开源与闭源的较量从未停歇。Meta AI的Llama3.1模型的发布标志着开源AI走向成熟,预示着一个全新的时代即将到来。Llama3.1表现超越闭源模型,在性能上与闭源模型并驾齐驱,开启了开源AI可能成为行业标准的新时代。
【AiBase提要:】
🚀 Llama3.1以405B参数领先GPT-4o和Claude3.5Sonnet,在性能上实现超越。
💡 Meta大幅优化训练栈,扩展模型算力规模至16000个H100GPU,提高性能。
🔍 Llama3.1具有上下文长度扩展、多语言支持和卓越性能等技术亮点,展现出在多方面的优势。
详情链接:https://ai.meta.com/blog/meta-llama-3-1/
2、可灵AI视频开启付费计划 结束免费生成体验
可灵宣布结束免费生成体验,推出多层次付费会员计划,为用户提供更多样化的服务选择。新会员体系包括非会员、黄金会员、铂金会员和钻石会员,享受限时五折优惠。可灵定价亲民,性价比高,满足不同用户需求。转变商业模式展现成熟,将在AI视频生成领域发挥重要作用。
【AiBase提要:】
🔑 可灵推出多层次付费会员计划,包括非会员、黄金会员、铂金会员和钻石会员。
💡 限时五折优惠活动,各会员方案价格实惠,铂金会员每月平均133元可生成300个视频。
💼 可灵保留每日66点免费点数政策,满足日常用户创作需求。
详情链接:https://top.aibase.com/tool/keling-ai
3、快手AI视频产品可灵国际版1.0上线
快手今日宣布,其AI视频产品可灵国际版1.0正式上线,用户无需中国手机号码,每日登录可获得66个免费积分,引发全球热烈反响。可灵迅速崛起,改变AI视频格局,被视为国产AI模型向国际市场进军的重要一步。付费用户体验提升,定价合理,保持竞争力。
【AiBase提要:】
🌐 可灵国际版1.0正式上线,用户无需中国手机号码,每日登录获得66个免费积分。
🚀 可灵迅速崛起,吸引超50万用户申请内测资格,展示巨大市场潜力。
💰 可灵定价合理,月费最低33元人民币,支持生成66条短视频,去除水印,保持竞争力。
详情链接:https://klingai.com
4、AI视频编辑神器Vozo 可使用提示重写脚本并重新配音
Vozo是一款颠覆性的视频编辑工具,利用人工智能技术彻底改变了内容创作方式。它通过智能视频重写与重配音、文本驱动的语音编辑、多角色口型同步等功能,为用户提供了前所未有的视频编辑和改编能力。同时,Vozo支持专业视频翻译和自动视频优化,极大地简化了内容的国际化过程。
【AiBase提要:】
✨ 智能视频重写与重配音:Vozo利用AI技术,能快速将经典视频转化为病毒营销视频,且仅需几秒钟即可完成。
🎙 文本驱动的语音编辑:用户可以通过编辑文本来修改视频解说,系统提供多种口音和语调选项,提高视频内容的表现力。
👥 多角色口型同步:Vozo能为视频中的多个角色实现自然流畅的口型同步,提升了观看体验。
详情链接:https://top.aibase.com/tool/vozo
5、PixVerse V2视频模型发布 支持直接生成8秒视频
PixVerse发布了V2版本的视频模型,可以直接生成长达8秒的视频,提升了画质和细节。这款工具让用户的创意无限,细节控制精准,连贯性强,场景丰富。操作简单,满足各种风格需求,让用户在8秒内创造一个世界。
【AiBase提要:】
✨ 支持生成长达8秒的视频,提升画质和细节。
🎥 创意无限,可拍摄外星人跳广场舞、恐龙骑自行车等场景。
🌍 操作简单,满足各种风格需求,让用户在8秒内创造多个场景。
详情链接:https://top.aibase.com/tool/pixverse
6、腾讯PhotoMaker V2升级 几秒钟完成个性人物图像定制 无需训练LoRA
腾讯近日发布了PhotoMaker V2版本,革命性提升AI个性化人物图像定制效率和质量。通过ID嵌入技术,实现快速高质量个性化图像生成,无需繁琐训练过程。提升图像ID真实度,增强用户生成控制能力,效率提升近4倍。开启个人用户和专业创作者新可能性,简化个性化图像内容创作过程。AI技术进步将改变创意产业,催生新艺术表现形式和商业模式。
【AiBase提要:】
🚀 创新ID嵌入技术实现快速高质量个性化图像生成,无需繁琐训练过程。
💡 提升图像ID真实度,增强用户生成控制能力,效率提升近4倍。
🎨 开启个人用户和专业创作者新可能性,简化个性化图像内容创作过程。
详情链接:https://top.aibase.com/tool/photomaker-v2
7、北大出品新3D场景生成框架HoloDreamer
HoloDreamer是一款新型的3D场景生成框架,通过用户的文本描述生成身临其境、完整的3D场景。这一创新性进展将推动文本驱动的3D场景生成研究,为虚拟现实、游戏和影视行业提供新的解决方案。
【AiBase提要:】
🌟 HoloDreamer是一款新型的3D场景生成框架,通过文本描述生成完整的3D场景。
🖼️ 框架包括两个核心模块: 风格化全景生成和增强型全景重建,确保生成结果的高质量和一致性。
🚀 HoloDreamer在实验中表现优异,超越了之前的3D生成方法,为虚拟现实和游戏等领域提供了新的解决方案。
8、Adobe为Illustrator和Photoshop引入更多生成式AI功能
Adobe最近推出了新一轮的生成式AI功能,旨在提升设计软件Illustrator和Photoshop的创作流程效率。这些更新包括Illustrator的生成式形状填充工具和Photoshop的图像生成功能,为设计师提供更多创作自由和便利。尽管引发了部分创意专业人士的担忧,Adobe强调生成式AI的目的是增强创意表达而非取代人类创意。这一系列更新是Adobe自去年推出Firefly模型以来的最新成果,希望为创意行业带来更多创新机会。
【AiBase提要:】
✨ Illustrator新增生成式形状填充工具,可通过描述性文本填充形状;Text to Pattern功能生成可扩展的自定义矢量图案。
🖼️ Photoshop更新引入生成图像功能,支持更高的图像细节增强;提供新的选择画笔工具,方便用户选择和分离特定对象。
🔍 尽管Adobe强调生成式AI旨在增强创意表达,仍面临部分创意专业人士对自动化设计可能减少就业机会的质疑。
9、快手:添加AIGC内容“作者声明”不会影响作品流量
快手平台推出了新功能“作者声明”,鼓励创作者在发布AI生成内容时添加声明,以减少误解。创作者需遵循操作引导手册,可通过作者声明标注AI生成内容。添加声明不影响作品流量,除非违反法律或规则。更新快手app至最新版本可解决标识操作入口问题。快手希望与创作者合作,共同打造真实有趣社区环境。
【AiBase提要:】
🚀 创作者可在发布AI生成内容时添加作者声明
💡 添加声明不影响作品流量,除非违规
🔧 更新快手app至最新版本可解决标识操作入口问题
10、快手可灵团队开源项目LivePortrait爆火 一张照片生成动态视频 大叔秒变少女!
快手可灵团队开源的人像视频生成框架LivePortrait在人工智能领域引起轰动,展现了AI技术在视频生成领域的巨大潜力。该项目在GitHub上已获得7.5K星标,成为当下最热门的AI项目之一。LivePortrait不仅能让静态图像动起来,还能精确复制表情到不同人身上,具有广泛的应用价值。
【AiBase提要:】
🔥 LivePortrait在GitHub上获得7.5K星标,成为热门AI项目
💡 LivePortrait能精确复制表情到不同人身上,适用于多种风格
⚙️ LivePortrait生成速度高达12.8毫秒每帧,在视频生成领域具有优势
详情链接:https://top.aibase.com/tool/liveportrait
11、百川智能联合天津大学推出“Sibyl System”Agent框架 登顶大模型复杂任务榜单GAIA
百川智能与天津大学合作推出的Sibyl System智能体框架在GAIA Leader Board上取得第一名成绩,突显其在复杂任务执行方面的卓越能力。GAIA评测方案揭示了现有模型的能力缺陷,为模型研发提供改进方向,要求AI具备推理、多模态理解、网页浏览和使用工具等能力。Sibyl System框架设计特点包括类人的浏览器界面替代检索、问答替代对话、引入“陪审团”机制等,实现了模型从“快思考”到“慢思考”的转变。
【AiBase提要:】
✨ Sibyl System在GAIA Leader Board上取得第一名,展现出在复杂任务执行方面的卓越能力
⚙️ GAIA评测方案揭示现有模型的能力缺陷,为模型研发提供改进方向
🔍 Sibyl System框架设计特点包括类人浏览器界面替代检索、问答替代对话、引入“陪审团”机制
详情链接:https://arxiv.org/pdf/2407.10718
12、微软VALLE-2模型实现零样本文本到语音技术
微软发布的VALLE-2模型实现了与人类同等水平的语音合成,被认为是TTS领域的里程碑式进展。该模型展现了惊人的即时模仿能力,提高了解码稳定性,加速了推理过程,简化了数据需求,超越了前代模型VALLE,引发了关于技术伦理和责任使用的深度思考。
【AiBase提要:】
🌟 零样本学习:VALLE-2仅需一段简短的陌生语音样本,展现了惊人的即时模仿能力。
🔬 重复感知采样:改进了随机采样方法,提高了解码稳定性。
🚀 分组代码建模:减少了序列长度,加速了推理过程,同时提高了性能。
详情链接:https://www.microsoft.com/en-us/research/project/vall-e-x/vall-e-2/
13、LazyLLM: 提高LLM长文本推理效率
LazyLLM是一项由苹果公司和Meta AI联合推出的新技术,旨在提高大型语言模型在长文本推理中的效率。该技术通过动态选择重要token来加速LLM推理过程,在长文本场景中表现突出。LazyLLM不需要对现有模型进行改动,易于实施,同时能显著提高推理速度,保持较高的准确性。
【AiBase提要:】
🌟 LazyLLM通过动态选择重要token,加速LLM推理过程,在长文本场景中表现突出。
⚡ 该技术能够显著提高推理速度,TTFT速度提升可达4.77倍,同时保持较高的准确性。
🔧 LazyLLM不需要对现有模型进行改动,可与任何变换器基础的LLM兼容,易于实施。
详情链接:https://arxiv.org/abs/2407.14057
14、谷歌二季度收入达850亿美元,AI与搜索业务助力增长
谷歌在第二季度取得了令人瞩目的成绩,收入达到850亿美元。其搜索业务和云计算部门表现突出,AI技术的应用也取得了显著进展。此外,谷歌放弃了逐步淘汰第三方Cookie的计划,转而推行用户知情选择政策。整体业务增长势头良好,展望未来发展潜力巨大。
【AiBase提要:】
💰 谷歌第二季度收入达850亿美元,搜索业务贡献485亿美元。
🤖 生成式AI解决方案为谷歌云计算带来数十亿收入,开发者使用人数超过200万。
🔍 谷歌放弃逐步淘汰第三方Cookie,Chrome将要求用户做出“知情选择”。