站长之家 - 业界 2024-08-15 15:08

AI日报:阿里推多角色一致性框架UniPortrait;腾讯混元上线三款ControlNet插件;苹果研发桌面机器人;Claude推提示词缓存功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里团队推新框架UniPortrait:支持多角色一致性和风格参考

阿里巴巴集团研究团队发布了UniPortrait框架,专注于人像图像的个性化处理,实现单角色一致性、多角色一致性和风格参考。该框架具备高度逼真的面部特征保留,支持广泛的面部编辑功能,用户可通过自由文本描述生成图像。UniPortrait为人像个性化定制带来新可能性,提升图像生成质量,为未来应用场景铺平道路。

image.png

【AiBase提要:】

🌟UniPortrait框架专注于单一和多重身份的图像个性化处理,保持高质量的面部特征。

✍️框架由ID嵌入模块和ID路由模块组成,通过两阶段训练方案实现高效定制。

🚀UniPortrait支持自由文本描述和多样化布局生成,为人像个性化定制提供丰富可能性。

详情链接:https://top.aibase.com/tool/uniportrait

2、可精准控图!腾讯混元文生图开源模型上线三款ControlNet插件

腾讯混元文生图大模型(HunyuanDiT)近日发布了三款新的可控制插件ControlNet,进一步扩展了其应用场景,为开发者和创作者提供更精准的图片生成和更大自由度的创作能力。

image.png

【AiBase提要:】

🔍 Tile插件实现超清放大,适合对细节有极致追求的场景。

🎨 Inpainting插件填充涂抹部分,实现背景更换、人物主体改变等效果。

🖌️ Lineart插件创作真人、动漫和建筑图片,适用于建筑效果图生成和手稿上色。

详情链接:https://dit.hunyuan.tencent.com/

3、苹果正在研发一款神奇的桌面机器人,预计2026年面世!

苹果公司正秘密研发一款结合 iPad 显示屏和机械臂的桌面机器人,将彻底改变家庭生活。这款设备功能多样,可控制智能家居、进行视频通话和监控家庭安全,内置 Siri 语音助手,操作便捷。预计在2026年或2027年发布,售价约1000美元。

【AiBase提要:】

📱 苹果正在研发一款结合 iPad 显示屏和机械臂的桌面机器人,功能多样。

🛋️ 这款设备可以控制智能家居、进行视频通话和监控家庭安全,预计在2026年或2027年发布。

🗣️ 内置 Siri 语音助手,支持语音命令,让用户操作更便捷。

4、Claude推出提示缓存功能 允许开发人员在API缓存常用上下文

Anthropic公司推出的提示缓存功能在提高AI使用效率和降低成本方面具有潜在的重要意义,然而其实际效果还需市场检验。该功能允许用户存储和重复使用特定上下文信息,为商业AI应用带来效率提升。

【AiBase提要:】

🔑 提示缓存功能可降低企业AI成本并提升性能,但实际效果需市场验证。

🚀 功能适用于长时间对话、文档处理等场景,有望带来高达90%的成本降低和响应速度提升。

💡 其他AI公司也在探索提高模型效率和降低成本的方法,市场对功能表现持谨慎态度。

5、Grok2图像生成无所不能!原来用的是FLUX.1模型

在这个AI日新月异的时代,马斯克推出了AI助手Grok的新功能,让图片生成变得自由而充满争议。Black Forest Labs开发的FLUX.1模型引领着AI界的创新,但也引发了版权和虚假信息等问题。马斯克的选择反映了对信息自由的态度,但也可能带来信息灾难。在AI快速发展的时代,我们需要提高辨识能力,谨慎应对这种无拘无束的创造力。

image.png

【AiBase提要:】

🌟 Grok2 推出新图像生成功能,生成图片无过滤机制,质量上甚至超过了Midjourney和OpenAI的产品

💰 Grok2 用的是Black Forest Labs 开发的FLUX.1 模型

⚠️ 不受约束的图像生成可能导致假新闻和版权问题。

6、HeadGAP:三张视角图片即可生成逼真3D虚拟人

研究团队开发的"HeadGAP"方法引起了广泛关注,通过少量照片快速创建高仿真3D虚拟人头部形象,实现个性化定制与优化。该方法结合高斯点网络和动态建模技术,展示出色的渲染质量和动画表现,适用于多种应用场景。

image.png

【AiBase提要:】

🎨 通过"HeadGAP"方法,仅需少量照片即可创建逼真的3D虚拟人头部形象。

🚀 采用高斯点网络和动态建模技术,实现头像个性化定制与优化。

🖼️ 实验结果显示,生成的头像在渲染质量和动画表现上都非常出色,适用于多种应用场景。

详情链接:https://top.aibase.com/tool/headgap

7、联想发布2025财年Q1财报 杨元庆:混合式AI是巨大机遇

联想集团在2024/25财年第一财季业绩表现亮眼,营收增长20%,净利润同比增长65%。杨元庆强调混合式人工智能的愿景,认为是未来发展的重要方向。公司全球市场份额接近23%,AI PC出货量环比增长228%。

【AiBase提要:】

📈 营收增长20%,净利润同比增长65%。

🖥 全球市场份额接近23%,高端产品线占比31.6%。

🤖 混合式人工智能是未来发展重要方向,为个人和企业打造智能体。

8、OpenAI投的代码神器Cursor叛变,程序员却拍手叫好,疯狂买单

在科技圈,OpenAI投资的代码生成工具Cursor突然叛变,引起轰动。程序员们纷纷支持并购买Cursor,导致OpenAI失去统治地位。这一事件揭示了投资协议松散的问题。

image.png

【AiBase提要:】

🤯 程序员们疯狂支持Cursor,愿意支付双倍价格,使其成为新宠。

👀 Cursor支持Claude-3.5-Sonnet和多行编辑功能,提高代码编写效率。

💥 Claude-3.5-Sonnet在Livebench基准测试中稳坐榜首,超越GPT-4和ChatGPT。

详情链接:https://www.cursor.com/blog/openai-fund

9、Nature惊人内幕:无数论文被偷偷高价出售喂AI

学术出版商将研究论文出售给AI开发公司,引发科研界争议。研究数据用于训练AI模型,作者无知情。大型语言模型需大量数据训练,学术论文成宝贵资源。购买高质量数据集趋势上升,合作与保密并存。版权诉讼引发关注,研究者意见不一。

【AiBase提要:】

🔍 学术出版商将研究论文出售给AI开发公司,引发科研界争议。

💡 大型语言模型需大量数据训练,学术论文成宝贵资源。

⚖️ 版权诉讼引发关注,研究者意见不一。

详情链接:

https://www.nature.com/articles/d41586-024-02599-9

https://arxiv.org/pdf/2112.03570

ChatGPT源码推荐:小狐狸ChatGPT付费创作系统完全开源源码

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看