站长之家 - 业界 2024-04-26 15:19

AI日报:会颠勺的国产机器人Astribot S1来了;Synthesia推能读懂文字情绪的数字人;OpenVoice V2版本发布;DeepFacelive让你在直播中实时换脸

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

1、Synthesia推出新型数字人Expressive-1正式版 能看懂你文字里的情绪

Synthesia公司推出Expressive-1AI Avatars,一款能根据文本内容自动展现丰富表情的AI虚拟形象技术。该技术提升视频表现力和吸引力,具有增强的表现力、情绪反应的同步、模仿人类微表情和身体语言等特点。

image.png

【AiBase提要:】

✨ 增强的表现力: Expressive-1根据文本语义变化自动展现适应的语调、面部表情和身体语言,更自然地表达情绪。

😊 情绪反应的同步: 虚拟形象能准确展示与情感状态相匹配的表情和语调,提高情感表达准确性。

🎤 声音和口型同步: 每个虚拟形象配备匹配的声音和出色的口型同步技术,确保声音和嘴唇动作一致性。

详情链接:https://top.aibase.com/tool/synthesia

2、讯飞星火大模型V3.5升级 推出长文本、长图文、长语音大模型

科大讯飞发布了讯飞星火大模型V3.5升级,引入多情感超拟人合成技术,推出长文本、长图文、长语音大模型,以及星火智能体平台,为招投标应用和合同应用提供强大技术支持。

image.png

【AiBase提要:】

🚀 科大讯飞发布讯飞星火大模型V3.5升级,引入多情感超拟人合成技术。

🔥 推出首个长文本、长图文、长语音大模型,提供更强大的技术支持。

💡 星火大模型在通用长文本处理方面表现优异,甚至超越了GPT-4Turbo。

详情链接:https://top.aibase.com/tool/xunfeixinghuorenzhidamoxing

3、科大讯飞:讯飞星火V4.0版6月27日发布

科大讯飞发布了首个支持长文本、长图文、长语音的大模型,提供了一系列新功能,包括图文识别、合同助手、智能评标助手等,实现更生动、个性化的表达,解决企业落地问题,助力员工提升工作效率。刘庆峰表示,讯飞星火V4.0将于6月27日正式发布。

【AiBase提要:】

🚀 科大讯飞发布首个支持长文本、长图文、长语音的大模型,提供更专业、更精准的行业场景回答。

📝 推出合同助手和智能评标助手,提高合同审核效率,使评标更便捷、更高效、更准确。

🌟 发布全新的智能体平台,解决大模型企业落地问题,为员工打造专属助理,帮助企业解放生产力。

详情链接:https://top.aibase.com/tool/xunfeixinghuorenzhidamoxing

4、会颠勺的国产机器人来了!星尘智能推AI机器人Astribot S1

一款颠覆家务机器人领域的国产AI机器人Astribot S1问世,具备模仿学习、大模型加持、软硬件协同等核心特点。其操作性能卓越,展示了在家居和工作场景中的多任务能力,预示着未来生活中AI机器人的广泛应用潜力。

image.png

【AiBase提要:】

🤖 模仿学习:Astribot S1能模仿人类行为,执行复杂任务,展现出成年人的敏捷和灵活性。

🧠 大模型加持:接入大模型测试,预计在2024年内实现商业化,旨在建立新的AI机器人标准。

🔧 软硬件协同:研发团队取得关键突破,使S1具备智慧的“大脑”和敏捷的“身体”。

5、抠脚大汉秒变可爱萝莉!实时换脸工具DeepFacelive让你在直播中一秒变脸

DeepFacelive是一款引起广泛关注的工具,可以在直播和视频通话中实时换脸,为用户带来全新的视觉体验。这一技术的引入提高了准确性和真实性,增加了趣味性和创新空间。

image.png

【AiBase提要:】

👉 可在视频通话和直播中实时换脸,并且可以实时更换面部表情和形象

👉 包括面部动画器,可操作静态面部图片

👉 硬件及系统要求:RTX2070 及以上显卡,win10 系统,4GB RAM,32GB+ 页面文件

项目地址:https://top.aibase.com/tool/deepfacelive

6、OpenVoice V2 版本发布 能对声音风格进行精细控制

OpenVoice V2版本是一项创新的声音克隆技术,能够精确复制参考发言者的声音并生成多种语言的语音。该版本具有更好的音频质量和原生多语言支持,集成了MeloTTS技术,支持免费商业使用。技术方法包括声音样式和语言的解耦设计,基础发音者TTS模型与音色转换器,以及训练策略和数据处理。

image.png

【AiBase提要:】

✨ 准确的音色克隆: OpenVoice能精确克隆参考音色并生成多种语言的语音。

🔧 灵活的声音风格控制: 用户可以详细调整声音的情绪、口音、节奏、停顿和语调,实现个性化声音输出。

🌐 高效的计算性能: OpenVoice在保持高性能的同时,计算成本大大降低。

官网:https://research.myshell.ai/open-voice

项目地址:https://top.aibase.com/tool/openvoice

创建自己的语音机器人:https://myshell.ai/

7、英特尔第一季度业绩表现强劲

英特尔第一季度营收达到127亿美元,同比增长9%,主要受到计算、人工智能和边缘产品的推动。英特尔推出新的 Gaudi3AI 加速器,挑战竞争对手 Nvidia 和 AMD,在人工智能领域取得进展。英特尔加速推出 AI PC 产品,预计到2024年底将超过4000万台 AI PC 出货量。

【AiBase提要:】

⭐ 英特尔第一季度营收达到127亿美元,同比增长9%。

⭐ 英特尔推出新的 Gaudi3AI 加速器,挑战竞争对手 Nvidia 和 AMD,在人工智能领域取得进展。

⭐ 英特尔加速推出 AI PC 产品,预计到2024年底将超过4000万台 AI PC 出货量。

8、科技巨头工程师薪酬大揭秘:OpenAI工程师年薪达90万美元

在科技巨头公司,工程师的年薪高达数百万美元,其中OpenAI工程师年薪可达90万美元。不同公司的工程师薪资水平各异,但均在百万美元以上。晋升至高级职位后,工程师年薪更可达数百万美元。人工智能领域的人才因知识而被慷慨报酬。

【AiBase提要:】

⭐️ OpenAI工程师年薪高达90万美元

⭐️ 谷歌、苹果、Facebook、微软等公司工程师薪资均在百万美元以上

⭐️ 工程师晋升至高级职位后,年薪可达数百万美元

9、IntrinsicAnything:调整图片光照 保持物体材质

这篇文章介绍了一种通过生成模型学习材料,规范优化过程的方法,以提高在未知静态照明条件下拍摄的姿势图像中恢复物体材质的准确性。研究者通过漫反射和镜面反射着色项的模型基础,采用从粗到精的训练策略,实现稳定且准确的材质回收结果。

image.png

【AiBase提要:】

⭐ 生成模型学习材料,规范优化过程,提高准确性

⭐ 模型基于漫反射和镜面反射着色项,增加准确性

⭐ 采用从粗到精的训练策略,实现稳定且准确的材质回收结果

详情链接:https://top.aibase.com/tool/intrinsicanything

10、Align Your Steps:低步数推理保持高质量结果

本文介绍了一种名为“步调齐整(Align Your Steps)”的全新方法,旨在优化深度学习领域中的扩散模型(DMs)的采样计划,提升生成过程中的效率和质量。通过严格的定量实验,发现优化计划在图像生成基准测试中显著提升图像质量,同时适用于文本到图像和视频生成领域。

image.png

【AiBase提要:】

✨ 优化采样计划提升生成模型效率和质量

🔧 可适用于多种数据合成基准测试,包括图像、视频等

🚀 提供用户友好的插拔式优化计划应用,提升生成过程中的稳定性和质量

详情链接:https://top.aibase.com/tool/align-your-steps

11、新ID保持项目PuLID:图像背景、光线、风格等均保持高度一致

PuLID是一个新兴的ID保持项目,致力于提升ID保持效果并最小化对原始模型的影响。其核心优势包括高度一致性、多功能性、高保真度、稳定性和准确性,应用广泛。PuLID的发布将推动技术的创新和发展,展现出独特的优势和价值。让我们共同期待PuLID的发布,见证其在技术领域的辉煌表现。

image.png

【AiBase提要:】

🔍 高度一致性: 身份信息加入前后,图像的背景、光线、布局和风格等元素保持一致。

🛠 多功能性: 支持样式更改、IP融合、配件修改、属性编辑和ID混合等多种操作,展现强大功能和效果。

🔒 高保真度: 通过对比对齐,自定义ID的同时保持高保真度,为用户提供更多可能性和选择。

详情链接:https://top.aibase.com/tool/pulid

12、体育老师使用人工智能克隆校长声音进行报复被捕

这篇文章报道了马里兰州巴尔的摩县体育老师达中·达里恩使用人工智能语音克隆服务陷害派克斯维尔高中校长的事件。这起事件揭示了人工智能技术被滥用的风险,引发了社会对个人信息安全和隐私保护的关注。

【AiBase提要:】

🔍 人工智能克隆校长声音事件:体育老师达里恩因涉嫌制作虚假录音被捕。

⚠️ 风险警示:人工智能语音克隆技术滥用引发社会关注,OpenAI限制公众使用其平台。

🔒 隐私保护:立法者努力制定法律保护个人信息免遭科技公司未经许可使用。

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看