站长之家 - 业界 2023-11-17 15:20

AI视野:ChatGPT测试新功能“从聊天中学习”;Kimi Chat全面开放服务;文心生物计算大模型宣布升级;Meta发布AI视频编辑工具Emu Video;贾跃亭也开始搞AI了

📰🤖📢AI新鲜事

ChatGPT测试新功能“从聊天中学习”

ChatGPT测试新功能,能学习用户历史聊天、理解偏好,还支持重置记忆和阅后即焚功能,使其更像个性化的朋友。

image.png

【AiBase提要:】

🧠 学习历史聊天: ChatGPT将能够在一个新的“My ChatGPT”选项中学习用户聊天内容,了解偏好和信息。

🔥 重置记忆和阅后即焚: 用户可手动开启学习功能,同时选择重置记忆或阅后即焚,保障隐私和定制性。

🚀 个性化交互: 新功能使ChatGPT更像用户的朋友,调整回应,实现更贴心、定制化的聊天体验。

ChatGPT被曝重大漏洞!3.5用户可免费升级至4.0Plus

一项重大漏洞使得ChatGPT3.5用户能够免费升级至GPT-4Plus,作者通过链接测试并确认漏洞实锤。不过目前该漏洞似乎已经被补上。

感兴趣的可点此测试https://chat.openai.com/?model=gpt-4-gizmo

【AiBase提要:】

😲 漏洞曝光: 通过特定链接,ChatGPT3.5用户可无费升级至GPT-4Plus。

😎 作者验证实: 作者亲测并确认漏洞存在,成功使用GPT-4功能。

🤔 OpenAI暂停注册: 文章猜测OpenAI是否有意泄露漏洞,同时提到ChatGPT Plus注册因使用激增而暂停。

Kimi Chat全面开放服务

Moonshot AI宣布,Kimi Chat全面开放服务,不再需要内测资格。Kimi Chat具备强大的多语言能力,特别在中文上表现优异,支持约20万汉字的上下文。创新网络结构和工程优化使其在千亿参数下实现无损的长程注意力机制,不依赖性能损害的“捷径”方案。

【AiBase提要:】

🌐 多语言优势: Kimi Chat在中文上表现显著,支持约20万汉字上下文。

⚙️ 创新网络结构: 通过创新网络结构和工程优化,在千亿参数下实现无损的长程注意力机制。

🚀 全面开放服务: Moonshot AI宣布Kimi Chat全面开放,无需内测资格。

百度飞桨文心生物计算大模型宣布升级

百度飞桨螺旋桨团队宣布升级两大生物计算大模型,HelixDock 和 HelixFold-Multimer,在构象预测准确度上取得显著进展,为结构药物设计提供可靠基础。

飞桨螺旋桨访问地址:https://paddlehelix.baidu.com/

【AiBase提要:】

🚀 模型升级: 百度飞桨螺旋桨团队升级了 HelixDock 和 HelixFold-Multimer 两大生物计算大模型。

💡 准确度提升: HelixDock 在 PDBBind core set 上的准确度高达89%,而 HelixFold-Multimer 在复杂预测任务上也取得明显提高。

🌐 开放公众使用: 团队计划向公众开放这些模型,以推动生物计算领域的技术变革。

微软发布声音克隆技术Personal Voice

微软推出Personal Voice技术,只需提供1分钟语音样本,即可生成与原声音完全一致的AI语音,支持多达100种语言,广泛应用于语音助手、游戏、娱乐等领域。

image.png

【AiBase提要:】

🔍 技术简介: 微软新技术Personal Voice可克隆用户声音,提供一致的AI语音,支持100种语言,应用于多领域。

🛡️ 安全保障: 通过设备端机器学习确保个人信息安全,与LiveSpeech集成,强调责任使用,并在生成声音中添加水印。

🌐 应用领域: 除语音助手、游戏外,Personal Voice在娱乐、媒体领域广泛应用,与海尔合作进入智能音箱和家电产品,于12月1日上线公共预览版。

贾跃亭旗下法拉第未来宣布推出AI产品FF aiPal Beta

法拉第未来推出的生成式AI产品aiPal Beta在出行领域利用大语言模型,通过汽车屏幕侧边栏为用户提供个性化的生活服务和实时导航,号称“极致贴心”。

【AiBase提要:】

🚗 个性化出行体验: aiPal Beta利用大语言模型,在汽车屏幕侧边栏提示用户周边生活服务,提供实时导航和日程安排。

💡 第三方合作计划: 产品计划与第三方开发商合作,拓展更广泛的AI服务。

🌐 首发测试版本:“共创官”优先体验: 产品将首先向“共创官”提供测试版本,用户可通过“FF Labs”申请测试体验。

Google 推出生成式人工智能虚拟产品购物体验

谷歌即将在今年12月更新其AI驱动的搜索生成体验,新增功能允许用户通过人工智能构想产品并在网络上搜索类似商品,提供更智能的购物体验。

【AiBase提要:】

🌐 AI购物创新: 谷歌引入AI图像生成技术,用户可通过搜索词在购物车中生成物品图像,并匹配网络上最接近的真实商品。

🎁 AI礼物创意: 选择加入的用户可享受AI生成的礼物创意建议,满足用户搜索词的个性需求,如适合家庭厨师的礼物。

👕 虚拟试穿功能: 谷歌扩展虚拟试穿功能至男士上衣,用户可通过搜索词在参与品牌中选择并试穿,展示AI生成的模特图像。

DeepMind 推出人耳无法察觉的 AI 音频水印技术 SynthID

Google DeepMind推出的AI Lyria模型创建的音频将使用SynthID水印标记,以在事后识别AI生成来源,该水印不损害听觉体验,可抵抗编辑操作。

【AiBase提要:】

🔍 水印技术介绍: SynthID是由AI Lyria模型创建的音频的水印,转换音频波为二维可视化,即使在压缩、加速或减速等情况下仍可检测。

🌐 应对AI生成危害: SynthID等水印工具被视为防范生成式AI带来危害的保障,符合美国总统乔·拜登关于AI生成内容水印标准的呼吁。

⚠️ 技术局限性: 尽管具有防剪裁或调整大小等功能,DeepMind警告SynthID并非对极端图像操作的绝对防御,为当前防御伪造品技术的局限性提醒。

韩国 SK 集团支持的 Sapeon 公司推出新型人工智能芯片

由韩国 SK 集团支持的人工智能芯片初创公司 Sapeon 推出最新型号芯片 SapeonX330,计算性能达竞争对手两倍,能效提升1.3倍,面向数据中心推出,加入全球 AI 芯片开发竞赛。

【AiBase提要:】

🚀 Sapeon 公司推出的新型 SapeonX330人工智能芯片在计算性能和能效方面超越竞争对手,面向数据中心市场。

🤖 该芯片支持大型语言模型(LLMs),计划于明年上半年开始大规模生产,由台积电制造。

🌐 Sapeon 公司是由韩国 SK 集团支持的初创公司,其母公司 SK Telecom 是韩国最大电信公司,而 SK 海力士是 Sapeon 的主要股东之一。

🤖📈💻💡大模型动态

百川智能发布脑海33B

百川智能与鹏城实验室合作发布“鹏城-百川·脑海33B”大模型,突破国产算力大模型技术限制,具有128K最长窗口,推动本土大模型开源开放,提升语义信息生成准确性和流畅性。

【AiBase提要:】

🚀 技术突破: 合作研发的“鹏城-百川·脑海33B”大模型突破国产算力大模型技术限制,具有128K最长窗口。

🤝 产业示范: 百川智能与鹏城实验室合作对国内大模型企业发展具有示范作用,推动本土大模型开源开放,支持智能化转型。

🔬 未来合作: 双方将继续加强合作,推动国产算力大模型的技术创新和落地。

DeepMind推AI音乐生成模型Lyria

Google DeepMind最新推出的AI音乐生成模型Lyria可以通过文本创作高质量音乐,包括乐器和人声。与YouTube合作的Lyria引入创意工具,包括用于YouTube Shorts的语音克隆工具Dream Track和专为艺术家设计的音乐AI工具。为防止编辑和内容侵权,Google DeepMind扩展了音频检测工具SynthID,覆盖由Lyria生成的音频。

【AiBase提要:】

🎤 Lyria是Google DeepMind的最新AI音乐生成模型,能从文本中创作高质量音乐,包括乐器和人声。

🎹 与YouTube合作,Lyria引入创意工具,包括Dream Track和专为艺术家设计的音乐AI工具。

🔍 Google DeepMind的音频检测工具SynthID扩展到覆盖由Lyria生成的音频,以保护音乐免受编辑和内容侵权。

Vicuna Makers打造小型AI模型Llama-rephraser

Vicuna Makers的研究团队成功推出Llama-rephraser,一款性能媲美GPT-4的小型AI模型,仅包含130亿参数,并通过改写测试集实现在主要基准测试中达到GPT-4水平。

【AiBase提要】

🌐 Vicuna Makers的新模型Llama-rephraser,仅130亿参数,在性能上媲美OpenAI的GPT-4。

🔄 利用新工具LLM Decontaminator,通过改写测试集,实现Llama-rephraser在主要基准测试中达到GPT-4的性能水平。

🌟 Llama-rephraser的研发挑战了对语言模型中数据污染的理解,为企业提供了性能与成本平衡的可能性。

🤖📱💼AI应用

微软推文本转真人视频工具Deepfakes Creator

微软推出的Deepfakes Creator工具,名为Azure AI Speech,通过文本输入生成逼真的会说话的真人视频,可广泛应用于视频制作、对话代理、虚拟助手等多个领域。

image.png

项目地址:https://github.com/Azure/gen-cv/tree/main/avatar/video

【AiBase提要:】

🔍 工具名为Deepfakes Creator,是Azure AI Speech的一部分,通过上传照片和文本剧本生成逼真的会说话的真人视频。

🌐 除了支持多种语言和实时问答互动,工具还提供个性化语音功能,快速复制用户的声音用于语音助手和内容配音。

💡 Deepfakes Creator可简化传统视频制作流程,适用于培训视频、产品介绍等,同时提供可定制化的化身选项。

Meta发布AI视频编辑工具 Emu Video 和 Emu Edit

Meta推出Emu Video和Emu Edit,基于Emu模型,通过自然语言描述生成4秒动画和精准图像编辑,漫威导演Joe Russo的两年内AI创作成熟电影预测成真。

【AiBase提要:】

🎥 Emu Video创新: Meta推出Emu Video,基于Emu模型,通过文本提示生成4秒动画,96%受访者认为质量更高。

✂️ Emu Edit精准编辑: Emu Edit通过指令精确编辑图像,Meta开发庞大数据集,在图像编辑任务中表现出卓越性能。

🌐 争议与前景: 网友对Meta的技术表示肯定,但也有担忧,认为AI发展可能引发人类替代问题,未来AI创作电影或许不再遥远。

AI原型“Make It Real”震惊开发者,将草图转化为可运行软件

协作白板应用"tldraw"发布了名为"Make It Real"的功能原型,利用AI将用户绘制的软件图像转化为可运行的代码,展示了其强大功能,但需注意在线体验存在安全风险。

【AiBase提要】

🚀 创新功能: "tldraw"发布了"Make It Real"原型,利用GPT-4V API将用户绘制的图像转化为可运行的代码。

🎨 功能展示: 设计师通过该功能展示了旋转屏幕上物体的滑块、颜色更改界面等强大功能。

🔐 安全警告: 虽可在线体验,但需提供OpenAI的API密钥,存在安全风险。

悦灵犀AI上线

悦享控股宣布悦灵犀AI备案通过,正式推出App及微信小程序。用户可通过应用商店或微信小程序下载使用,悦灵犀是一款AI绘画与创作平台,提供智能绘画工具、对话助手和绘画广场。平台汇聚艺术家,专注人工智能服务研发。

【AiBase提要:】

🚀 AI绘画与创作平台上线: 悦享控股旗下悦灵犀备案通过,推出App及微信小程序,提供智能绘画工具和对话助手。

🎨 艺术家展示空间: 平台聚集使用人工智能技术的艺术家和作品,为创作者提供展示作品的空间。

💡 人工智能服务专注: 悦灵犀团队致力于人工智能服务研发,提供优质的AI绘画、AI写作、API等服务。

👨‍💻💡🎯聚焦开发者

这个AI开源项目可一键将网页截图制作成HTML网页

这是一个简单的应用程序,利用GPT-4Vision生成代码,并使用DALL-E3生成类似的图像,将截图转换为整洁的HTML/Tailwind CSS前端代码。用户可通过GitHub或Twitter提供反馈。

image.png

项目地址:https://github.com/abi/screenshot-to-code

【AiBase提要:】

🤖 智能生成代码: 使用GPT-4Vision分析截图生成HTML、Tailwind CSS和JavaScript代码,无需手动编写。

🎨 图像增强体验: 利用DALL-E3生成与原始截图相似的图像,提升用户体验。

🔄 实时互动更新: 用户可实时查看生成的代码,在需要时通过互动指令调整样式或更新缺失的部分。

多模态语言模型新基准AMBER 评估和降低模型中的幻觉问题

AMBER项目是为多模态语言模型设计的新基准,致力于评估和减少模型在生成文本、图像或音频等多模态数据时可能产生的幻觉问题,并提供开源库支持。

image.png

项目地址:https://github.com/junyangwang0410/amber

【AiBase提要:】

👁️‍🗨️ AMBER项目是为多模态语言模型创建的新基准,关注解决生成多模态数据时可能出现的幻觉问题。

🎯 项目提供详细细粒度注释和自动化评估流程,以帮助研究者更好地理解和改进模型的性能。

🌐 AMBER基准的发布将推动对多模态语言模型中幻觉问题的研究,促进相关领域的进展。

ChatGPT源码推荐:小狐狸ChatGPT付费创作系统完全开源源码

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看

ChatGPT搜索?也就那样