谷歌宣布Gemini 1.5 Pro开放API 新增多项功能

站长之家（ChinaZ.com）4月10日消息:Google宣布开放其AI模型Gemini1.5Pro的API，这一版本在原有基础上进行了大幅度的功能扩展，现已在180多个国家提供。

Gemini1.5Pro引入了对原生音频（语音）的理解能力，以及文件API和系统指令等新功能。这使得Gemini模型能够直接处理音频输入，而无需先将音频转换为文本。这为AI模型带来了全新的应用可能性，如音频和视频模态的处理。

详情点此查看:

https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html

音频理解能力:

https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb

Gemini1.5Pro大大扩展了输入模态的范围，现在它不仅能理解文本，还能理解音频（语音）。此外，Gemini1.5Pro还可以对上传到Google AI Studio中的视频进行图像(帧)和音频(语音)的同时推理，这意味着这个模型具备了理解和处理视频内容的能力，不仅限于视频的视觉部分(如图像帧)，也包括音频部分(如对话、背景音乐等)。

这一改进的应用潜力巨大，包括多模态理解、内容索引和搜索、增强的交互体验、视频内容分析以及创意内容生成等方面。例如，通过综合分析视频中的视觉信息和音频信息，Gemini1.5Pro可以更全面地理解视频内容，从而帮助创建更详细的内容索引，使用户能够基于视频内容的视觉和听觉信息进行搜索。

此外，Gemini API也进行了一些重要的改进。比如，引入了系统指令引导模型响应，现已在Google AI Studio和Gemini API中提供。开发者可以通过定义角色、格式、目标和规则来指导模型的行为，以适应特定用例。同时，新的JSON模式指示模型仅输出JSON对象，该模式支持从文本或图像中提取结构化数据。

Google还推出了新的嵌入模型，性能得到了显著提升。从今天开始，开发者将能够通过Gemini API访问Gemini下一代文本嵌入模型。这个新模型在MTEB基准测试中取得了更强的检索性能，超过了具有可比维度的所有现有模型。

谷歌版贾维斯即将问世，最强Gemini 2.0加持！AI自主操控电脑时代来临

2024-10-282.4万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

谷歌宣布Gemini 1.5 Pro开放API 新增多项功能

推荐关键词

24小时热搜

大家正在看

谷歌Gemini AI惊人回复用户请求帮助：竟收到“请去死吧”！

谷歌版贾维斯即将问世，最强Gemini 2.0加持！AI自主操控电脑时代来临

谷歌 Workspace Gemini 插件用户可享受 Gmail “帮助我写作”功能

AI日报：Claude推出桌面客户端；ChatGPT、谷歌Gemini均推搜索功能；阿里EcomID原生支持ComfyUI；Suno新增AI歌手克隆功能

钟文泽高度评价的vivo X200 Pro mini，有什么魔力？

Mini LED电视必入口碑王，海信电视E5N Pro+性价比究竟有多强？

海信电视E5N Pro+成Mini LED必入口碑王？双十一销量数据证明一切

苹果史上第一次！M4 Pro Mac mini支持外接三台6K显示屏

iPad mini 7果冻屏问题已解决：苹果曾称是正常现象

苹果发布新款Mac mini：搭载M4/M4 Pro芯片售价4499元起

4499元起！苹果发布新款Mac mini：升级M4/M4 Pro 仅手掌大小

4599元起！小米电视S Pro Mini LED 2025系列发布：3200峰值亮度

史上最完美屏幕！红魔10 Pro全球首发1.5K真全面屏

苹果2024款Mac mini配置曝光：配备M4/M4 Pro芯片最高支持64GB内存

耗时5年研发！红魔10 Pro首发1.5K真全面屏：直板旗舰的最终极形态

两大绝技加持小米15 Pro配备2K屏却只有1.5K屏的功耗

开源版OpenAI再出「神作」，小模型吊打Llama 3！Ministral系列问世，边缘AI革命开启

红魔10 Pro首发搭载悟空屏！1.5K真全面屏 95.3%屏占比

全球首款1.5K真全面屏手机！红魔10 Pro下周登场

AI PC升级！Redmi Book Pro 14/16 2024宣布邀测小米AI创作、AI搜图

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

谷歌宣布Gemini 1.5 Pro开放API 新增多项功能

推荐关键词

24小时热搜

大家正在看

谷歌Gemini AI惊人回复 用户请求帮助：竟收到“请去死吧”！

谷歌版贾维斯即将问世，最强Gemini 2.0加持！AI自主操控电脑时代来临

谷歌 Workspace Gemini 插件用户可享受 Gmail “帮助我写作”功能

AI日报：Claude推出桌面客户端；ChatGPT、谷歌Gemini均推搜索功能；阿里EcomID原生支持ComfyUI；Suno新增AI歌手克隆功能

钟文泽高度评价的vivo X200 Pro mini，有什么魔力？

Mini LED电视必入口碑王，海信电视E5N Pro+性价比究竟有多强？

海信电视E5N Pro+成Mini LED必入口碑王？双十一销量数据证明一切

苹果史上第一次！M4 Pro Mac mini支持外接三台6K显示屏

iPad mini 7果冻屏问题已解决：苹果曾称是正常现象

苹果发布新款Mac mini：搭载M4/M4 Pro芯片 售价4499元起

4499元起！苹果发布新款Mac mini：升级M4/M4 Pro 仅手掌大小

4599元起！小米电视S Pro Mini LED 2025系列发布：3200峰值亮度

史上最完美屏幕！红魔10 Pro全球首发1.5K真全面屏

苹果2024款Mac mini配置曝光：配备M4/M4 Pro芯片 最高支持64GB内存

耗时5年研发！红魔10 Pro首发1.5K真全面屏：直板旗舰的最终极形态

两大绝技加持 小米15 Pro配备2K屏 却只有1.5K屏的功耗

开源版OpenAI再出「神作」，小模型吊打Llama 3！Ministral系列问世，边缘AI革命开启

红魔10 Pro首发搭载悟空屏！1.5K真全面屏 95.3%屏占比

全球首款1.5K真全面屏手机！红魔10 Pro下周登场

AI PC升级！Redmi Book Pro 14/16 2024宣布邀测小米AI创作、AI搜图

谷歌Gemini AI惊人回复用户请求帮助：竟收到“请去死吧”！

苹果发布新款Mac mini：搭载M4/M4 Pro芯片售价4499元起

苹果2024款Mac mini配置曝光：配备M4/M4 Pro芯片最高支持64GB内存

两大绝技加持小米15 Pro配备2K屏却只有1.5K屏的功耗