站长之家(ChinaZ.com)5月10日 消息:OpenAI 最近宣布,其 Assistants API 现在支持视觉能力,这标志着该公司在多模态AI领域的进一步扩展。这项更新使得API能够处理和理解图像内容,为用户提供更加丰富的交互体验。
Assistants API 的视觉能力特点包括:
- 支持多种图像格式:用户现在可以提交 PNG、JPG、GIF 和 WebP 格式的图像,以供API进行分析和理解。
- 数据使用限制:OpenAI 为每个组织设定了100GB的使用限制,而组织内每个用户的限制为10GB。这确保了服务的公平使用,并为不同规模的组织提供了灵活性。
- 图像理解自由控制:API 支持低保真度或高保真度的图像理解,开发者可以根据自己的需求和应用场景自由控制图像处理的精细程度。
这项更新为开发者提供了新的工具,以创建能够结合视觉和文本信息的应用程序,从而在各种场景下提供更准确的响应和更丰富的用户体验。无论是在客户服务、内容审核、教育还是娱乐领域,增强的视觉能力都有望带来新的创新和改进。
OpenAI 持续推动 AI 技术的边界,Assistants API 的这一新功能将进一步促进 AI 在各个行业中的集成和应用。