站长之家(ChinaZ.com)5月17日 消息:Google Photos 即将推出一项名为 Ask Photos 的实验性功能,该功能利用 AI 模型 Gemini,允许用户通过自然语言搜索来查找照片和视频,并辅助完成相关任务。
Ask Photos 的主要功能:
- 自然语言搜索:用户可以使用自然语言问题搜索照片和视频,而无需记住具体的关键词或拍摄日期。
- 上下文理解和细节提取:Gemini AI 模型能够理解照片的上下文和主题,提取其中的细节信息。
- 任务辅助:Ask Photos 不仅帮助用户搜索照片,还能辅助完成各种任务,如创建旅行亮点和撰写个性化的社交媒体分享内容。
- 多模态能力:Gemini 的多模态能力使其能够处理和理解照片中的复杂信息,包括文字、场景和人物。
- 动态调整和学习:Ask Photos 可以根据用户的反馈进行动态调整和学习,记住用户的修正,以便在未来提供更准确的结果。
Ask Photos 的工作原理:
理解问题:Ask Photos 利用自然语言处理技术解析用户输入的问题,识别关键词和概念,形成搜索计划。
生成响应:Ask Photos 分析搜索结果,利用 Gemini 的多模态能力理解照片内容,并构建响应,选择并返回最符合用户需求的照片和视频。
确保安全和记忆修正:在整个过程中,Ask Photos 采取安全措施,确保响应的安全性和适当性,并能记住用户的修正。
Ask Photos 的推出将进一步增强 Google Photos 的搜索能力,使用户能够更便捷地找到和管理他们的珍贵回忆。通过自然语言搜索和 AI 辅助,用户可以更快地找到特定时刻的照片,同时享受个性化的体验。这项功能预计将在未来几周内向用户推出。
详情:https://blog.google/products/photos/ask-photos-google-io-2024/