12月13日,针对近期网络流传的“豆包手机助手可能获取银行安全键盘等受保护界面内容”的说法,豆包手机助手官方作出正式回应,称相关描述为对产品技术实现方式的误解。
官方声明指出,豆包手机助手在实现其功能时,严格遵循了Android系统的安全规范。对于用户关心的银行类应用安全键盘等声明为“Secure”(受保护)的界面,该助手采用的是系统原生的截屏接口,并完全遵从应用自身的安全标记,技术上无法对这类受保护界面进行截屏操作。
关于技术实现,声明解释称,豆包手机助手为部分功能需要,确实使用了“READ_FRAME_BUFFER”等系统权限。其目的在于创建一个虚拟显示空间来运行第三方应用,并通过系统提供的合法接口(如WindowManagerService.captureDisplay)获取该虚拟空间内的常规界面图像,以支持后续的任务理解与执行。官方强调,此方法同样无法读取任何被应用设置为“Secure”的保护内容。
示意图(图片来源:公开资料)
对于另一个引发关注的“CAPTURE_SECURE_VIDEO_OUTPUT”权限,官方说明称,该权限主要用于用户体验优化。当受保护的应用界面在虚拟显示空间中投影显示时,系统会默认将其处理为黑屏,导致用户无法查看与操作。启用此权限是为了让受保护内容能正常显示给用户并进行交互,但投影后的界面依然保持“Secure”标记,仅支持用户前台查看,仍无法被截屏。
在操作原理上,豆包手机助手的工作流程被描述为“指令-截屏-分析-执行”的循环。即用户发出指令后,助手对当前可截取的屏幕内容进行捕捉,经云端分析理解后返回具体操作步骤,由手机端执行,随后进行下一步的截图与分析,直至任务完成。每一步操作之间存在短暂间隔。
官方进一步表示,由于对界面进行深度理解需要较大的计算资源,目前相关分析处理需要在云端完成。声明中提到,当前市面上具备类似自动化操作能力的手机助手产品,在技术实现原理上相近,也会使用到相关的系统权限。
最后,声明重申了用户隐私与数据安全方面的设计:豆包手机助手仅在响应用户主动指令时才会启动截屏流程;所有上传至云端的屏幕图像仅用于实时任务分析与推理,在任务完成后不会在云端留存。