Google 将计算机使用集成到 Gemini 3.5 Flash 中,为开发人员增强了企业自动化和代理能力。
Google 为其 Gemini 3.5 Flash 型号引入了内置计算机使用功能,这标志着利用 AI 实现自动化的开发者和企业的重大升级。以前仅在独立的 Gemini 2.5 计算机使用模型中提供此功能,现在是最新 Gemini Flash 版本的本机功能,使自主代理能够跨浏览器、移动和桌面环境可靠地执行复杂的多步骤任务。
Gemini 3.5 Flash 于 2026 年 5 月在 Google I/O 大会上亮相,被定位为 Google DeepMind 最快且最具成本效益的代理 AI 模型。它的主要重点是为自主代理而不是传统的聊天机器人提供动力,这反映了谷歌向大规模执行现实世界任务的人工智能系统的战略转变。并行子代理工作流程、长上下文处理以及跨文本、图像和视频推理的多模式功能等功能已经使 Gemini 3.5 Flash 与其前代产品区分开来。
新的计算机使用功能进一步增强了这些功能,使开发人员能够构建针对长期企业任务(例如持续软件测试和专业知识工作)进行优化的代理。例如,使用 3.5 Flash 的代理现在可以分析应用程序功能、审核文档以查找可访问性问题,并无缝执行其他复杂的任务。关注生活环境的安全
虽然计算机使用的集成扩展了该模型的实用性,但 Google 已采取措施解决安全问题。为了减轻提示注入(恶意命令可能嵌入到输入中)等风险,Gemini 3.5 Flash 采用了有针对性的对抗性训练。其他保护措施包括用户确认敏感操作以及在检测到间接提示注入时自动终止任务。这些措施符合 Google 的“纵深防御”战略,鼓励开发者采用沙盒、人工监督和严格的访问控制。
开发者如何利用更新
开发人员可以通过 Gemini API 和 Gemini 企业代理平台开始部署更新的 Gemini 3.5 Flash。对于那些希望测试模型功能的人,Google 还推出了由 Browserbase 托管的演示环境,并在 GitHub 上共享了参考实现。这种易于访问的方式凸显了 Google 致力于在企业和开发者生态系统中扩大 Gemini 3.5 Flash 的采用。
战略意义
此举强化了 Google 将人工智能定位为生产力和企业自动化工具而不是对话新奇事物的承诺。由于 Gemini 3.5 Flash 已部署在 Google 搜索的 AI 模式中,并集成到 AI Studio 和 Android Studio 等平台中,因此包含计算机使用可能会使该模型对于希望扩展 AI 驱动工作流程的企业客户更具吸引力。值得注意的是,该模型的效率和性能已被视为关键的差异化因素,有消息称其在编码和代理任务方面优于 Gemini 3.1 Pro 模型。
对于探索人工智能驱动的自动化的企业来说,Gemini 3.5 Flash 提供了引人注目的速度、成本效益和先进功能的结合。通过此次更新,Google 似乎正在加倍努力实现人工智能作为企业创新基础工具的愿景。
