Gemini 3.5 Flash上线，Google推进AI代理执行方向

谷歌（Google）推出Gemini 3.5 Flash，该模型的核心突破在于“电脑操作”能力。此功能旨在使模型能够直接操控电脑界面，执行多步骤任务，并在编码、研究及复杂工作流中扮演更主动的智能体角色。这次更新标志着Gemini的定位从传统的问答工具向执行型人工智能转变。

Gemini 3.5 Flash被Google描述为迄今在编码和自主代理任务上最强的模型之一。官方宣称，该模型兼顾了低延迟与高质量，在多项基准测试中的表现优于前代3.1 Pro。其输出速度也有显著提升，这使其适用于编程、工具调用和自动化办公等需要快速反馈和连续操作的场景。

该模型能够更有效地处理长链条任务，例如独立执行编码流程、管理研究项目，甚至在内部测试中参与了从零开始构建操作系统的复杂工作。Google方面强调，其优化的Flash架构同步提升了质量和响应速度，使其更契合需要持续交互的人工智能代理场景。

Google已将该能力整合至其产品与平台中。Gemini应用和搜索的AI模式已默认启用Gemini 3.5 Flash，该模型同时也通过Gemini API、Gemini Enterprise及相关开发者工具开放使用。面向搜索的智能体功能与新一代个人AI代理Gemini Spark也将由该模型提供支持，旨在减少用户在日常数字任务中的人工干预。

随着模型自主代理能力的增强，Google同步强化了风险控制措施，尤其关注网络安全和CBRN相关领域的防护。此类模型在处理敏感问题时，倾向于在可控框架下进行响应，并在必要时暂停以等待用户确认，而非简单拒答。总体而言，Gemini 3.5 Flash的发布代表着Google在“让AI直接执行任务”这一方向上的重要进展。

Gemini 3.5 Flash上线，Google推进AI代理执行方向

AstralBARD

文章作者

推荐阅读