谷歌(Google)推出Gemini 3.5 Flash,该模型的核心突破在于“电脑操作”能力。此功能旨在使模型能够直接操控电脑界面,执行多步骤任务,并在编码、研究及复杂工作流中扮演更主动的智能体角色。这次更新标志着Gemini的定位从传统的问答工具向执行型人工智能转变。

Gemini 3.5 Flash被Google描述为迄今在编码和自主代理任务上最强的模型之一。官方宣称,该模型兼顾了低延迟与高质量,在多项基准测试中的表现优于前代3.1 Pro。其输出速度也有显著提升,这使其适用于编程、工具调用和自动化办公等需要快速反馈和连续操作的场景。
该模型能够更有效地处理长链条任务,例如独立执行编码流程、管理研究项目,甚至在内部测试中参与了从零开始构建操作系统的复杂工作。Google方面强调,其优化的Flash架构同步提升了质量和响应速度,使其更契合需要持续交互的人工智能代理场景。
Google已将该能力整合至其产品与平台中。Gemini应用和搜索的AI模式已默认启用Gemini 3.5 Flash,该模型同时也通过Gemini API、Gemini Enterprise及相关开发者工具开放使用。面向搜索的智能体功能与新一代个人AI代理Gemini Spark也将由该模型提供支持,旨在减少用户在日常数字任务中的人工干预。
随着模型自主代理能力的增强,Google同步强化了风险控制措施,尤其关注网络安全和CBRN相关领域的防护。此类模型在处理敏感问题时,倾向于在可控框架下进行响应,并在必要时暂停以等待用户确认,而非简单拒答。总体而言,Gemini 3.5 Flash的发布代表着Google在“让AI直接执行任务”这一方向上的重要进展。
