Anthropic发布Opus 4.5模型,强化工具与记忆能力

Anthropic正式推出旗舰人工智能模型最新版本Opus 4.5,这是4.5系列的最终版本,继Sonnet 4.5与Haiku 4.5分别在九月和十月发布后亮相。

在性能方面,Opus 4.5在多项基准测试中表现突出。它在编码测试(SWE-Bench、Terminal-bench)、工具使用(tau2-bench、MCP Atlas)以及通用问题解决能力(ARC-AGI 2、GPQA Diamond)均取得领先成绩。其中,Opus 4.5成为首个在权威编码基准SWE-Bench Verified得分超过80%的模型。

新版本不仅提升性能,还扩展实际应用能力。Anthropic同步开放Claude for Chrome与Claude for Excel两款产品,前者面向所有Max用户,后者覆盖Max、团队及企业用户。这些工具展示了模型在计算机操作与表格处理上的新功能。

在长文本与长上下文任务中,Opus 4.5通过优化记忆管理方式提升质量。产品负责人Dianne Na Penn指出,扩展上下文窗口并不足够,模型如何保留关键细节同样重要。基于这一改进,付费用户获得“无限对话”模式,模型在达到上下文上限时可自动压缩记忆,避免中断对话。

此外,Opus 4.5在智能代理场景中展现出更强的工作记忆能力。作为主模型,它能够指挥由Haiku驱动的子代理完成复杂任务。这一特性使其在探索代码库和处理大型文档时更具优势。

市场竞争方面,Opus 4.5将直接面对近期发布的OpenAI GPT 5.1与Google Gemini 3。随着多家厂商加速迭代,前沿模型的竞争格局正在快速演变。

Tagged