Anthropic 重磅发布 Claude Sonnet 4.5,号称“全球最佳编程模型”
就在2025年9月29日,人工智能公司 Anthropic 正式发布了其最新的AI模型 Claude Sonnet 4.5
。 该公司宣称,这是一款“全球最佳编码模型”,在编程、构建复杂智能体、计算机使用以及推理和数学方面都取得了显著的进步。
核心亮点:性能与功能的全面超越
Claude Sonnet 4.5 在多个关键领域展现了其强大的能力:
- 顶尖的编程能力: 根据衡量真实世界软件编码能力的 SWE-bench Verified 评估,Sonnet 4.5 已达到业界顶尖水平,能够生成更高质量的代码,并更可靠地遵循指令。 Anthropic表示,该模型不仅能构建原型,更能创建“可投入生产使用”的应用程序。
- 卓越的计算机操作能力: 在测试AI模型执行真实计算机任务的 OSWorld 基准测试中,Sonnet 4.5 的得分从之前 Sonnet 4 的 42.2% 跃升至 61.4%,位居领先地位。
- 超长的任务持续能力: 新模型可以自主运行长达30多个小时,远超前代模型的7小时,能够持续专注于复杂的多步骤任务。
- 显著提升的推理与专业知识: 在金融、法律、医学等专业领域,Sonnet 4.5 相比包括 Opus 4.1 在内的旧模型,在特定领域的知识和推理能力上表现出显著提升。
- 更强的安全对齐: Anthropic 强调,Sonnet 4.5 是其迄今为止最对齐的前沿模型,在减少谄媚、欺骗、寻求权力等不良行为方面取得了实质性进展,并增强了对提示注入攻击的防御能力。
生态系统全面升级
伴随 Sonnet 4.5 的发布,Anthropic 还对其产品生态进行了一系列重大升级:
- Claude Code功能增强: 新增了备受期待的“检查点”(checkpoints)功能,允许用户保存进度并随时回滚到之前的状态。此外,还更新了终端界面并发布了原生的VS Code扩展。
- Claude API 功能扩展: 增加了新的上下文编辑功能和记忆工具,使智能体能够运行更长时间并处理更复杂的任务。
- 应用内直接创建文件: Claude 应用程序现在支持代码执行和文件创建,可以直接在对话中生成电子表格、幻灯片和文档。
- 开放 Claude Agent SDK: Anthropic 开放了其内部用于构建 Claude Code 的底层基础设施,使开发者能够利用这些工具来构建自己的复杂智能体。
如何使用及定价
Claude Sonnet 4.5 现已全面上线。 开发者可以通过Claude API调用claude-sonnet-4.5
来使用新模型。值得注意的是,其定价与上一代 Sonnet 4 保持一致,为每百万输入tokens 3美元,每百万输出tokens 15美元。 对于现有用户,Anthropic 建议进行升级。
此外,用户还可以通过多种渠道免费访问Claude Sonnet 4.5,包括 Claude.ai 官网的免费版本、集成在Zed Editor 和 GitHub Copilot 等开发工具中的版本,以及利用Anthropic API 或云平台的免费积分和试用计划。 Claude Sonnet 4.5 也已在 Amazon Bedrock 上提供。
对于 GitHub Copilot 的用户,包括 Copilot Pro、Pro+、Business 和 Enterprise 在内的订阅者,将逐步可以使用到 Claude Sonnet 4.5。
目前 OpenRouter
也已支持 Claude Sonnet 4.5 模型。
Anthropic 联合创始人兼首席科学官 Jared Kaplan 透露,更强大的模型正在开发中,并暗示今年年底前可能还会有新的发布。