Anthropic 重磅发布 Claude Sonnet 4.5，号称“全球最佳编程模型”

就在2025年9月29日，人工智能公司 Anthropic 正式发布了其最新的AI模型 Claude Sonnet 4.5。该公司宣称，这是一款“全球最佳编码模型”，在编程、构建复杂智能体、计算机使用以及推理和数学方面都取得了显著的进步。

核心亮点：性能与功能的全面超越

Claude Sonnet 4.5 在多个关键领域展现了其强大的能力：

顶尖的编程能力： 根据衡量真实世界软件编码能力的 SWE-bench Verified 评估，Sonnet 4.5 已达到业界顶尖水平，能够生成更高质量的代码，并更可靠地遵循指令。 Anthropic表示，该模型不仅能构建原型，更能创建“可投入生产使用”的应用程序。

卓越的计算机操作能力： 在测试AI模型执行真实计算机任务的 OSWorld 基准测试中，Sonnet 4.5 的得分从之前 Sonnet 4 的 42.2% 跃升至 61.4%，位居领先地位。

超长的任务持续能力： 新模型可以自主运行长达30多个小时，远超前代模型的7小时，能够持续专注于复杂的多步骤任务。
显著提升的推理与专业知识： 在金融、法律、医学等专业领域，Sonnet 4.5 相比包括 Opus 4.1 在内的旧模型，在特定领域的知识和推理能力上表现出显著提升。

更强的安全对齐： Anthropic 强调，Sonnet 4.5 是其迄今为止最对齐的前沿模型，在减少谄媚、欺骗、寻求权力等不良行为方面取得了实质性进展，并增强了对提示注入攻击的防御能力。

生态系统全面升级

伴随 Sonnet 4.5 的发布，Anthropic 还对其产品生态进行了一系列重大升级：

Claude Code功能增强： 新增了备受期待的“检查点”（checkpoints）功能，允许用户保存进度并随时回滚到之前的状态。此外，还更新了终端界面并发布了原生的VS Code扩展。
Claude API 功能扩展： 增加了新的上下文编辑功能和记忆工具，使智能体能够运行更长时间并处理更复杂的任务。
应用内直接创建文件： Claude 应用程序现在支持代码执行和文件创建，可以直接在对话中生成电子表格、幻灯片和文档。
开放 Claude Agent SDK： Anthropic 开放了其内部用于构建 Claude Code 的底层基础设施，使开发者能够利用这些工具来构建自己的复杂智能体。

如何使用及定价

Claude Sonnet 4.5 现已全面上线。开发者可以通过Claude API调用claude-sonnet-4.5来使用新模型。值得注意的是，其定价与上一代 Sonnet 4 保持一致，为每百万输入tokens 3美元，每百万输出tokens 15美元。对于现有用户，Anthropic 建议进行升级。

此外，用户还可以通过多种渠道免费访问Claude Sonnet 4.5，包括 Claude.ai 官网的免费版本、集成在Zed Editor 和 GitHub Copilot 等开发工具中的版本，以及利用Anthropic API 或云平台的免费积分和试用计划。 Claude Sonnet 4.5 也已在 Amazon Bedrock 上提供。

对于 GitHub Copilot 的用户，包括 Copilot Pro、Pro+、Business 和 Enterprise 在内的订阅者，将逐步可以使用到 Claude Sonnet 4.5。

目前 OpenRouter 也已支持 Claude Sonnet 4.5 模型。

Anthropic 联合创始人兼首席科学官 Jared Kaplan 透露，更强大的模型正在开发中，并暗示今年年底前可能还会有新的发布。