Featured image of post Anthropic 重磅发布 Claude Sonnet 4.5,号称“全球最佳编程模型”

Anthropic 重磅发布 Claude Sonnet 4.5,号称“全球最佳编程模型”

2025年9月29日 Anthropic 正式发布 Claude Sonnet 4.5 模型

Anthropic 重磅发布 Claude Sonnet 4.5,号称“全球最佳编程模型”

就在2025年9月29日,人工智能公司 Anthropic 正式发布了其最新的AI模型 Claude Sonnet 4.5。 该公司宣称,这是一款“全球最佳编码模型”,在编程、构建复杂智能体、计算机使用以及推理和数学方面都取得了显著的进步。

核心亮点:性能与功能的全面超越

Claude Sonnet 4.5 在多个关键领域展现了其强大的能力:

  • 顶尖的编程能力: 根据衡量真实世界软件编码能力的 SWE-bench Verified 评估,Sonnet 4.5 已达到业界顶尖水平,能够生成更高质量的代码,并更可靠地遵循指令。 Anthropic表示,该模型不仅能构建原型,更能创建“可投入生产使用”的应用程序。

claude_sonnet_v45_SWE-bench.png

  • 卓越的计算机操作能力: 在测试AI模型执行真实计算机任务的 OSWorld 基准测试中,Sonnet 4.5 的得分从之前 Sonnet 4 的 42.2% 跃升至 61.4%,位居领先地位。

claude_sonnet_v45_rank.png

  • 超长的任务持续能力: 新模型可以自主运行长达30多个小时,远超前代模型的7小时,能够持续专注于复杂的多步骤任务。
  • 显著提升的推理与专业知识: 在金融、法律、医学等专业领域,Sonnet 4.5 相比包括 Opus 4.1 在内的旧模型,在特定领域的知识和推理能力上表现出显著提升。

claude_sonnet_v45_jinrong.png

  • 更强的安全对齐: Anthropic 强调,Sonnet 4.5 是其迄今为止最对齐的前沿模型,在减少谄媚、欺骗、寻求权力等不良行为方面取得了实质性进展,并增强了对提示注入攻击的防御能力。

生态系统全面升级

伴随 Sonnet 4.5 的发布,Anthropic 还对其产品生态进行了一系列重大升级:

  • Claude Code功能增强: 新增了备受期待的“检查点”(checkpoints)功能,允许用户保存进度并随时回滚到之前的状态。此外,还更新了终端界面并发布了原生的VS Code扩展。
  • Claude API 功能扩展: 增加了新的上下文编辑功能和记忆工具,使智能体能够运行更长时间并处理更复杂的任务。
  • 应用内直接创建文件: Claude 应用程序现在支持代码执行和文件创建,可以直接在对话中生成电子表格、幻灯片和文档。
  • 开放 Claude Agent SDK: Anthropic 开放了其内部用于构建 Claude Code 的底层基础设施,使开发者能够利用这些工具来构建自己的复杂智能体。

如何使用及定价

Claude Sonnet 4.5 现已全面上线。 开发者可以通过Claude API调用claude-sonnet-4.5来使用新模型。值得注意的是,其定价与上一代 Sonnet 4 保持一致,为每百万输入tokens 3美元,每百万输出tokens 15美元。 对于现有用户,Anthropic 建议进行升级。

claude_sonnet_v45_price.png

此外,用户还可以通过多种渠道免费访问Claude Sonnet 4.5,包括 Claude.ai 官网的免费版本、集成在Zed Editor 和 GitHub Copilot 等开发工具中的版本,以及利用Anthropic API 或云平台的免费积分和试用计划。 Claude Sonnet 4.5 也已在 Amazon Bedrock 上提供。

对于 GitHub Copilot 的用户,包括 Copilot Pro、Pro+、Business 和 Enterprise 在内的订阅者,将逐步可以使用到 Claude Sonnet 4.5。

目前 OpenRouter 也已支持 Claude Sonnet 4.5 模型。

claudesoonet_openrouter_v45.png

Anthropic 联合创始人兼首席科学官 Jared Kaplan 透露,更强大的模型正在开发中,并暗示今年年底前可能还会有新的发布。

本博客所有内容无特殊标注均为大卷学长原创内容,复制请保留原文出处。
Built with Hugo
Theme Stack designed by Jimmy