DeepSeek-V3.2-Exp 正式发布:性能更强、API 成本减半、国产芯片深度适配
2025年9月29日,国产大模型厂商 DeepSeek 正式发布 DeepSeek-V3.2-Exp(Experimental)版本,作为迈向新一代架构的重要中间步骤,该模型在性能、效率与生态协同方面均取得显著进展 。
一、核心亮点
1. 引入全新稀疏注意力机制
DeepSeek-V3.2-Exp 引入了名为 DeepSeek Sparse Attention(DSA) 的新型稀疏注意力架构。该机制显著降低了计算资源消耗,同时提升了模型推理效率,尤其适用于长文本和复杂推理任务 。
在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。
2. API 成本大幅下调
伴随新模型上线,DeepSeek 宣布其 API 服务价格 “腰斩”,即成本降低 50%。此举有望进一步推动开发者和企业用户大规模采用 DeepSeek 的模型服务 。
3. 开源与云平台快速部署
DeepSeek-V3.2-Exp 已在 Hugging Face 平台正式开源,并同步上线多家主流云平台,包括:
- 华为云
- PPIO 派欧云
- 优刻得(UCloud)等
国外 OpenRouter 也已更新 DeepSeek-V3.2-Exp 模型
4. 国产 AI 芯片深度适配
该模型已获得多家国产 AI 芯片厂商的官方支持与适配,包括:
- 华为昇腾
- 寒武纪
- 海光信息
此举标志着国产大模型与国产算力生态的进一步融合 。
二、产品升级与部署
-
DeepSeek Chat 与 DeepSeek Reasoner 两大核心产品均已升级至 V3.2-Exp 版本。
deepseek-chat
对应非思考模式deepseek-reasoner
对应思考模式
-
官方 App 与网页端也已同步更新,用户可立即体验新模型能力 。
三、社区与行业反响
在正式发布前,DeepSeek-V3.2 的模型页面曾短暂出现在 Hugging Face 上,引发社区广泛关注与猜测 。而此次正式发布不仅兑现了技术承诺,更通过开源、降价、芯片协同等多维度举措,展现出 DeepSeek 在大模型竞争中的差异化战略 。