# DeepSeek V4降价75%：我接上Claude Code跑了几天，说说真实感受

前几天DeepSeek V4发布那篇，卡哥写的时候还在吐槽："V4-Pro输出24元/百万token，这不像DeepSeek的风格。"

结果文章发出去不到一天，DeepSeek官网直接挂了2.5折——输出砍到6元。

这操作真的很DeepSeek。

降价这几天我拿V4-Pro和V4-Flash接上Claude Code实跑了一些项目，说说真实感受，不吹不黑。

# V4-Flash：2块钱跑百万token，还要啥自行车

先说结论：V4-Flash才是这次降价里大多数录友应该关注的。

不是V4-Pro不好，是V4-Flash太便宜了。每百万token输出2元，缓存命中输入0.2元。这是什么概念？你在Claude Code里让V4-Flash读10个文件、改3处代码、跑一轮测试，算下来可能就几毛钱。同样的事用Claude Sonnet，轻松几块钱。

V4-Flash直接平替上一代deepseek-chat，性能更强，输出价格反而从3元降到2元。迁移零成本，改个模型名就行。

我这几天的用法：简单问答、文件搜索、内容生成、初版代码编写，全丢给V4-Flash。这些场景不需要最强推理，便宜够用就是王道。

有一点要注意：deepseek-chat和deepseek-reasoner将在7月24日后停用。V4-Flash的模型名是deepseek-v4-flash，尽早切过去。

# V4-Pro：便宜归便宜，Agent长任务还是差点意思

V4-Pro特惠价确实炸裂——输出6元/百万token，缓存命中输入0.25元。和Claude Opus 4.7的$25输出价相比，差了将近30倍。

但便宜不等于能替代。

我接上Claude Code跑了一个比较大的重构任务，让V4-Pro读整个项目、理解架构、重写一个模块。结果怎么说呢——单步能力没问题，多步连贯性差一截。

具体表现：第一步读文件、分析结构，做得很好。第二步改代码，也还行。到第三步发现要调整之前的改动，就开始"忘"之前做了什么，改着改着就跑偏了。

这不是V4独有的问题。在DeepSeek V4发布那篇里我们聊过，Terminal Bench 2.0（测Agent长任务能力）V4-Pro只有67.9，GPT-5.5是82.7。数字上的差距，到了真实使用里就是"跑着跑着就飞了"。

所以我现在对V4-Pro的定位很清晰：干粗活的性价比之王，但不适合跑复杂的Agent长链路。

代码扫描、安全审计、批量分析——这些一次性的、不需要多步连贯的任务，V4-Pro太合适了。几块钱就能扫描整个项目，同样的事让Claude Opus做，几十块打不住。

但如果你要的是"让AI自己跑30分钟把整个功能做完"，还是老老实实用Claude Opus 4.7或者GPT-5.5。

# 一个实用的搭配思路

Opus 4.7那篇结尾我说过，目前我写代码性价比最高的是Claude Agent + CLI + GLM-5.1 (opens new window)。V4降价后，这个思路可以扩展一下：

便宜模型打前站，贵模型把关。

具体来说：

前期调研、文件搜索、代码扫描 → V4-Flash或V4-Pro，成本几乎忽略
安全审计、批量分析 → V4-Pro，便宜且单步能力够
核心编码、bug修复、长链路Agent → Claude Opus 4.7，贵但稳

不是非此即彼，是各取所长。V4-Pro负责"量大管饱"，Claude负责"少而精"。

# 全行业涨价，DeepSeek凭什么降

聊完感受，说说降价背后的事。

2026年国内云厂商基本都在涨：百度4月18日AI算力上调5-30%，腾讯3月11日和5月9日两轮调价，智谱GLM系列三个月涨了三次。

DeepSeek不但不涨，反手一刀砍75%。凭什么？

国产算力。 V4系列首次实现了对华为昇腾NPU的全面适配。DeepSeek在技术论文里披露，细粒度专家并行方案同时在英伟达GPU和昇腾NPU上完成了验证。

官方API页面有一句话很关键："受限于高端算力，目前V4-Pro的服务吞吐仍有限。预计下半年昇腾950超节点批量上市后，Pro价格会大幅下调。"

所以这次2.5折更像是预演。 先用低价验证市场，等昇腾950量产、算力成本真正降下来，这个价位才有望常态化。

这也是DeepSeek和其他厂商的根本区别——其他厂商的成本结构在恶化（依赖英伟达GPU，芯片紧缺+电力涨价），DeepSeek的成本结构在改善（国产算力替代，成本持续下降）。 涨价和降价，都是成本结构决定的。

# 几个容易踩的坑

1、1M上下文的模型名别写错。 开1M上下文要写deepseek-v4-pro[1m]，不是deepseek-v4-pro。搞错了还是128K，白花了1M的钱。

2、5月5日特惠到期。 到期后价格大概率回升，但下半年昇腾950量产后有再次降价的预期。现在先用着，别以为这就是永久价。

3、长上下文检索能力在超128K后会下降。 MRCR评测在100万token下只有83.5，Claude Opus 4.6是92.9。日常用128K以内没影响，但如果你打算把整个代码仓库扔进去分析，要注意。

4、V4-Pro特惠期间吞吐有限。 高峰期响应可能比Claude慢，这是算力受限的直接表现，昇腾950量产后应该会改善。

# 写在最后

DeepSeek V4这次降价，放在全行业涨价的背景下，确实震撼。但卡哥还是那句话：别被价格冲昏头。

V4-Flash日常用，性价比无敌，这个没什么好犹豫的。V4-Pro特惠期做代码扫描、批量分析，成本几乎忽略，也很香。但Agent长任务，还是Claude和GPT更稳。 benchmark上的"编码天花板"，到了真实开发场景里，可能只是"编码中等偏上"。这个在DeepSeek V4发布那篇里我说得很直白了。

趁2.5折充点余额，先把简单任务切过去，省下来的钱够你跑很多次Opus了。

加油

← Claude Fable 5发布 DeepSeek V4-Pro永久降价75% →

验证登录状态...