# DeepSeek V4降价75%:我接上Claude Code跑了几天,说说真实感受
前几天DeepSeek V4发布那篇,卡哥写的时候还在吐槽:"V4-Pro输出24元/百万token,这不像DeepSeek的风格。"
结果文章发出去不到一天,DeepSeek官网直接挂了2.5折——输出砍到6元。
这操作真的很DeepSeek。
降价这几天我拿V4-Pro和V4-Flash接上Claude Code实跑了一些项目,说说真实感受,不吹不黑。
# V4-Flash:2块钱跑百万token,还要啥自行车
先说结论:V4-Flash才是这次降价里大多数录友应该关注的。
不是V4-Pro不好,是V4-Flash太便宜了。每百万token输出2元,缓存命中输入0.2元。这是什么概念?你在Claude Code里让V4-Flash读10个文件、改3处代码、跑一轮测试,算下来可能就几毛钱。同样的事用Claude Sonnet,轻松几块钱。
V4-Flash直接平替上一代deepseek-chat,性能更强,输出价格反而从3元降到2元。迁移零成本,改个模型名就行。
我这几天的用法:简单问答、文件搜索、内容生成、初版代码编写,全丢给V4-Flash。这些场景不需要最强推理,便宜够用就是王道。
有一点要注意:deepseek-chat和deepseek-reasoner将在7月24日后停用。V4-Flash的模型名是deepseek-v4-flash,尽早切过去。
# V4-Pro:便宜归便宜,Agent长任务还是差点意思
V4-Pro特惠价确实炸裂——输出6元/百万token,缓存命中输入0.25元。和Claude Opus 4.7的$25输出价相比,差了将近30倍。
但便宜不等于能替代。
我接上Claude Code跑了一个比较大的重构任务,让V4-Pro读整个项目、理解架构、重写一个模块。结果怎么说呢——单步能力没问题,多步连贯性差一截。
具体表现:第一步读文件、分析结构,做得很好。第二步改代码,也还行。到第三步发现要调整之前的改动,就开始"忘"之前做了什么,改着改着就跑偏了。
这不是V4独有的问题。在DeepSeek V4发布那篇里我们聊过,Terminal Bench 2.0(测Agent长任务能力)V4-Pro只有67.9,GPT-5.5是82.7。数字上的差距,到了真实使用里就是"跑着跑着就飞了"。
所以我现在对V4-Pro的定位很清晰:干粗活的性价比之王,但不适合跑复杂的Agent长链路。
代码扫描、安全审计、批量分析——这些一次性的、不需要多步连贯的任务,V4-Pro太合适了。几块钱就能扫描整个项目,同样的事让Claude Opus做,几十块打不住。
但如果你要的是"让AI自己跑30分钟把整个功能做完",还是老老实实用Claude Opus 4.7或者GPT-5.5。
# 一个实用的搭配思路
Opus 4.7那篇结尾我说过,目前我写代码性价比最高的是Claude Agent + CLI + GLM-5.1 (opens new window)。V4降价后,这个思路可以扩展一下:
便宜模型打前站,贵模型把关。
具体来说:
- 前期调研、文件搜索、代码扫描 → V4-Flash或V4-Pro,成本几乎忽略
- 安全审计、批量分析 → V4-Pro,便宜且单步能力够
- 核心编码、bug修复、长链路Agent → Claude Opus 4.7,贵但稳
不是非此即彼,是各取所长。V4-Pro负责"量大管饱",Claude负责"少而精"。
# 全行业涨价,DeepSeek凭什么降
聊完感受,说说降价背后的事。
2026年国内云厂商基本都在涨:百度4月18日AI算力上调5-30%,腾讯3月11日和5月9日两轮调价,智谱GLM系列三个月涨了三次。
DeepSeek不但不涨,反手一刀砍75%。凭什么?
国产算力。 V4系列首次实现了对华为昇腾NPU的全面适配。DeepSeek在技术论文里披露,细粒度专家并行方案同时在英伟达GPU和昇腾NPU上完成了验证。
官方API页面有一句话很关键:"受限于高端算力,目前V4-Pro的服务吞吐仍有限。预计下半年昇腾950超节点批量上市后,Pro价格会大幅下调。"
所以这次2.5折更像是预演。 先用低价验证市场,等昇腾950量产、算力成本真正降下来,这个价位才有望常态化。
这也是DeepSeek和其他厂商的根本区别——其他厂商的成本结构在恶化(依赖英伟达GPU,芯片紧缺+电力涨价),DeepSeek的成本结构在改善(国产算力替代,成本持续下降)。 涨价和降价,都是成本结构决定的。
# 几个容易踩的坑
1、1M上下文的模型名别写错。 开1M上下文要写deepseek-v4-pro[1m],不是deepseek-v4-pro。搞错了还是128K,白花了1M的钱。
2、5月5日特惠到期。 到期后价格大概率回升,但下半年昇腾950量产后有再次降价的预期。现在先用着,别以为这就是永久价。
3、长上下文检索能力在超128K后会下降。 MRCR评测在100万token下只有83.5,Claude Opus 4.6是92.9。日常用128K以内没影响,但如果你打算把整个代码仓库扔进去分析,要注意。
4、V4-Pro特惠期间吞吐有限。 高峰期响应可能比Claude慢,这是算力受限的直接表现,昇腾950量产后应该会改善。
# 写在最后
DeepSeek V4这次降价,放在全行业涨价的背景下,确实震撼。但卡哥还是那句话:别被价格冲昏头。
V4-Flash日常用,性价比无敌,这个没什么好犹豫的。V4-Pro特惠期做代码扫描、批量分析,成本几乎忽略,也很香。但Agent长任务,还是Claude和GPT更稳。 benchmark上的"编码天花板",到了真实开发场景里,可能只是"编码中等偏上"。这个在DeepSeek V4发布那篇里我说得很直白了。
趁2.5折充点余额,先把简单任务切过去,省下来的钱够你跑很多次Opus了。
加油
评论
验证登录状态...