卡码笔记-最强八股文
首页
计算机基础
C++
Java
Go
🔥大模型🔥
  • 大模型面经
  • Java面经
  • C++面经
简历专栏
代码随想录 (opens new window)
首页
计算机基础
C++
Java
Go
🔥大模型🔥
  • 大模型面经
  • Java面经
  • C++面经
简历专栏
代码随想录 (opens new window)
  • 本栏必读

    • 卡码大模型专栏介绍
  • 大模型面经

  • 大模型动态

    • DeepSeek V4发布
    • GPT-5.5发布
    • Claude Opus 4.7发布
    • DeepSeek V4降价75%实测
  • 入门认知

  • Prompt与调用基础

  • RAG检索增强

  • Agent智能体

  • 微调认知

  • 部署与工程化

  • 多模态入门

  • Transformer原理

  • 手撕Transformer

  • 模型家族与Llama架构

# DeepSeek V4降价75%:我接上Claude Code跑了几天,说说真实感受

前几天DeepSeek V4发布那篇,卡哥写的时候还在吐槽:"V4-Pro输出24元/百万token,这不像DeepSeek的风格。"

结果文章发出去不到一天,DeepSeek官网直接挂了2.5折——输出砍到6元。

这操作真的很DeepSeek。

降价这几天我拿V4-Pro和V4-Flash接上Claude Code实跑了一些项目,说说真实感受,不吹不黑。

# V4-Flash:2块钱跑百万token,还要啥自行车

先说结论:V4-Flash才是这次降价里大多数录友应该关注的。

不是V4-Pro不好,是V4-Flash太便宜了。每百万token输出2元,缓存命中输入0.2元。这是什么概念?你在Claude Code里让V4-Flash读10个文件、改3处代码、跑一轮测试,算下来可能就几毛钱。同样的事用Claude Sonnet,轻松几块钱。

V4-Flash直接平替上一代deepseek-chat,性能更强,输出价格反而从3元降到2元。迁移零成本,改个模型名就行。

我这几天的用法:简单问答、文件搜索、内容生成、初版代码编写,全丢给V4-Flash。这些场景不需要最强推理,便宜够用就是王道。

有一点要注意:deepseek-chat和deepseek-reasoner将在7月24日后停用。V4-Flash的模型名是deepseek-v4-flash,尽早切过去。

# V4-Pro:便宜归便宜,Agent长任务还是差点意思

V4-Pro特惠价确实炸裂——输出6元/百万token,缓存命中输入0.25元。和Claude Opus 4.7的$25输出价相比,差了将近30倍。

但便宜不等于能替代。

我接上Claude Code跑了一个比较大的重构任务,让V4-Pro读整个项目、理解架构、重写一个模块。结果怎么说呢——单步能力没问题,多步连贯性差一截。

具体表现:第一步读文件、分析结构,做得很好。第二步改代码,也还行。到第三步发现要调整之前的改动,就开始"忘"之前做了什么,改着改着就跑偏了。

这不是V4独有的问题。在DeepSeek V4发布那篇里我们聊过,Terminal Bench 2.0(测Agent长任务能力)V4-Pro只有67.9,GPT-5.5是82.7。数字上的差距,到了真实使用里就是"跑着跑着就飞了"。

所以我现在对V4-Pro的定位很清晰:干粗活的性价比之王,但不适合跑复杂的Agent长链路。

代码扫描、安全审计、批量分析——这些一次性的、不需要多步连贯的任务,V4-Pro太合适了。几块钱就能扫描整个项目,同样的事让Claude Opus做,几十块打不住。

但如果你要的是"让AI自己跑30分钟把整个功能做完",还是老老实实用Claude Opus 4.7或者GPT-5.5。

# 一个实用的搭配思路

Opus 4.7那篇结尾我说过,目前我写代码性价比最高的是Claude Agent + CLI + GLM-5.1 (opens new window)。V4降价后,这个思路可以扩展一下:

便宜模型打前站,贵模型把关。

具体来说:

  • 前期调研、文件搜索、代码扫描 → V4-Flash或V4-Pro,成本几乎忽略
  • 安全审计、批量分析 → V4-Pro,便宜且单步能力够
  • 核心编码、bug修复、长链路Agent → Claude Opus 4.7,贵但稳

不是非此即彼,是各取所长。V4-Pro负责"量大管饱",Claude负责"少而精"。

# 全行业涨价,DeepSeek凭什么降

聊完感受,说说降价背后的事。

2026年国内云厂商基本都在涨:百度4月18日AI算力上调5-30%,腾讯3月11日和5月9日两轮调价,智谱GLM系列三个月涨了三次。

DeepSeek不但不涨,反手一刀砍75%。凭什么?

国产算力。 V4系列首次实现了对华为昇腾NPU的全面适配。DeepSeek在技术论文里披露,细粒度专家并行方案同时在英伟达GPU和昇腾NPU上完成了验证。

官方API页面有一句话很关键:"受限于高端算力,目前V4-Pro的服务吞吐仍有限。预计下半年昇腾950超节点批量上市后,Pro价格会大幅下调。"

所以这次2.5折更像是预演。 先用低价验证市场,等昇腾950量产、算力成本真正降下来,这个价位才有望常态化。

这也是DeepSeek和其他厂商的根本区别——其他厂商的成本结构在恶化(依赖英伟达GPU,芯片紧缺+电力涨价),DeepSeek的成本结构在改善(国产算力替代,成本持续下降)。 涨价和降价,都是成本结构决定的。

# 几个容易踩的坑

1、1M上下文的模型名别写错。 开1M上下文要写deepseek-v4-pro[1m],不是deepseek-v4-pro。搞错了还是128K,白花了1M的钱。

2、5月5日特惠到期。 到期后价格大概率回升,但下半年昇腾950量产后有再次降价的预期。现在先用着,别以为这就是永久价。

3、长上下文检索能力在超128K后会下降。 MRCR评测在100万token下只有83.5,Claude Opus 4.6是92.9。日常用128K以内没影响,但如果你打算把整个代码仓库扔进去分析,要注意。

4、V4-Pro特惠期间吞吐有限。 高峰期响应可能比Claude慢,这是算力受限的直接表现,昇腾950量产后应该会改善。

# 写在最后

DeepSeek V4这次降价,放在全行业涨价的背景下,确实震撼。但卡哥还是那句话:别被价格冲昏头。

V4-Flash日常用,性价比无敌,这个没什么好犹豫的。V4-Pro特惠期做代码扫描、批量分析,成本几乎忽略,也很香。但Agent长任务,还是Claude和GPT更稳。 benchmark上的"编码天花板",到了真实开发场景里,可能只是"编码中等偏上"。这个在DeepSeek V4发布那篇里我说得很直白了。

趁2.5折充点余额,先把简单任务切过去,省下来的钱够你跑很多次Opus了。

加油

Last Updated: 4/30/2026, 11:54:17 AM

← Claude Opus 4.7发布 AI编程产品的三层架构 →

评论

验证登录状态...

侧边栏
夜间
卡码简历
代码随想录
卡码投递表🔥
2026群
添加客服微信 PS:通过微信后,请发送姓名-学校-年级-2026实习/校招
支持卡码笔记
鼓励/支持/赞赏Carl
1. 如果感觉本站对你很有帮助,也可以请Carl喝杯奶茶,金额大小不重要,心意已经收下
2. 希望大家都能梦想成真,有好的前程,加油💪