# 卡码大模型
本专栏持续更新中,目前最新文章发布在公众号:卡码大模型

我在知识星球 (opens new window)里辅导过太多录友,对每年求职变化非常了解。
现在无论你是做Java后端、C++开发、还是Go开发,大模型相关的知识已经不是"加分项"了,越来越多公司的JD里加了一行:"有大模型相关经验优先"。
但大模型方向太新了,没有标准教材,没有成熟路线。网上文章要么太浅——跟着教程跑个Demo就完了;要么太深——上来就推公式推导,应用开发者根本用不上。
中间地带是空的。
卡码大模型,填的就是这个空。
# 这个专栏讲什么
应用开发者需要懂的,讲清楚
算法岗才需要深挖的,点到为止就行。
本专栏不是零散文章堆砌,是一条从"会用"到"懂原理"的完整学习路径。
讲解风格将延续【代码随想录】 (opens new window)的风格,循序渐进,把大模型时代,大家作为一名开发人员,需要掌握的知识,给大家讲清楚。
# 大模型应用开发全链路
# 第一章:入门认知
搞清楚大模型是什么、岗位怎么选、应用开发到底在做什么。
- 大模型关键词全解:从Prompt到Agent到MCP,一篇搞懂13个核心概念
- AI编程产品的三层架构
- 大模型应用开发、算法岗、开发岗什么区别
- 大模型应用开发到底在做什么
- 大模型API到底怎么计费
- 大模型蒸馏到底是什么?硬蒸、软蒸、蒸馏其他厂商模型,一篇讲明白
# 第二章:Prompt与调用基础
从"会聊天"到"会开发",掌握和大模型交互的基础能力。
- 从聊天框到业务系统:一个请求是怎么被大模型处理的
- 结构化输出:JSON Schema怎么约束
- 同步、异步、流式输出怎么选
- Function Calling详解:大模型怎么调用工具
- Prompt Engineering不是"写提示词":结构化Prompt设计(即将更新)
- Few-shot、CoT、自我反思:让大模型按你的方式思考(即将更新)
- Token、成本与延迟:大模型应用的三个硬约束(即将更新)
# 第三章:RAG检索增强
掌握RAG全链路,从原理到优化到评估,能独立设计和面试回答。
- 为什么有了大模型还需要RAG
- RAG完整链路拆解:离线阶段和在线阶段
- Embedding是什么:语义压缩与模型选型
- 向量数据库解决了什么问题
- RAG切片策略:四种方式对比
- RAG系统答不准的常见问题排查
- RAG优化思路:Query改写到Context压缩
- 更多文章持续更新中……
# 第四章:Agent智能体
理解Agent的设计思路、工程挑战和评估方法。
- Agent到底是什么?和普通大模型问答有什么区别?
- ReAct、Reflection、规划执行:Agent三种常见思路怎么选?
- Agent vs Workflow:什么时候根本不需要Agent?
- 更多文章持续更新中……
# 第五章:微调认知
不亲手训,但要懂选型边界。面试必问。
- 持续更新中……
# 第六章:部署与工程化
从Demo到生产的关键一步,工程化能力是应用开发者的核心竞争力。
- 部署、推理、压测核心指标
- 更多文章持续更新中……
# 第七章:多模态入门
不只是文本,了解多模态的原理、场景和工程挑战。
- 持续更新中……
# 第八章:Transformer原理
拆开大模型看看里面是什么,从应用开发者视角理解Transformer。
- 为什么都绕不开Transformer
- 数据流动全解析:从输入到输出每一步
- 三种架构详解与对比
- Attention机制:Q、K、V是什么
- Attention计算全过程一步步拆解
- Multi-Head Attention:为什么一个头不够
- 位置编码:Transformer为什么必须知道顺序
- 残差连接、LayerNorm、FFN:缺一不可的配角
- 一层Transformer Block长什么样
# 第九章:手撕Transformer
用最简代码实现每个组件,加深理解,面试手撕有底气。
- 手撕Attention:不依赖框架从零实现注意力机制
- 手撕Multi-Head Attention:从单头扩展到多头
- 手撕LayerNorm与残差连接
- 手撕FFN:前馈网络代码实现
- 手撕Transformer Block:把组件拼起来
- 手撕Tiny Transformer:从零拼出完整模型
# 第十章:模型家族与Llama架构
从标准Transformer进化到主流模型架构,学会读技术报告。
- 持续更新中……
# 第十一章:大模型动态
大模型领域实时动态与产品分析。
# 每日更新
每日更新首发在公众号「卡码大模型」,定期同步至网站。

扫码关注,每日更新不错过。
大模型面经汇总 →
评论
验证登录状态...