MCP 终极指南——从协议原理到 Agent 实现全解析
MCP 终极指南——从协议原理到 Agent 实现全解析 素材来源:B站「马克的技术工作坊」三集视频 基础篇 · 进阶篇 · 番外篇 · 抓包分析 本文在视频内容基础上做了结构化梳理,并对讲解中若干不够准确或已过时的部分做了修订与补充(文中以 ⚠️ 勘误 / 补充 标注)。 一、先讲结论:一句话搞懂 MCP MCP = 让大模型能够”发现并调用外部工具”的标准协议。 全称 Model Context Protocol(模型上下文协议),由 Anthropic 于 2024 年 11 月 25 日发布。名字听起来玄乎,拆开说其实就两件事: 注册:让宿主程序(MCP Host)知道 MCP Server 提供了哪些函数 调用:让宿主能按规范调用这些函数、拿回结果 ⚠️ 补充澄清:视频一再强调”名字取得不好,有误导性”,但更准确的说法是——MCP 提供的”上下文”是指工具、资源、提示词这些”模型可以感知和使用的外部信息”,是给模型提供”环境感知能力”的统一抽象,而不只是”函数调用协议”。这也是 MCP 规范中同时定义了 Tools / Resource...
RAG 工作机制详解——一个高质量知识库背后的技术全流程
RAG 工作机制详解——一个高质量知识库背后的技术全流程 原视频来源:B站 · 马克的技术工作坊本文为视频内容的结构化整理与延展讲解,方便收藏查阅。 如果你想做一个靠谱的知识客服,或者搭建一个能回答问题的知识库,那就一定绕不开一个技术——RAG。 它的全称是 Retrieval Augmented Generation,翻译过来就是”检索增强生成”。听起来挺高大上,但说白了就两件事: 先从资料库里检索相关的内容 再基于这些内容来生成答案 先检索、再生成,所以叫做”检索增强生成”。它是目前最常用的 AI 问答方案之一,企业内的知识助手、智能客服用的都是这项技术。 一、为什么需要 RAG假设你想做一个能回答公司产品问题的智能客服。 最直接的想法是:客服内部接一个 LLM(比如 GPT-4o、DeepSeek),每次把产品手册一起发给模型就行。这确实是一种方案,但如果手册有上百页甚至上千页,就会带来三个严重问题: 问题 说明 上下文窗口不够 每个模型只能容纳一定量的信息(上下文窗口),手册过长会导致”读了后面忘前面” 推理成本高 输入越多,Token 消耗越大,...
Harness Engineering 完全指南:从提示词工程到驾驭工程的范式跃迁
视频来源:《Harness Engineering 是什么?和提示词工程和上下文工程有什么关系?》 — UP主:小白debug(硅基文明简史系列) 核心一句话:AI 开发的本质,不是调用模型,而是围绕模型构建一个可约束、可记忆、可执行、可反馈、可编排的”驾驭外壳”。 本文以”小白debug”视频为主线重新组织,纠正了个别表述,并补充了视频中未深入讨论但同样重要的工程细节、业界实战和开源项目。 一、一个直击灵魂的问题 为什么同样用的是 Claude 3.5 / GPT-4,换一个 AI IDE,效果差距能这么大? 有了 AI,程序员是不是就不写代码了?那改写什么? 要回答这两个问题,必须把 Prompt Engineering、Context Engineering、Harness Engineering 三个概念串起来看。它们不是互相替代,而是层层嵌套、逐级包裹。 包含关系:Prompt Engineering ⊂ Context Engineering ⊂ Harness Engineering 二、回到原点:大模型本质上在做什么?剥开 ChatGPT、...
Token 到底是什么?揭秘大模型背后的"文字压缩术"
Token 到底是什么?揭秘大模型背后的”文字压缩术” 本文整理自 B 站 UP 主 马克的技术工作坊 的视频 《Token 到底是什么?—— 揭秘大模型背后的”文字压缩术”》(20.3 万播放),并补充了额外的知识点和实践建议。 你可能每天都在用大模型,但如果我问你:40 万 Context Window,到底能装多少内容? 你能准确回答吗? 大多数人对 Token 的理解停留在”大概就是字”——但这个模糊的认知,会让你在写 Prompt、算成本、管 Context 的时候踩一堆坑。 一、大模型的基本工作原理在理解 Token 之前,先快速回顾大模型是怎么工作的: 1用户输入文本 → Tokenizer 编码为数字 → 模型处理 → 预测下一个 Token → Tokenizer 解码为文字 大模型只认识数字,不认识文字。所以需要一个”翻译官”在文字和数字之间来回转换——这就是 Tokenizer(分词器)。 而 Token,就是 Tokenizer 切分出来的最小文本片段。 二、Token 的本质2.1 Token ≠ 字 ≠ 词Token 是大模型处理文本的最小基本...
Claude Code 从 0 到 1 全攻略:MCP / SubAgent / Skill / Hook 完全指南
Claude Code 从 0 到 1 全攻略 本文整理自 B 站 UP 主 马克的技术工作坊 的视频 《Claude Code 从 0 到 1 全攻略》(84.9 万播放),并补充了额外的知识点和实践建议。 Claude Code 是 Anthropic 推出的命令行 AI 编程助手,它不只是”让 AI 写代码”,更是一个能读取代码库、编辑文件、运行命令、调用外部工具的完整编程 Agent。 本文将从安装到高级定制,系统梳理它的全部核心能力。 一、环境搭建与安装1.1 安装12345# 官方推荐方式npm install -g @anthropic-ai/claude-code# 或使用官方安装脚本curl -fsSL https://claude.ai/install.sh | bash 补充: 如果安装慢,可使用镜像源: 1npm install -g @anthropic-ai/claude-code --registry=https://registry.npmmirror.com 1.2 启动与登录123456# 进入项目目录后启动cd your-projec...
从 LLM 到 Agent Skill:一文打通 AI 底层逻辑
从 LLM 到 Agent Skill:一文打通 AI 底层逻辑 本文整理自 B 站 UP 主 马克的技术工作坊 的视频 《从 LLM 到 Agent Skill,一期视频带你打通底层逻辑!》,并补充了额外的知识点和个人理解。 AI 领域每天都在冒新名词:LLM、Token、Prompt、Agent、Agent Skill……这些词你可能都听过,但你真的能准确说出每个概念的确切含义吗? 本文不讲商业概念,而是从底层工程视角,将这些概念逐一拆解,帮你建立完整的认知框架。 一、LLM(Large Language Model,大语言模型)是什么大语言模型,简称大模型。目前绝大多数大模型基于 Google 团队 2017 年提出的 Transformer 架构。 发展简史 时间 里程碑 2017 Google 发表 “Attention is All You Need”,提出 Transformer 2022.11 OpenAI 发布 GPT-3.5 (ChatGPT),首个真正可用的大模型 2023.03 GPT-4 发布,拉高能力天花板 2023-2026...
AI 设计模式完全指南
AI 设计模式完全指南 用最简单的语言,讲清楚 AI 领域最核心的设计模式。每个模式都回答三个问题:是什么?什么时候用?怎么理解? 一、Prompt 设计模式1. Chain of Thought (CoT)是什么: 让 LLM “一步一步思考”,而不是直接给答案。通过在 prompt 中引导模型展示推理过程,提升复杂任务的准确性。 什么时候用: 数学推理、逻辑分析、多步决策等需要推理链的场景。 2. Few-Shot Prompting是什么: 在 prompt 中提供几个示例(输入→输出对),让模型通过类比学习来处理新任务。 什么时候用: 格式化输出、分类任务、风格迁移等需要明确输出模式的场景。 3. Prompt Chaining是什么: 将一个复杂任务拆分成多个子 prompt,前一个的输出作为后一个的输入,形成流水线。 什么时候用: 复杂文档处理、多阶段生成、需要中间校验的工作流。 二、Agent 设计模式4. ReAct (Reasoning + Acting)是什么: 让 Agent 交替进行”推理”和”行动”。先思考下一步该做什么,再执行动作,观察结果后继续推理...
Some Articles
文章归档 分享一个很好用的文档工具,功能真的超级齐全。样式也很奈斯! 我的主页 后续的一些文章的更新以及分享也会直接在飞书文档中更新
CompletableFuture
CompletableFuture 用法详解解原理介绍 Java 文档说明,创建线程的方式只有两种:继承 Thread 或者实现 Runnable 接口,具体源码说明如下 12345678910111213141516171819202122232425262728293031// 继承 Thread 类 class PrimeThread extends Thread { long minPrime; PrimeThread(long minPrime) { this.minPrime = minPrime; } public void run() { // compute primes larger than minPrime . . . } } // The following code would then create a thr...
spring design patterns
Spring源码中的设计模式设计模式的七大原则设计原则名称定 义使用频率单一职责原则 (Single Responsibility Principle, SRP)一个类只负责一个功能领域中的相应职责★★★★☆开闭原则 (Open-Closed Principle, OCP)软件实体应对扩展开放,而对修改关闭★★★★★里氏代换原则 (Liskov Substitution Principle, LS 完整内容请参考原始 HTML 文件










