Lizi

发表于2026-05-12|更新于2026-05-12|移动开发iOS 项目|iOS•SwiftUI•LLM•飞书多维表格•个人项目

一句话，一张图，一笔账。这是 CoinFlow 的核心理念，也是我做这个 App 的初衷：把记账的摩擦降到最低。 GitHub: https://github.com/Dovelizi/CoinFlow 为什么再做一个记账 App记账类 App 我用过不下五款。每次都用不过两周，原因其实只有一个：录入门槛太高。打开 App、找分类、敲金额、选日期……一笔账三十秒，谁顶得住？更别说大部分 App 把你的数据锁在自己的服务器里，想看个长期统计还得开会员。所以我想做的事很简单：录入要快：截个图、说一句话就能记数据归我：本地加密 + 云端同步到我自己的飞书多维表格解析要准：LLM + 规则引擎双保险，最差也能识别金额和分类三种记账方式1. 截图记账：丢张支付截图进来就行支付宝、微信、抖音、银行 App 的支付成功页，截下来直接发给 CoinFlow。它会自动识别金额、商户、时间、分类。实现思路是三档路由：先用 iOS 自带的 Vision 本地识别，confidence 不够再走视觉 LLM，再不行就让用户手填。这样断网、API 挂了都能用。还做了一个...

MCP 终极指南——从协议原理到 Agent 实现全解析

发表于2026-04-22|更新于2026-04-22|AI & 大模型MCP|AI•Agent•MCP•LLM•Cline•ReAct•Tool Calling

MCP 终极指南——从协议原理到 Agent 实现全解析素材来源：B站「马克的技术工作坊」三集视频基础篇 · 进阶篇 · 番外篇 · 抓包分析本文在视频内容基础上做了结构化梳理，并对讲解中若干不够准确或已过时的部分做了修订与补充（文中以 ⚠️ 勘误 / 补充标注）。一、先讲结论：一句话搞懂 MCP MCP = 让大模型能够”发现并调用外部工具”的标准协议。全称 Model Context Protocol（模型上下文协议），由 Anthropic 于 2024 年 11 月 25 日发布。名字听起来玄乎，拆开说其实就两件事：注册：让宿主程序（MCP Host）知道 MCP Server 提供了哪些函数调用：让宿主能按规范调用这些函数、拿回结果 ⚠️ 补充澄清：视频一再强调”名字取得不好，有误导性”，但更准确的说法是——MCP 提供的”上下文”是指工具、资源、提示词这些”模型可以感知和使用的外部信息”，是给模型提供”环境感知能力”的统一抽象，而不只是”函数调用协议”。这也是 MCP 规范中同时定义了 Tools / Resource...

RAG 工作机制详解——一个高质量知识库背后的技术全流程

发表于2026-04-21|更新于2026-04-21|AI & 大模型RAG|AI•RAG•LLM•知识库•Embedding•向量数据库

RAG 工作机制详解——一个高质量知识库背后的技术全流程原视频来源：B站 · 马克的技术工作坊本文为视频内容的结构化整理与延展讲解，方便收藏查阅。如果你想做一个靠谱的知识客服，或者搭建一个能回答问题的知识库，那就一定绕不开一个技术——RAG。它的全称是 Retrieval Augmented Generation，翻译过来就是”检索增强生成”。听起来挺高大上，但说白了就两件事：先从资料库里检索相关的内容再基于这些内容来生成答案先检索、再生成，所以叫做”检索增强生成”。它是目前最常用的 AI 问答方案之一，企业内的知识助手、智能客服用的都是这项技术。一、为什么需要 RAG假设你想做一个能回答公司产品问题的智能客服。最直接的想法是：客服内部接一个 LLM（比如 GPT-4o、DeepSeek），每次把产品手册一起发给模型就行。这确实是一种方案，但如果手册有上百页甚至上千页，就会带来三个严重问题：问题说明上下文窗口不够每个模型只能容纳一定量的信息（上下文窗口），手册过长会导致”读了后面忘前面” 推理成本高输入越多，Token 消耗越大，...

Harness Engineering 完全指南：从提示词工程到驾驭工程的范式跃迁

发表于2026-04-11|更新于2026-04-22|AI & 大模型概念解析|AI•Prompt Engineering•Agent•MCP•开发工具•Harness Engineering•Context Engineering

视频来源：《Harness Engineering 是什么？和提示词工程和上下文工程有什么关系？》 — UP主：小白debug（硅基文明简史系列）核心一句话：AI 开发的本质，不是调用模型，而是围绕模型构建一个可约束、可记忆、可执行、可反馈、可编排的”驾驭外壳”。本文以”小白debug”视频为主线重新组织，纠正了个别表述，并补充了视频中未深入讨论但同样重要的工程细节、业界实战和开源项目。一、一个直击灵魂的问题为什么同样用的是 Claude 3.5 / GPT-4，换一个 AI IDE，效果差距能这么大？有了 AI，程序员是不是就不写代码了？那改写什么？要回答这两个问题，必须把 Prompt Engineering、Context Engineering、Harness Engineering 三个概念串起来看。它们不是互相替代，而是层层嵌套、逐级包裹。包含关系：Prompt Engineering ⊂ Context Engineering ⊂ Harness Engineering 二、回到原点：大模型本质上在做什么？剥开 ChatGPT、...

Token 到底是什么？揭秘大模型背后的"文字压缩术"

发表于2026-04-11|更新于2026-04-11|AI & 大模型概念解析|AI•LLM•Token•BPE•Tokenizer

Token 到底是什么？揭秘大模型背后的”文字压缩术” 本文整理自 B 站 UP 主马克的技术工作坊的视频《Token 到底是什么？—— 揭秘大模型背后的”文字压缩术”》（20.3 万播放），并补充了额外的知识点和实践建议。你可能每天都在用大模型，但如果我问你：40 万 Context Window，到底能装多少内容？你能准确回答吗？大多数人对 Token 的理解停留在”大概就是字”——但这个模糊的认知，会让你在写 Prompt、算成本、管 Context 的时候踩一堆坑。一、大模型的基本工作原理在理解 Token 之前，先快速回顾大模型是怎么工作的： 1用户输入文本 → Tokenizer 编码为数字 → 模型处理 → 预测下一个 Token → Tokenizer 解码为文字大模型只认识数字，不认识文字。所以需要一个”翻译官”在文字和数字之间来回转换——这就是 Tokenizer（分词器）。而 Token，就是 Tokenizer 切分出来的最小文本片段。二、Token 的本质2.1 Token ≠ 字 ≠ 词Token 是大模型处理文本的最小基本...

Claude Code 从 0 到 1 全攻略：MCP / SubAgent / Skill / Hook 完全指南

发表于2026-04-11|更新于2026-04-11|AI & 大模型AI 工具实战|AI•Agent•Claude Code•MCP•开发工具•Skill

Claude Code 从 0 到 1 全攻略本文整理自 B 站 UP 主马克的技术工作坊的视频《Claude Code 从 0 到 1 全攻略》（84.9 万播放），并补充了额外的知识点和实践建议。 Claude Code 是 Anthropic 推出的命令行 AI 编程助手，它不只是”让 AI 写代码”，更是一个能读取代码库、编辑文件、运行命令、调用外部工具的完整编程 Agent。本文将从安装到高级定制，系统梳理它的全部核心能力。一、环境搭建与安装1.1 安装12345# 官方推荐方式npm install -g @anthropic-ai/claude-code# 或使用官方安装脚本curl -fsSL https://claude.ai/install.sh | bash 补充：如果安装慢，可使用镜像源： 1npm install -g @anthropic-ai/claude-code --registry=https://registry.npmmirror.com 1.2 启动与登录123456# 进入项目目录后启动cd your-projec...

从 LLM 到 Agent Skill：一文打通 AI 底层逻辑

发表于2026-04-11|更新于2026-04-11|AI & 大模型概念解析|AI•Agent•MCP•LLM•Token•Prompt

从 LLM 到 Agent Skill：一文打通 AI 底层逻辑本文整理自 B 站 UP 主马克的技术工作坊的视频《从 LLM 到 Agent Skill，一期视频带你打通底层逻辑！》，并补充了额外的知识点和个人理解。 AI 领域每天都在冒新名词：LLM、Token、Prompt、Agent、Agent Skill……这些词你可能都听过，但你真的能准确说出每个概念的确切含义吗？本文不讲商业概念，而是从底层工程视角，将这些概念逐一拆解，帮你建立完整的认知框架。一、LLM（Large Language Model，大语言模型）是什么大语言模型，简称大模型。目前绝大多数大模型基于 Google 团队 2017 年提出的 Transformer 架构。发展简史时间里程碑 2017 Google 发表 “Attention is All You Need”，提出 Transformer 2022.11 OpenAI 发布 GPT-3.5 (ChatGPT)，首个真正可用的大模型 2023.03 GPT-4 发布，拉高能力天花板 2023-2026...

AI 设计模式完全指南

发表于2026-04-11|更新于2026-04-11|AI & 大模型设计模式|AI•Prompt Engineering•Agent•设计模式•RAG

AI 设计模式完全指南用最简单的语言，讲清楚 AI 领域最核心的设计模式。每个模式都回答三个问题：是什么？什么时候用？怎么理解？一、Prompt 设计模式1. Chain of Thought (CoT)是什么：让 LLM “一步一步思考”，而不是直接给答案。通过在 prompt 中引导模型展示推理过程，提升复杂任务的准确性。什么时候用：数学推理、逻辑分析、多步决策等需要推理链的场景。 2. Few-Shot Prompting是什么：在 prompt 中提供几个示例（输入→输出对），让模型通过类比学习来处理新任务。什么时候用：格式化输出、分类任务、风格迁移等需要明确输出模式的场景。 3. Prompt Chaining是什么：将一个复杂任务拆分成多个子 prompt，前一个的输出作为后一个的输入，形成流水线。什么时候用：复杂文档处理、多阶段生成、需要中间校验的工作流。二、Agent 设计模式4. ReAct (Reasoning + Acting)是什么：让 Agent 交替进行”推理”和”行动”。先思考下一步该做什么，再执行动作，观察结果后继续推理...

Some Articles

发表于2023-07-09|更新于2026-04-11|资源与收藏|收藏•资源分享•飞书

文章归档分享一个很好用的文档工具，功能真的超级齐全。样式也很奈斯！我的主页后续的一些文章的更新以及分享也会直接在飞书文档中更新

CompletableFuture

发表于2023-07-09|更新于2026-04-11|Java 后端并发与多线程|Java•并发编程•CompletableFuture•异步

CompletableFuture 用法详解解原理介绍 Java 文档说明，创建线程的方式只有两种：继承 Thread 或者实现 Runnable 接口，具体源码说明如下 12345678910111213141516171819202122232425262728293031// 继承 Thread 类 class PrimeThread extends Thread { long minPrime; PrimeThread(long minPrime) { this.minPrime = minPrime; } public void run() { // compute primes larger than minPrime . . . } } // The following code would then create a thr...