从 LLM 到 Agent：一次范式跃迁

CHAPTER 01

从 LLM 到 Agent —— 一次范式跃迁

理解 Agent 工程的第一步，是搞清楚：单独一个 LLM 为什么不能算 Agent？差的那一截，正是这篇文章接下来要讲的所有东西。

1.1 LLM 是什么 —— 一个"只会说话的天才大脑"

想象你雇了一位 IQ 180 的天才，但他被关在一座白屋子里：没有手机、没有电脑、没有同事，看不到外面的世界，也记不住昨天发生了什么。你只能从门缝塞一张纸条进去，他在纸条背面写完答案再塞出来。这就是裸 LLM 的工作方式 —— 你给它一段文字（prompt），它返回一段文字（completion）。仅此而已。

LLM 很强：它知识丰富、会推理、会写代码、会翻译、会分析。但它有几个先天缺陷，让它没办法独立完成"真实世界的任务"：

没有手脚：它不能打开浏览器、运行代码、读文件、发邮件。它只能在纸条上写"建议你执行 ls 命令"，但执行不了。
没有记忆：每次对话都是全新开始（只在当前 context 窗口里"记得"几千到几十万 token）。聊天软件里看到的"它记得我之前说过 X"，那是产品层把历史塞回 prompt 制造的幻觉。
没有执行边界：它说"我已经帮你解决了"，但其实没解决；它说"代码写好了"，但跑都没跑过。它对自己说的话不负责，因为它根本不知道现实里发生了什么。
会胡说八道（幻觉）：它把 token 拼接得很顺，但底下的事实可能是错的。

1.2 Agent 是什么 —— "员工"的雏形

Agent 这个词被用得很滥，但抓住一个核心定义就够了：

Agent = 一个 能感知环境、能调用工具、能持续推进多步任务、能自我修正 的 LLM 应用程序。

它不只回答你的问题，它会真的去把事情做完。

换个比喻：LLM 是天才大脑，Agent 是把这位天才请出白屋子、配上电脑、配上 IDE、配上日程表、配上一本"任务手册"和一位"主管"督促他干活的 完整员工。

1.3 为什么 2024-2026 是 Agent 的爆发窗口

Agent 概念早在 2023 年就有 AutoGPT、BabyAGI 之类的早期玩具，但它们做不成事，因为模型本身的两个能力还不够强：

长上下文：早期 LLM 上下文只有 4K-8K tokens，连"读完一份需求文档 + 留出推理空间"都做不到，更别说在文档里反复跳转。GPT-4 (128K)、Claude 3 (200K)、Gemini (1M+) 把这个瓶颈打开了。
函数调用 / Tool Use 的稳定性：让 LLM 输出结构化 JSON 调工具，2023 年还经常出错。到 2024 年中之后，主流模型已经能稳定输出格式正确的工具调用，"Agent 真去执行动作"这件事在工程上才变得可行。

到了 2025 年下半到 2026 年初，行业突然意识到一件事：模型够用之后，瓶颈不在模型，在工程。这就是接下来"Harness 工程"这个词开始火起来的背景。

💡

一句话总结：LLM 是大脑，Agent 是带着大脑的员工。员工 - 大脑 = ？这个差值，就是 Harness。

CHAPTER 02

什么是 Harness —— 模型之外的"那一切"

Harness 这个词从马具借来：给马套上的笼头、缰绳、马鞍。它不让马跑得更快，但让马为你拉车。

2.1 这个词从哪来的

2026 年 3 月，LangChain 的 Vivek Trivedy 在博客《The Anatomy of an Agent Harness》里给出了被广为引用的边界定义：

"If you're not the model, you're the harness."

—— 凡是不属于"模型权重"的部分，全都属于 Harness。
Vivek Trivedy, LangChain Blog, 2026-03-10

几乎同时，Thoughtworks 的 Birgitta Böckeler 在 Martin Fowler 个人专栏发了《Harness engineering for coding agent users》，把 Harness 总结为两类机制的集合：

"Harness = Guides + Sensors"

Guides 是给模型套的引导（系统提示词、工具描述、规则、流程模板）；Sensors 是让模型知道现实正在发生什么的反馈（编译错误、测试结果、文件系统变化、用户回复）。
Birgitta Böckeler, Martin Fowler 博客, 2026-04-02

Anthropic 把 Claude Code 直接称为一个 harness。GitHub Copilot 的 Agent 模式、Cursor、Cline、Aider 全都是 harness。它们用的模型互相重叠（很多都接 Claude / GPT），但产品体验差很大 —— 差的就是 harness 工程。

2.2 一个直观比喻：员工 = 大脑 + 马具

把上一章的"员工"比喻接下来：

合格的 Agent = 大脑（LLM） + 马具（Harness）

马具拆开看是这些东西：

工号、权限卡：身份与权限 —— 它能代表谁？能做哪些事？
办公桌、电脑、内网：沙箱与运行时 —— 它在哪里干活？怎么和外界交互？
邮箱、IDE、各种内部系统：工具与技能 —— 它有哪些"手"？
笔记本、文件柜、企业 wiki：记忆系统 —— 它怎么记住该记的，忘掉该忘的？
SOP 流程、主管：编排与控制流 —— 它按什么顺序推进任务？
打卡机、季度评审：观测与评测 —— 怎么知道它干得好不好？
权限审计、合规红线：安全与对齐 —— 它会不会做坏事？

2.3 一个反直觉的事实：Harness 改一行，效果翻 10 倍

这个章节的最后留一个让小白记一辈子的故事，用来证明 harness 工程不是"配角工作"。

2026 年初，研究者 Can Bölük 做了一个实验：保持模型完全不变（Grok Code Fast 1），只把 SWE-bench 评测里 Agent 的 edit 工具实现做了一处替换 —— 从基于 str_replace 的精确字符串替换，改成基于 hashline（行号哈希）的差量编辑。其他什么都没动。

结果：在 SWE-bench 上的解题成功率 从 6.7% 暴涨到 68.3%。一个工具实现的换法，让同一个模型从"基本不能用"变成"达到 SOTA 水准"。这就是 harness 工程的威力 —— 它不是给模型锦上添花，它直接决定了 Agent 能不能干活。

✦

记住这条心法：当你的 Agent 表现差，先怀疑 harness，再怀疑模型。模型很难换，harness 全是你能改的。