基础知识

从 LLM 到 Agent:一次范式跃迁

为什么 2024 年中之后,AI 开始能真正干活 —— LLM、Agent、Harness 三个核心概念的入门解释。

作者 栗子 更新于 2026 年 5 月 约 8 分钟
CHAPTER 01

从 LLM 到 Agent —— 一次范式跃迁

理解 Agent 工程的第一步,是搞清楚:单独一个 LLM 为什么不能算 Agent?差的那一截,正是这篇文章接下来要讲的所有东西。

1.1 LLM 是什么 —— 一个"只会说话的天才大脑"

想象你雇了一位 IQ 180 的天才,但他被关在一座白屋子里:没有手机、没有电脑、没有同事,看不到外面的世界,也记不住昨天发生了什么。你只能从门缝塞一张纸条进去,他在纸条背面写完答案再塞出来。 这就是裸 LLM 的工作方式 —— 你给它一段文字(prompt),它返回一段文字(completion)。仅此而已。

LLM 很强:它知识丰富、会推理、会写代码、会翻译、会分析。但它有几个先天缺陷,让它没办法独立完成"真实世界的任务":

  • 没有手脚:它不能打开浏览器、运行代码、读文件、发邮件。它只能在纸条上写"建议你执行 ls 命令",但执行不了。
  • 没有记忆:每次对话都是全新开始(只在当前 context 窗口里"记得"几千到几十万 token)。聊天软件里看到的"它记得我之前说过 X",那是产品层把历史塞回 prompt 制造的幻觉。
  • 没有执行边界:它说"我已经帮你解决了",但其实没解决;它说"代码写好了",但跑都没跑过。它对自己说的话不负责,因为它根本不知道现实里发生了什么。
  • 会胡说八道(幻觉):它把 token 拼接得很顺,但底下的事实可能是错的。

1.2 Agent 是什么 —— "员工"的雏形

Agent 这个词被用得很滥,但抓住一个核心定义就够了:

Agent = 一个 能感知环境、能调用工具、能持续推进多步任务、能自我修正 的 LLM 应用程序。

它不只回答你的问题,它会真的去把事情做完。

换个比喻:LLM 是天才大脑,Agent 是把这位天才请出白屋子、配上电脑、配上 IDE、配上日程表、配上一本"任务手册"和一位"主管"督促他干活的 完整员工

1.3 为什么 2024-2026 是 Agent 的爆发窗口

Agent 概念早在 2023 年就有 AutoGPT、BabyAGI 之类的早期玩具,但它们做不成事,因为模型本身的两个能力还不够强:

  1. 长上下文:早期 LLM 上下文只有 4K-8K tokens,连"读完一份需求文档 + 留出推理空间"都做不到,更别说在文档里反复跳转。GPT-4 (128K)、Claude 3 (200K)、Gemini (1M+) 把这个瓶颈打开了。
  2. 函数调用 / Tool Use 的稳定性:让 LLM 输出结构化 JSON 调工具,2023 年还经常出错。到 2024 年中之后,主流模型已经能稳定输出格式正确的工具调用,"Agent 真去执行动作"这件事在工程上才变得可行。

到了 2025 年下半到 2026 年初,行业突然意识到一件事:模型够用之后,瓶颈不在模型,在工程。这就是接下来"Harness 工程"这个词开始火起来的背景。

💡

一句话总结:LLM 是大脑,Agent 是带着大脑的员工。员工 - 大脑 = ?这个差值,就是 Harness。

CHAPTER 02

什么是 Harness —— 模型之外的"那一切"

Harness 这个词从马具借来:给马套上的笼头、缰绳、马鞍。它不让马跑得更快,但让马为你拉车。

2.1 这个词从哪来的

2026 年 3 月,LangChain 的 Vivek Trivedy 在博客《The Anatomy of an Agent Harness》里给出了被广为引用的边界定义:

"If you're not the model, you're the harness."

—— 凡是不属于"模型权重"的部分,全都属于 Harness。

Vivek Trivedy, LangChain Blog, 2026-03-10

几乎同时,Thoughtworks 的 Birgitta Böckeler 在 Martin Fowler 个人专栏发了《Harness engineering for coding agent users》,把 Harness 总结为两类机制的集合:

"Harness = Guides + Sensors"

Guides 是给模型套的引导(系统提示词、工具描述、规则、流程模板);Sensors 是让模型知道现实正在发生什么的反馈(编译错误、测试结果、文件系统变化、用户回复)。

Birgitta Böckeler, Martin Fowler 博客, 2026-04-02

Anthropic 把 Claude Code 直接称为一个 harness。GitHub Copilot 的 Agent 模式、Cursor、Cline、Aider 全都是 harness。它们用的模型互相重叠(很多都接 Claude / GPT),但产品体验差很大 —— 差的就是 harness 工程。

2.2 一个直观比喻:员工 = 大脑 + 马具

把上一章的"员工"比喻接下来:

合格的 Agent = 大脑(LLM) + 马具(Harness)

马具拆开看是这些东西:

  • 工号、权限卡:身份与权限 —— 它能代表谁?能做哪些事?
  • 办公桌、电脑、内网:沙箱与运行时 —— 它在哪里干活?怎么和外界交互?
  • 邮箱、IDE、各种内部系统:工具与技能 —— 它有哪些"手"?
  • 笔记本、文件柜、企业 wiki:记忆系统 —— 它怎么记住该记的,忘掉该忘的?
  • SOP 流程、主管:编排与控制流 —— 它按什么顺序推进任务?
  • 打卡机、季度评审:观测与评测 —— 怎么知道它干得好不好?
  • 权限审计、合规红线:安全与对齐 —— 它会不会做坏事?

2.3 一个反直觉的事实:Harness 改一行,效果翻 10 倍

这个章节的最后留一个让小白记一辈子的故事,用来证明 harness 工程不是"配角工作"。

2026 年初,研究者 Can Bölük 做了一个实验:保持模型完全不变(Grok Code Fast 1),只把 SWE-bench 评测里 Agent 的 edit 工具实现做了一处替换 —— 从基于 str_replace 的精确字符串替换,改成基于 hashline(行号哈希)的差量编辑。其他什么都没动。

结果:在 SWE-bench 上的解题成功率 从 6.7% 暴涨到 68.3%。一个工具实现的换法,让同一个模型从"基本不能用"变成"达到 SOTA 水准"。这就是 harness 工程的威力 —— 它不是给模型锦上添花,它直接决定了 Agent 能不能干活。

记住这条心法:当你的 Agent 表现差,先怀疑 harness,再怀疑模型。模型很难换,harness 全是你能改的。

💡 阅读小贴士:蓝色虚线下划线的词都是术语,点击查看通俗解释。