一篇文章讲清楚 AI Agent 的核心概念：从 Model、Tool、Skill 到 Harness工程

张开发

• 2026/6/5 18:34:01 • 15 分钟阅读

分享文章

一篇文章讲清楚 AI Agent 的核心概念：从 Model、Tool、Skill 到 Harness工程

AI Agent 是这两年最常被提到的 AI 词之一。做模型的人在讲做产品的人在讲做应用的人也在讲。但问题是同样是“Agent”很多人说的并不是同一件事。有人把“会调用工具的大模型”叫 Agent有人把“驱动模型执行的整套系统”叫 Agent也有人把“负责某个子任务的小模块”叫 Agent。如果刚接触这个方向很容易越看越乱。不是资料太少而是术语越来越多大家却未必在用同一套定义。最近Hugging Face 发布了一份 AI Agent 术语表系统梳理了这波讨论里最常出现的一批核心概念。博客地址https://huggingface.co/blog/agent-glossary无论你是在构建 Agent、部署 Agent还是只是日常使用 Claude Code、Codex 或 Hermes Agent 这类工具这些词几乎都会反复遇到。文章最后还单独补充了一组和模型训练相关的概念如果你关注训练流程那一部分会更有参考价值。一、先讲最重要的一句Agent 不是一个模型可以先用一句最容易记住的话来理解 AI AgentAI Agent 是一个以大模型为核心、能够调用工具、接收反馈并持续完成任务的系统。这里最关键的词不是“生成文本”而是“持续完成任务”。普通聊天模型更像“你问一句我答一句”Agent 更像“你给我一个目标我先理解任务再决定下一步做什么做完一步后我再根据结果继续往下走”。比如下面这些事都不是一次回答就能完成的帮你搜索资料并整理成摘要帮你读取一个文件并分析内容帮你调用代码工具处理数据帮你在网页上完成一连串操作这也是 Agent 和普通聊天模型最大的区别。二、Model 和 Agent到底是什么关系很多人刚接触 Agent 时最容易混淆的一点就是Agent 和 Model 是不是一回事答案是不是。Model 是 Agent 的核心但不是 Agent 的全部。Model也就是模型本质上是“文本进文本出”。更重要的是它本身没有跨调用记忆也没有执行循环。它可以根据目标、上下文和规则表达“我下一步想调用某个工具”的意图但真正去点击网页、读取文件、调用 API 或运行工具还得靠模型外面的系统来完成。三、Scaffolding 和 Harness 工程分别在做什么这两个词经常一起出现也最容易一起被叫成“Agent 框架的一部分”。但如果想真正看清一套 Agent 系统最好把它们分开理解。可以把它们先简单记成Scaffolding 管“怎么想”Harness 管“怎么跑”。Context Engineering 和 Policy一个管理输入一个定义行为这两个概念可以放在一起讲因为它们都会影响 Agent 下一步怎么做但它们并不是一回事。Context Engineering 讲的是模型在每一步到底看见什么Policy 讲的是基于这些输入表现出怎样的行为方式。Context Engineering决定模型在每一步到底看见什么如果说 Prompt Engineering 关心的是“提示词怎么写”那么 Context Engineering 更关心的是在 Agent 执行的每一步里模型到底应该看到什么信息。它包括系统提示词、工具说明、历史对话、检索进来的知识以及工具返回结果而且这不是一次性的设置随着任务推进harness 会持续决定哪些信息保留、哪些丢弃、哪些重新注入。它在训练和推理两端都适用但代价并不一样训练时塞错了模型学到的东西可能会偏掉推理时塞错了通常还能通过改提示词或重配上下文再来一次。Policy决定 Agent 是按什么方式做选择的Policy 指的是一个 Agent 所遵循的行为方式给定一种情境它会以什么方式在多个可能动作之间做选择。在强化学习里这个概念往往被定义得更严格甚至可以写成“对各个可能动作的概率分布”放到 LLM Agent 里这套策略一部分学在模型权重里一部分又受到提示词、工具、记忆和执行循环的影响。所以Policy 不等于 Agent 本身。Agent 是那个在环境里真正采取行动的完整系统Policy 则是它表现出来的行为方式。Tool、Skill、Sub-agent为什么不是一回事这三个词很容易被混用但它们其实对应三层不同的东西动作、方法和分工。1. Tool Use一个具体动作Tool 是最基础的一层。它指的是 Agent 伸手够到自身之外的方式比如调用 API、代码解释器、数据库、网页搜索和文件系统。模型只会以结构化格式表达“我要用某个工具”的意图真正把调用路由出去、拿回结果并继续循环的是 harness。所以Tool 更像 Agent 的“手”。Skill一套可复用的方法Skill 不只是一个动作而是一整套围绕某个目标沉淀下来的做事方法。比如“排查一个 bug”“完成一次数据清洗”“写一版市场调研摘要”都不是一次工具调用能完成的。它们往往需要一组步骤、一套经验和一个相对稳定的处理流程。所以Skill 更像 Agent 的“套路”。Sub-agent一个能独立完成子任务的 AgentSub-agent 则更进一步。它不是一个被动工具也不只是一套方法而是另一个可以自己思考、自己调用工具、独立处理子任务的 Agent。比如一个主 Agent 要完成“写一份行业分析”它可以把任务拆开一个 Sub-agent 去收集资料一个 Sub-agent 去整理数据一个 Sub-agent 去写成初稿最后再把这些结果统一整合。为什么训练 Agent 的人总在讲 Environment、Rollout、Reward 和 Trainer前面讲的主要是 Agent 怎么被搭出来。而下面这几个词更多出现在“Agent 怎么被训练得更强”这个阶段。EnvironmentEnvironment 就是 Agent 可以交互的环境。它可以是浏览器、文件系统、代码仓库也可以是某种更抽象的任务空间。Agent 在环境里采取动作环境再返回新的状态和结果。RolloutRollout 指的是 Agent 从开始到结束完成一次任务的完整过程。它记录了 Agent 看到了什么、做了什么、最后结果怎样。RewardReward 是对这次执行结果的打分。它告诉系统这次做得好不好哪里做对了哪里做错了。这个分数可以来自测试是否通过也可以来自人工偏好或者其他评估方式。TrainerTrainer 负责利用大量 rollout 和 reward 去更新模型让 Agent 在反复试错中学会更好的策略。所以到了训练阶段Agent 讨论的就不只是“会不会用工具”而是“能不能在环境里不断变强”。写在最后用一张最短的文字版概念图收住所以AI Agent 不是一个单独的新模型名词。它更像是一整套围绕模型搭起来的系统模型负责理解和决策工具负责行动执行系统负责把任务一轮轮推进下去。把这些概念分清之后再去看各种 Agent 产品、Agent 框架和 Agent 论文就不会那么容易混乱了。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

更多文章

前端开发 2026/6/5 18:33:55

基于Arduino与HMC5883L的数字罗盘制作：从传感器原理到PCB实战

1. 项目概述：从零构建一个低成本、高精度的数字罗盘在机器人、无人机或者任何需要自主移动的项目中，一个最基础也最让人头疼的问题就是：“我现在面朝哪个方向？” 你可能首先会想到GPS，它确实能提供位置和粗略航向&…

红米AC2100路由器刷机全流程详解：从基础准备到Breed安全刷入1. 准备工作与环境搭建在开始刷机之前，确保你已准备好以下物品和条件：红米AC2100路由器一台（全新或已恢复出厂设置）可联网的电脑一台（Windows/Ma…

张开发

前端开发 2026/6/5 18:02:49

性能对比分析：LongCat-Flash-Chat-FP8在推理效率上的突破

性能对比分析：LongCat-Flash-Chat-FP8在推理效率上的突破【免费下载链接】LongCat-Flash-Chat-FP8 项目地址: https://ai.gitcode.com/meituan-longcat/LongCat-Flash-Chat-FP8 LongCat-Flash-Chat-FP8是美团推出的新一代AI对话模型，通过创新的…

张开发

一篇文章讲清楚 AI Agent 的核心概念：从 Model、Tool、Skill 到 Harness工程

最新文章

JavaScript高级②｜原型与原型链，一张图彻底搞懂

告别安装报错！保姆级教程：在Windows 10/11上搞定Quartus II 13.1完整安装与破解

# GR3六轴机械臂最终增补：OLED裸屏驱动 + 掉电断点续跑全套源码

别再纠结了！5分钟搞懂LDO和DC-DC到底怎么选（附实际电路对比图）

R数据分析避坑指南：小心rm(list=ls())和.RData加载的那些‘坑’

HFSS建模新思路：当VBS脚本遇上Matlab，轻松搞定非周期/超表面天线阵列

推荐文章

STM32F4驱动AD7606避坑指南：SPI配置、时序调试与电压换算全流程

TVA与其他AI智能体的本质区别与联系（10）

使用 LangGraph 构建复杂的自动化测试用例“生成-执行-修复”循环

MTKClient终极指南：5分钟快速修复联发科设备变砖问题

Parallels Desktop 17保姆级教程：给CentOS 7虚拟机配个固定IP，开发调试再也不怕IP变来变去

Steam游戏《Turing Complete》通关笔记：手把手教你从逻辑门到可编程CPU的完整搭建流程

相关文章

终极ESP32 Arduino开发指南：从零开始快速上手物联网项目

如何打造个人专属的数字记忆库：WeChatMsg终极数据管理指南

Windows 11下SecureCRT 8.5安装激活全攻略（附注册机与避坑指南）

Gemini推送通知优化终极手册（2024Q2最新API v1.5实测数据+AB测试报告）

【Gemini社交媒体运营实战指南】：20年AI营销专家亲授7大高转化内容公式

保姆级教程：在Ubuntu 22.04上为GStreamer 1.22编译NVIDIA NVENC/NVDEC插件（含CUDA 12.x适配）

分享文章

更多文章

基于Arduino与HMC5883L的数字罗盘制作：从传感器原理到PCB实战

从大型机音乐测试到现代嵌入式声学监控：系统状态可听化技术解析

告别‘服务不支持’：用GitHub上的几个源，给RDP Wrapper做个自动更新检查脚本（Python版）

GroundingDINO：开创零样本目标检测新纪元的跨模态AI架构

3个步骤让你的旧iPhone重获新生：LeetDown降级工具完全指南

【2024智能健康生产力革命】：用LLM+多模态传感器构建个人健康数字孪生体的7个不可跳过节点

图解人工智能（50）人工智能应用-语音合成

CaptfEncoder V3：Rust构建的跨平台网络安全工具实战指南

揭秘CogVideoX-2b核心架构：文本编码器与视频Transformer如何协同工作？

AndroidAutoSize框架深度解析：实现低成本屏幕适配的最佳实践

红米AC2100刷Breed保姆级教程：从降级固件到一键刷入，附坏块检测与避坑指南

性能对比分析：LongCat-Flash-Chat-FP8在推理效率上的突破

一篇文章讲清楚 AI Agent 的核心概念：从 Model、Tool、Skill 到 Harness工程

最新文章

JavaScript高级②｜原型与原型链，一张图彻底搞懂

告别安装报错！保姆级教程：在Windows 10/11上搞定Quartus II 13.1完整安装与破解

# GR3六轴机械臂最终增补：OLED裸屏驱动 + 掉电断点续跑 全套源码

别再纠结了！5分钟搞懂LDO和DC-DC到底怎么选（附实际电路对比图）

R数据分析避坑指南：小心rm(list=ls())和.RData加载的那些‘坑’

HFSS建模新思路：当VBS脚本遇上Matlab，轻松搞定非周期/超表面天线阵列

推荐文章

STM32F4驱动AD7606避坑指南：SPI配置、时序调试与电压换算全流程

TVA与其他AI智能体的本质区别与联系（10）

使用 LangGraph 构建复杂的自动化测试用例“生成-执行-修复”循环

MTKClient终极指南：5分钟快速修复联发科设备变砖问题

Parallels Desktop 17保姆级教程：给CentOS 7虚拟机配个固定IP，开发调试再也不怕IP变来变去

Steam游戏《Turing Complete》通关笔记：手把手教你从逻辑门到可编程CPU的完整搭建流程

相关文章

终极ESP32 Arduino开发指南：从零开始快速上手物联网项目

如何打造个人专属的数字记忆库：WeChatMsg终极数据管理指南

Windows 11下SecureCRT 8.5安装激活全攻略（附注册机与避坑指南）

Gemini推送通知优化终极手册（2024Q2最新API v1.5实测数据+AB测试报告）

【Gemini社交媒体运营实战指南】：20年AI营销专家亲授7大高转化内容公式

保姆级教程：在Ubuntu 22.04上为GStreamer 1.22编译NVIDIA NVENC/NVDEC插件（含CUDA 12.x适配）

分享文章

更多文章

# GR3六轴机械臂最终增补：OLED裸屏驱动 + 掉电断点续跑全套源码