RAG/Agent/Skill/MCP/Tool

张开发

• 2026/6/15 4:11:07 • 15 分钟阅读

分享文章

RAGRetrieval-Augmented Generation检索增强生成核心思想不再只依赖模型内部的「记忆」而是给模型配备一个「外部知识库」让它在回答问题前先去查资料。原因1.模型无法读取所有内容上下文窗口大小有限制2.模型推理成本高输入越多成本越高3.输入越多模型需要消化的内容越多模型推理速度就越慢RAG的基本运行流程1.RAG会把文档切分成多个片段(需要研究如何分片)分片数据采集与清洗原始数据源│├── PDF 文档├── Excel/CSV├── 聊天记录├── 网页内容├── 数据库└── 内部文档│▼数据清洗├── 去除噪音HTML 标签、特殊字符├── 文本标准化繁→简、大小写统一├── 文档分块Chunking└── 元数据提取标题、日期、来源通常在300-1000 tokens之间索引通过嵌入模型如 OpenAI text-embedding-3 或 Hugging Face 上的开源模型将文本片段映射为语义向量表示Document Embedding也就是高维稠密向量。向量数据库文本通过Embedding向量化后存入向量数据库同时原始文本也会存入向量数据库的。2.在多个片段中寻找问题相关内容需要研究如何寻找到相关片段召回使用嵌入模型Embedding Model将用户查询转换为语义向量表示Query Embedding也就是高维稠密向量以捕捉查询的语义信息。信息检索 (R) 在嵌入存储Embedding Store中通过语义相似性搜索找到与查询向量最相关的文档片段Relevant Segments。如图搜索与问题相似度较高的结果计算向量相似度计算向量相似度的计算方式余弦相似度欧氏距离点积特点成本低耗时短准确率低适合初步筛选余弦相似度计算方式计算两个向量之间家教的cos值夹角越小值越大欧氏距离算法计算AB两点之间的直线距离点积通过代数方式衡量两个向量相似度的方法。点积不仅考虑两个向量之间的方向关系还要考虑他们的长度举例首先从A引入关于B的垂线得到垂线与B向量的交点交点到原点的距离与B向量长度的乘积乘积越大就代表相似度越高。如果两个向量方向相同向量越长点积值越大方向相反(与另一向量夹角大于90度)得到的乘积是负的垂直时点积为0。重排在召回结果中进行重排再挑几份与用户问题最相似的。之所以一定是召回后重排而不是直接在召回时就挑少几份主要还是因为重排与召回在计算相似度方面存在差异。重排进行相似度计算方法cross-encoder 进行计算特点成本高耗时长准确率高适合场景精挑细选最后总结准备部分分片索引实现知识库构建将数据进行分片对所有分片后的数据进行向量化向量化后存入向量数据库中。AgentAgent 能自主调用工具完成任务的AI。如果说RAG让AI能查资料Agent让AI能干活。工具调用可以使用各种API、软件、服务任务规划拆解复杂任务为多个步骤自主决策根据结果调整执行策略实际案例任务帮我查明天北京的天气如果下雨就给老板发邮件说我在家办公Agent执行流程调用天气API查询明天天气判断是否下雨如果下雨调用邮件API发送请假邮件返回执行结果Agent Skill大语言模型的技能Skills是指通过特定的指令和元数据帮助模型在执行任务时更加高效和准确。这些技能可以将重复性工作流程打包成可复用的指令使得模型能够自动、可靠地完成任务而无需每次都重复提醒。1.核心功能自动化执行技能允许模型在需要时自动加载并执行特定任务减少人工干预提高工作效率。2.可复用性通过将工作流程标准化用户可以在不同的场景中复用这些技能提升一致性和准确性。3.简化复杂性技能的设计核心是简洁与高效用户只需编写简单的文档模型便能理解并执行复杂的任务。MCPModel Context Protocol模型上下文协议为AI工具制定统一标准就像USB接口统一了设备连接。每个AI工具都有自己的接口标准开发者需要为不同AI分别开发插件工具无法跨平台复用Skill vs MCP工具对比维度MCP工具Skill定位底层能力螺丝刀完整方案装修服务复杂度单一功能组合多个工具业务逻辑使用场景开发者调用终端用户直接使用

更多文章

前端开发 2026/6/15 3:57:13

双光谱摄像头选型指南：如何根据焦距和基线距离减少图像配准误差

双光谱摄像头选型实战：从光学参数到场景适配的完整决策框架当你在监控安防、工业检测或自动驾驶项目中需要同时捕捉可见光与红外光谱信息时，双摄像头系统的配准精度直接决定了后续图像融合与分析的质量。我曾为一个边境安防项目评估过17种摄像头组合&am…

Recorder性能测试终极指南：不同格式、采样率、比特率对录音质量的影响【免费下载链接】Recorder html5 js 录音 mp3 wav ogg webm amr g711a g711u 格式，支持pc和Android、iOS部分浏览器、Hybrid App（提供Android iOS App源码）、…

张开发

前端开发 2026/6/3 3:22:22

极空间+Docker轻松打造个人电子书库：TaleBook与豆瓣刮削器实战指南

1. 极空间NAS与Docker环境准备在开始搭建个人电子书库之前，我们需要先准备好基础环境。极空间NAS作为国产NAS中的后起之秀，其内置的Docker功能让各种开源项目的部署变得异常简单。我实测下来，极空间的Docker管理界面比很多传统NAS都要直观&a…

张开发

RAG/Agent/Skill/MCP/Tool

最新文章

Windows 平台 Ollama AMD GPU 一键编译指南：基于 ROCm 7.1 的自动化实战

别再乱改了！手把手教你读懂《骑马与砍杀：战团》module.ini配置文件（附避坑清单）

STM32的HX711驱动避坑指南：搞定24位ADC漂移、OLED显示跳数的那些事儿

Claude Mythos：首个AI驱动的自动化红队与攻击图建模引擎

Windows 10/11下Oracle 12c安装报错INS-30131？别慌，先检查这个被忽略的Windows服务

【课程设计/毕业设计】基于 Web 架构的数学试卷自动生成系统的设计与实现校园数学教学题库组卷 Web 系统【附源码、数据库、万字文档】

推荐文章

Halcon实战：用smallest_rectangle1和smallest_rectangle2搞定工业瑕疵的两种矩形框标注

如何快速解密QQ音乐加密文件：QMCDecode跨平台播放解决方案终极指南

如何在Windows电脑上轻松安装安卓应用？APK Installer跨平台解决方案揭秘

F3D快速上手指南：3D模型查看的终极解决方案

OpenBoard开源输入法：3步打造你的隐私安全键盘终极方案

零基础3D浮雕制作神器：用ImageToSTL将照片变成立体艺术品 [特殊字符]

相关文章

终极ESP32 Arduino开发指南：从零开始快速上手物联网项目

如何打造个人专属的数字记忆库：WeChatMsg终极数据管理指南

Windows 11下SecureCRT 8.5安装激活全攻略（附注册机与避坑指南）

Gemini推送通知优化终极手册（2024Q2最新API v1.5实测数据+AB测试报告）

【Gemini社交媒体运营实战指南】：20年AI营销专家亲授7大高转化内容公式

保姆级教程：在Ubuntu 22.04上为GStreamer 1.22编译NVIDIA NVENC/NVDEC插件（含CUDA 12.x适配）

分享文章

更多文章

双光谱摄像头选型指南：如何根据焦距和基线距离减少图像配准误差

超频玩家必看：TestMem5配置文件详解与内存稳定性测试实战（含黄金参数包）

Koikatsu游戏优化补丁：KK-HF_Patch完整指南与安装教程

用MATLAB和Pluto SDR复现通信原理实验：正弦波、方波收发对比与波形失真分析

通义千问2.5-7B教育应用案例：自动批改系统搭建全流程

普通用户如何手动升级gmake（GNU Make）以解决编译依赖问题

从结肠癌到植物抗逆：蛋白质组+转录组联合分析如何帮你发现隐藏的生物学故事？

常用人力资源管理系统怎么选？主流产品深度对比

用了这80个音乐指令，我的AI音乐终于有了“电影级配乐”的质感

利用QEMU模拟树莓派环境实现IoT固件动态分析与调试

Recorder性能测试终极指南：不同格式、采样率、比特率对录音质量的影响

极空间+Docker轻松打造个人电子书库：TaleBook与豆瓣刮削器实战指南

RAG/Agent/Skill/MCP/Tool

最新文章

Windows 平台 Ollama AMD GPU 一键编译指南：基于 ROCm 7.1 的自动化实战

别再乱改了！手把手教你读懂《骑马与砍杀：战团》module.ini配置文件（附避坑清单）

STM32的HX711驱动避坑指南：搞定24位ADC漂移、OLED显示跳数的那些事儿

Claude Mythos：首个AI驱动的自动化红队与攻击图建模引擎

Windows 10/11下Oracle 12c安装报错INS-30131？别慌，先检查这个被忽略的Windows服务

【课程设计/毕业设计】基于 Web 架构的数学试卷自动生成系统的设计与实现 校园数学教学题库组卷 Web 系统【附源码、数据库、万字文档】

推荐文章

Halcon实战：用smallest_rectangle1和smallest_rectangle2搞定工业瑕疵的两种矩形框标注

如何快速解密QQ音乐加密文件：QMCDecode跨平台播放解决方案终极指南

如何在Windows电脑上轻松安装安卓应用？APK Installer跨平台解决方案揭秘

F3D快速上手指南：3D模型查看的终极解决方案

OpenBoard开源输入法：3步打造你的隐私安全键盘终极方案

零基础3D浮雕制作神器：用ImageToSTL将照片变成立体艺术品 [特殊字符]

相关文章

终极ESP32 Arduino开发指南：从零开始快速上手物联网项目

如何打造个人专属的数字记忆库：WeChatMsg终极数据管理指南

Windows 11下SecureCRT 8.5安装激活全攻略（附注册机与避坑指南）

Gemini推送通知优化终极手册（2024Q2最新API v1.5实测数据+AB测试报告）

【Gemini社交媒体运营实战指南】：20年AI营销专家亲授7大高转化内容公式

保姆级教程：在Ubuntu 22.04上为GStreamer 1.22编译NVIDIA NVENC/NVDEC插件（含CUDA 12.x适配）

分享文章

更多文章

【课程设计/毕业设计】基于 Web 架构的数学试卷自动生成系统的设计与实现校园数学教学题库组卷 Web 系统【附源码、数据库、万字文档】