RAG技术赋能大模型:垂直领域问答不再难!打造专属知识库,让AI更懂你的专业!

张开发
2026/4/22 14:47:06 15 分钟阅读

分享文章

RAG技术赋能大模型:垂直领域问答不再难!打造专属知识库,让AI更懂你的专业!
本文介绍RAG检索增强生成技术如何解决基座大模型在垂直领域知识问答上的痛点。通过构建企业专属知识库结合文档加载、切片、向量知识库、向量模型、重排序模型等技术实现精准检索与意图识别。流程包括文档预处理、向量存储与检索、重排序及意图路由最终让大模型基于知识库生成专业答案。重点解析文档加载支持多格式与OCR、切片手写算法与模型切割、向量数据库设计子片与父片关联、分类索引等关键步骤全面提升大模型在专业领域的问答能力。一、设计背景当前的基座大模型在一些通用问题的问答上已经趋近完善但是在某些垂直领域基座大模型往往无法识别某些专业词汇或者企业需要大模型回答一些具有时效性、隐私性的问题时大模型根本无法做到因为基座大模型的训练数据虽然是pb级别但是对于一些私域词汇完全无法涉及。RAG系统则是解决这一痛点问题而诞生的技术企业可以构建属于自己的知识库RAG系统去匹配知识库内容和用户问题然后把答案发给大模型从让大模型回答专业领域知识。二、整体设计思路1、文档加载部分主要处理企业内部文档为后续建立知识库做准备。2、文档切片文档加载后需要对文档切片以构建提示词内容。3、向量知识库作为向量数据库的客户端主要包含多个方法比如将分片的文档加载进数据库混合检索等。4、向量模型主要将自然语言转化向量形式一维张量形式包含语义信息。5、重排序模型用于根据用户问题从向量知识库召回的知识库做关联度重排序。便于将最相关的知识提取为提示词。6、初始意图路由识别基于encoder only做一个简单的二分类来识别用户的问题是专业知识问题还是通用问题需要准备训练语句基于bert开源权重做全量微调。7、提示词模板构建多个提示词模板初次和大模型交互让大模型对用户问题和提示词模板匹配一次以此决定使用哪个提示词模板。8、整合阶段基于上述步骤整合一条完整的处理流程分为两个步骤前置步骤开发人员需要准备知识库向量库、训练意图识别模型等。推理阶段用户问题输入接收问题由意图识别模型做二分类通用问题直接给大模型返回答案专业问题则走rag系统将问题和大模型封装为提示词选择模板给大模型让大模型挑选最符合用户问题的提示词模板选择提示词模板后将用户问题向量化并给向量数据库执行混合召回根据召回结果重排序将重排序结果和提示词模板封装后给大模型大模型返回答案将答案返回给用户。三、部分重点部分做法。1、文档加载部分需要考虑多种格式的文档类型比如ppt、pdf等有图片的文档需要调用ocr图片识别来做做图片识别时需要调整识别图片大小比如太小的图片可能是公司的logo等不属于专业知识。需要排除在外另外ocr可以选择在gpu推理速度比cpu快。2、文档切片有两种方式去做第一是手写算法去切割langchain有现成文档切割器RecursiveCharacterTextSplitter但是默认的分割符过少如果是中文预料可以手动重写方法添加更多的分隔符比如,.等对于切片的chunk_size和chunk_overlap的实现如果调用langchain这个父类的方法chunk_size很好理解就是切片的大小保证切片后的所有分片大小小于等于这个chunk_size的值但是会出现问题比如一个碎片的大小在加入一个chunk后这个chunk的大小正好小于等于设置的值而这个碎片的下一个碎片又正好和这个碎片的语义相关这就会导致切片带来的语义割裂所以解决方案就是引入chunk_overlap这个思想在一个chunk即将到达临界值时代码会将该chunk的最后chunl_overlap的token保存下来自动添加在下一个chunk的前面这样就算因为切割导致语义分割但是由于这个重叠机制也可以保留下一个chunk的语义。第二种是直接模型切割引入一个小模型专门去做文档切片代码输入完整文档模型返回切片后的文档内容原理很简单。3、向量数据库的存储连接向量数据库加载向量模型需要确定向量数据库的字段比如稠密向量和稀疏向量另外在文档切片时一般的做法会切父片和子片很好理解父片包含多个子片存储时以子片为单位存储但是可以在向量数据库中添加所属父片这个字段因为在构建prompt时使用父片进行构建效果更好。所以索检流程就是根据问题索检相似度召回最相似的xxx个子片重排序挑选xxx个子片然后使用子片所属父片构建最终prompt。另外如果构建的知识库较大需要对知识库进行分类可以在向量数据库中添加一个字段去区分不同知识库类别在索检时添加条件时索检效率更高。在构建向量数据库表时需要确定每个字段的索检方式比如内积等是为了向量数据库计算相似度。假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】

更多文章