GTE模型与LangChain集成指南：构建智能问答系统

张开发

• 2026/4/17 15:48:50 • 15 分钟阅读

分享文章

GTE模型与LangChain集成指南构建智能问答系统1. 引言你是不是经常遇到这样的情况面对海量的文档资料想要快速找到某个问题的答案却像大海捞针一样困难或者想要为自己的应用添加智能问答功能但不知道从何入手今天我们就来解决这个问题。通过将GTE文本向量模型与LangChain框架集成你可以轻松构建一个智能问答系统让机器理解文档内容并准确回答用户问题。这种技术已经在很多实际场景中得到应用比如企业知识库、在线客服、教育辅导等。本文将手把手带你完成整个集成过程从环境配置到系统搭建每个步骤都有详细的代码示例。即使你是刚接触这方面的新手也能跟着教程一步步实现自己的智能问答系统。2. 环境准备与快速部署在开始之前我们需要准备好开发环境。这里以Python环境为例推荐使用Python 3.8或更高版本。首先安装必要的依赖包pip install torch transformers modelscope langchain chromadb sentence-transformers这些包的作用分别是torchPyTorch深度学习框架transformersHugging Face的Transformer模型库modelscope阿里云ModelScope模型平台langchainLangChain框架用于构建大语言模型应用chromadb轻量级向量数据库sentence-transformers句子转换器库安装完成后我们可以验证一下关键库的版本import langchain import modelscope print(fLangChain版本: {langchain.__version__}) print(fModelScope版本: {modelscope.__version__})3. GTE模型基础使用GTEGeneral Text Embeddings是阿里云推出的通用文本向量模型能够将文本转换为高维向量表示。我们先来看看如何单独使用GTE模型。3.1 初始化GTE模型from modelscope.pipelines import pipeline from modelscope.utils.constant import Tasks # 使用GTE中文小模型57M参数 model_id damo/nlp_gte_sentence-embedding_chinese-small # 创建文本嵌入pipeline pipeline_se pipeline( taskTasks.sentence_embedding, modelmodel_id )3.2 生成文本向量让我们试试用GTE模型生成文本向量# 单个句子的向量生成 single_text [智能问答系统很有趣] result pipeline_se(input{source_sentence: single_text}) print(f向量维度: {result[text_embedding].shape}) print(f前5个向量值: {result[text_embedding][0][:5]}) # 多个句子的相似度计算 inputs { source_sentence: [什么是人工智能], sentences_to_compare: [ 人工智能是计算机科学的一个分支, 机器学习是人工智能的重要组成部分, 今天天气真好 ] } result pipeline_se(inputinputs) print(相似度得分:, result[scores])运行这段代码你会看到GTE模型能够生成512维的文本向量并且可以准确计算句子之间的语义相似度。4. LangChain框架集成现在我们来介绍如何将GTE模型集成到LangChain框架中。LangChain提供了丰富的组件来构建大语言模型应用。4.1 创建自定义Embedding类首先我们需要创建一个自定义的Embedding类来包装GTE模型from langchain.embeddings.base import Embeddings from typing import List import numpy as np class GTEEmbeddings(Embeddings): def __init__(self, model_sizesmall): super().__init__() if model_size small: self.model_id damo/nlp_gte_sentence-embedding_chinese-small else: self.model_id damo/nlp_gte_sentence-embedding_chinese-large self.pipeline pipeline( taskTasks.sentence_embedding, modelself.model_id ) def embed_documents(self, texts: List[str]) - List[List[float]]: 为文档生成嵌入向量 results [] # 分批处理避免内存溢出 batch_size 32 for i in range(0, len(texts), batch_size): batch_texts texts[i:ibatch_size] result self.pipeline(input{source_sentence: batch_texts}) embeddings result[text_embedding].tolist() results.extend(embeddings) return results def embed_query(self, text: str) - List[float]: 为查询生成嵌入向量 result self.pipeline(input{source_sentence: [text]}) return result[text_embedding][0].tolist()4.2 初始化向量数据库接下来我们使用ChromaDB作为向量数据库来存储文档嵌入from langchain.vectorstores import Chroma from langchain.text_splitter import RecursiveCharacterTextSplitter from langchain.document_loaders import TextLoader # 初始化GTE嵌入 gte_embeddings GTEEmbeddings(model_sizesmall) # 创建文本分割器 text_splitter RecursiveCharacterTextSplitter( chunk_size500, chunk_overlap50 ) # 加载示例文档你可以替换为自己的文档 loader TextLoader(sample_document.txt, encodingutf-8) documents loader.load() # 分割文档 split_docs text_splitter.split_documents(documents) # 创建向量数据库 vectorstore Chroma.from_documents( documentssplit_docs, embeddinggte_embeddings, persist_directory./chroma_db )5. 构建智能问答系统现在我们来组装完整的智能问答系统。这里使用LangChain的RetrievalQA链来实现问答功能。5.1 配置问答链from langchain.chains import RetrievalQA from langchain.llms import OpenAI import os # 设置OpenAI API密钥你需要先申请API key os.environ[OPENAI_API_KEY] 你的OpenAI_API_KEY # 初始化语言模型 llm OpenAI(temperature0) # 创建检索式问答链 qa_chain RetrievalQA.from_chain_type( llmllm, chain_typestuff, retrievervectorstore.as_retriever(search_kwargs{k: 3}), return_source_documentsTrue )5.2 问答系统测试让我们测试一下问答系统的效果# 测试问题 question GTE模型的主要用途是什么 result qa_chain({query: question}) print(f问题: {question}) print(f回答: {result[result]}) print(\n参考文档:) for doc in result[source_documents]: print(f- {doc.page_content[:100]}...)如果你没有OpenAI API密钥也可以使用本地模型或者其他的开源模型替代。6. 进阶功能与优化6.1 支持多种文件格式现实中的文档可能有多种格式我们需要支持更多的文件类型from langchain.document_loaders import PyPDFLoader, Docx2txtLoader def load_documents(file_path): if file_path.endswith(.pdf): loader PyPDFLoader(file_path) elif file_path.endswith(.docx): loader Docx2txtLoader(file_path) elif file_path.endswith(.txt): loader TextLoader(file_path, encodingutf-8) else: raise ValueError(不支持的文件格式) return loader.load() # 批量处理多个文档 document_files [doc1.pdf, doc2.docx, doc3.txt] all_documents [] for file_path in document_files: try: documents load_documents(file_path) all_documents.extend(documents) except Exception as e: print(f加载文件 {file_path} 时出错: {e})6.2 添加对话历史为了让问答系统支持多轮对话我们可以添加对话历史功能from langchain.memory import ConversationBufferMemory from langchain.chains import ConversationalRetrievalChain # 添加对话记忆 memory ConversationBufferMemory( memory_keychat_history, return_messagesTrue ) # 创建对话式检索链 conversational_qa ConversationalRetrievalChain.from_llm( llmllm, retrievervectorstore.as_retriever(), memorymemory, chain_typestuff ) # 多轮对话示例 questions [ GTE模型是什么, 它有什么优势, 如何在LangChain中使用它 ] for question in questions: result conversational_qa({question: question}) print(fQ: {question}) print(fA: {result[answer]}\n)7. 实际应用建议在实际部署智能问答系统时有几个关键点需要注意性能优化对于大量文档建议使用GTE large模型获得更好的效果但需要更多的计算资源。可以考虑使用批量处理和多线程来提升处理速度。错误处理添加完善的错误处理机制比如网络超时重试、API限制处理等。用户体验为问答系统添加置信度评分当系统不确定时可以提示用户或转人工客服。持续学习定期更新知识库根据用户反馈优化回答质量。8. 总结通过本教程我们完整地实现了GTE模型与LangChain框架的集成构建了一个功能完善的智能问答系统。从环境配置、模型调用到系统搭建每个步骤都有详细的代码示例和解释。实际使用中这个系统可以帮助企业快速构建知识库问答、智能客服等应用。GTE模型提供了高质量的文本向量表示LangChain框架则大大简化了应用开发流程两者的结合让构建智能问答系统变得简单高效。如果你在实践过程中遇到问题或者有更好的优化建议欢迎交流讨论。智能问答技术还在快速发展中期待看到更多创新的应用场景。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

更多文章

前端开发 2026/4/17 15:45:10

魔兽争霸3终极优化指南：如何让经典游戏在现代电脑上焕发新生 [特殊字符]

魔兽争霸3终极优化指南：如何让经典游戏在现代电脑上焕发新生 🎮 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为《魔兽争…

第一章：金融级低代码平台组件开发概述金融级低代码平台组件开发聚焦于高可靠性、强合规性与可审计性的前端功能单元构建，其核心目标是在满足等保三级、PCI-DSS、GDPR 及国内《金融行业信息系统安全等级保护基本要求》的前提下，实现业务逻辑的…

张开发

前端开发 2026/4/8 14:45:14

Spring Boot打包必备：spring-boot-maven-plugin的7个隐藏用法（含版本兼容指南）

Spring Boot打包进阶：spring-boot-maven-plugin的7个实战技巧与版本适配指南在Spring Boot项目的日常开发中，打包环节往往是决定应用最终部署形态的关键步骤。许多开发者仅仅满足于默认的打包配置，却不知道spring-boot-maven-plugin这个看似…

张开发

GTE模型与LangChain集成指南：构建智能问答系统

最新文章

FPGA新手避坑：用Verilog实现边沿检测时，为什么你的仿真波形总是不对？

Apache PLC4X：突破工业物联网协议碎片化壁垒的统一访问平台

Mi-Create：5分钟零代码打造个性化小米穿戴表盘的终极指南

加州总检察长：新解封记录揭示亚马逊价格操纵策略

RISC-V芯片性能实测——CoreMark移植与优化指南

RimWorld Mod制作：不靠CompPowerPlant，从零构建一个自定义天气感应发电机

推荐文章

【读书笔记】《背影》

PCB布局踩坑实录：FB走线怎么布，才能让你的COT电源不振荡？（附MPS芯片实战案例）

LSM6DS0惯性测量单元驱动开发与嵌入式IMU实战

HD44780大字体显示方案：基于CGRAM的嵌入式字符放大技术

i18n 2026.04.11

电子取证必备：U盘镜像分析中的FAT32/NTFS文件系统恢复技巧大全

相关文章

如何为AMD 780M APU解锁2-3倍AI性能？ROCmLibs-for-gfx1103终极优化指南

企业内网必看：用U盘搞定Ubuntu服务器Docker离线部署（含依赖树分析）

OpenCode智能编程助手全面部署指南：从环境搭建到高级应用

大语言模型背后的秘密：从预训练到微调，揭秘LLM高效训练的核心技术（含QLoRA/ZeRO实战）

RBDdimmer：嵌入式AC相位调光库详解

新手零失败指南：利用快马ai轻松完成openclaw的ubuntu环境搭建

分享文章

更多文章

魔兽争霸3终极优化指南：如何让经典游戏在现代电脑上焕发新生 [特殊字符]

如何优雅解锁付费内容？5款开源工具深度对比与实战指南

Graphormer多场景落地：量子化学计算前的AI初筛效率提升300%

Hunyuan-MT-7B实战案例：像素语言传送门在多语种本地化中的企业落地

终极Chromium性能优化方案：Thorium浏览器让你的上网体验快如闪电

从零开始：Oracle数据泵状态监控的完整指南（附常用命令）

Graphormer部署教程：supervisorctl status/start/stop/restart命令详解

智能增强与效率提升：零门槛开源图像增强工具全攻略

零基础入门AI绘画：造相Z-Image文生图模型v2详细教程，附实战案例

Qwen3.5-9B-AWQ-4bit图文理解效果实测：10张测试图全场景效果展示

揭秘头部金融级低代码平台底层组件架构：基于Java 17+模块化+SPI机制的高扩展性设计全拆解

Spring Boot打包必备：spring-boot-maven-plugin的7个隐藏用法（含版本兼容指南）