本地大模型WindowsPC测试过程

张开发

• 2026/5/12 23:52:19 • 15 分钟阅读

分享文章

硬件配置处理器 11th Gen Intel(R) Core(TM) i7-11700 2.50GHz 2.50 GHz 机带 RAM 32.0 GB (31.7 GB 可用) 存储 238 GB SSD PM9A1 NVMe Samsung 256GB,932 GB HDD TOSHIBA DT01ACA100 显卡 Intel(R) UHD Graphics 750 (128 MB) 系统类型 64 位操作系统,基于 x64 的处理器两种方式 Ollama和 LM Studio OLLAMA URL http://172.16.11.138:18080/ollama/api/chat METHOD POST BODY{model:DeepSeek-Coder-V2-Lite-Instruct-Q8_0,messages:[{role:assistant,content:11}]}LMStudio URL http://172.16.11.138:18080/lmstudio/api/v1/chat METHOD POST BODY{model:qwen3.5-0.8b,input:11?}本次搭建过程安装LM Studio/Ollama https://ollama.com/download https://lmstudio.ai/download 模型下载 1LM Studio 通过https://huggingface.co/ 下载搜一个模型以Qwen3.5-0.8B为例 lmstudio-community/Qwen3.5-0.8B-GGUF 下载 C:\Users\admin\.lmstudio\models\Qwen3.5-0.8B-Q8_0.gguf 2Ollama 通过https://huggingface.co/ 下载搜一个模型以DKV2-Lite为例 DeepSeek-Coder-V2-Lite-Instruct-Q8_0-GGUF C:\Users\admin\.ollama\models\DeepSeek-Coder-V2-Lite-Instruct-Q8_0.gguf 加载模型 1、LM Studio 通过CMD 执行 lms load C:\Users\admin\.lmstudio\models\Qwen3.5-0.8B-Q8_0.gguf 也可以在models新建一个 Qwen3.5-0.8B-Q8_0 名的文件夹然后把.gguf文件复制进去然后重启LM Studioload model 就能看到自己的模型 2、Ollama 新建C:\Users\admin\.ollama\models\Modelfile文件内容FROM ./DeepSeek-Coder-V2-Lite-Instruct-Q8_0.gguf 然后CMD执行 ollama create DeepSeek-Coder-V2-Lite-Instruct-Q8_0-f Modelfile 启动Server LMStudio 默认端口 1234 Ollama 打开ollama应用默认端口 11434 Nginx配置为了统一端口测试可以不配置 location /lmstudio/{proxy_pass http://127.0.0.1:1234/; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme;}location /ollama/{proxy_pass http://127.0.0.1:11434/; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme;}详细图文示例见腾讯文档 https://docs.qq.com/doc/DQVZsYXpmU1dEcHdG

更多文章

前端开发 2026/5/12 23:49:06

http协议发展史

本文同步发表于我的微信公众号，微信搜索程语新视界即可关注，每个工作日都有文章更新 HTTP（超文本传输协议）的发展历程可概括为以下几个阶段，各版本在功能、性能和适用场景上持续演进： ‌HTTP 发展阶段‌…

张开发

前端开发 2026/5/12 23:48:20

大模型之存储推理优化： Importance 矩阵深度解析

文章目录1. 核心概念：从“杂乱袜子柜”到“有序收纳柜”2. Importance 矩阵：全局重要性的度量2.1 定义与作用2.2 矩阵结构与对应关系2.3 与 Anchor 向量的关系3. 更新机制：热度的累积与演化3.1 更新公式3.2 更新流程解析4. 总结与展望在大…

张开发

前端开发 2026/5/12 23:48:14

华为MetaERP（Meta Enterprise Resource Planning）是华为自主研发的新一代企业资源计划系统，旨在替代原有基于Oracle EBS等国外系统的架构，实现全栈自主可控、

华为MetaERP（Meta Enterprise Resource Planning）是华为自主研发的新一代企业资源计划系统，旨在替代原有基于Oracle EBS等国外系统的架构，实现全栈自主可控、云原生、智能化和业财深度融合。其“生产到成本”解决方案是MetaERP的核…

张开发

前端开发 2026/5/8 16:38:11

若依框架实战：5步搞定单点登录接入，避开那些坑爹的命名陷阱

若依框架单点登录实战指南：从配置到避坑的全流程解析在当今企业级应用开发中，统一身份认证已成为提升系统安全性和用户体验的关键环节。作为国内广泛使用的开源后台管理系统，若依(RuoYi)框架提供了完善的权限管理模块，但当需要对…

张开发

前端开发 2026/5/8 16:38:13

RePKG：让Wallpaper Engine资源处理效率提升3倍的技术方案

RePKG：让Wallpaper Engine资源处理效率提升3倍的技术方案【免费下载链接】repkg Wallpaper engine PKG extractor/TEX to image converter 项目地址: https://gitcode.com/gh_mirrors/re/repkg 一、问题溯源：资源处理的三重困境在数字内容创作…

张开发

前端开发 2026/5/8 16:38:12

Z-Image-Turbo-rinaiqiao-huiyewunv 低代码开发：在QT桌面应用中集成图像生成功能

Z-Image-Turbo-rinaiqiao-huiyewunv 低代码开发：在QT桌面应用中集成图像生成功能你是不是也想过，给自己的桌面小工具加个“魔法”功能？比如，写个便签应用，输入“一只在喝咖啡的猫”，就能立刻生成一张配图…

张开发

前端开发 2026/5/8 16:38:19

GhostBSD新手必看：Fcitx5中文输入法从安装到避坑全指南（附MATE桌面适配技巧）

GhostBSD中文输入终极指南：Fcitx5配置与MATE桌面深度优化为什么选择Fcitx5？ 在GhostBSD这样的FreeBSD衍生发行版中，中文输入一直是许多用户的痛点。Fcitx5作为新一代输入法框架，相比旧版Fcitx4有着显著优势： 模块化架…

张开发

前端开发 2026/5/8 16:38:14

Python+OpenCV实战：5种图像预处理技巧让你的OCR识别率提升90%

PythonOpenCV实战：5种图像预处理技巧让你的OCR识别率提升90% 在数字化浪潮席卷各行各业的今天，光学字符识别（OCR）技术已成为从纸质文档到数字信息转换的关键桥梁。然而，许多开发者在实际应用中常遇到一个令人头疼的问题…

张开发

前端开发 2026/5/8 16:38:16

如何突破Windows 11安装限制：bypass11工具高效使用指南

如何突破Windows 11安装限制：bypass11工具高效使用指南【免费下载链接】MediaCreationTool.bat Universal MCT wrapper script for all Windows 10/11 versions from 1507 to 21H2! 项目地址: https://gitcode.com/gh_mirrors/me/MediaCreationTool.bat 问题…

张开发