Unity也能使用语音跟ai聊天了？Whisper + NobodyWho 小白教程教你如何在unity实现llm的搭建

张开发

• 2026/4/18 19:39:35 • 15 分钟阅读

分享文章

Unity也能使用语音跟ai聊天了？Whisper + NobodyWho 小白教程教你如何在unity实现llm的搭建

大家想必都知道llm是“大语言模型”Large Language Model的缩写就是像GPT-4、DeepSeek、文心一言这类能够理解、生成人类语言的AI模型而这种模型一般都只能在云端网页调用会玩的人通过ollma本地化下载然后再本地进行一个对话不过这些都太old被人讲过了我们讲的特别的如何通过unity引擎插件实现用语音聊天跟ai模型在引擎里面互动。我们用的工具有以下几个第一个大模型首先unity支持大模型的导入但是最好使用.gguf而非.safetensors结构这里我们直接给出qwen的gguf链接大家魔法上网进入hugging进行下载因为unity如果你想导出包不是那么大那3g也够了这里是千文的一个gguf的模型链接huggingface.co然后呢我们要第二个工具whisper插件这个插件大家直接去package manager选择git url进行下载https://github.com/Macoron/whisper.unity.git?path/Packages/com.whisper.unity这个主要负责对应的语音识别嵌入插件下载完成后我们并不能直接开始我们在组件搜索whispermanager给我们新建一个空物体挂载挂载后会发现一个东西Model,这个有个path路径他指向了StreamingAsset一个文件但是这是空的这是为什么因为我们还需要语音识别模型语音模型为bin文件而负责语音模型我直接给大家给出链接这个是small模型大家可以查看huggingface越大越精确性能消耗越高https://huggingface.co/ggerganov/whisper.cpp/blob/main/ggml-small.bin当然如果想下载其他模型也可以直接搜索ggml,下载后放入文件夹如图所示然后配置文件路径在刚刚的组件中设置path为你的名字如果放子文件加上/子文件名字/你的bin文件名字我们完成了配置之后就可以编写一个方法进行调用Whisper.unity 提供了MicrophoneRecord组件通过事件通知录音结束并返回音频数据。核心调用如下microphoneRecord.OnRecordStop OnRecordStop;private async void OnRecordStop(AudioChunk recordedAudio){var res await whisperManager.GetTextAsync(recordedAudio.Data,recordedAudio.Frequency,recordedAudio.Channels);string playerSpeech res.Result;// 将识别文本发送给 AICallAI(playerSpeech);}大家脚本调用仅需通过 microphoneRecord.StartRecord();开始录制 microphoneRecord.StopRecord();停止录制编写方法在按钮开始适合开始录制再次点击停止实现ai输入后传递文字方法如下var res await whisperManager.GetTextAsync(recordedAudio.Data, recordedAudio.Frequency, recordedAudio.Channels);string playerSpeech res.Result;await CallAIAsync(playerSpeech);通过whisperManager.GetTextAsync()从而实现这个录制转文字我们完成语音后该实现如何语音转文字传递给ai这个内嵌ai模型的插件那就是nobodywho我们需要在资源商店下载Local LLMs - made easy。商店下载完成导入包内我们会获得几个脚本我们创建一个新空物体放置这个插件的内置脚本分别是nobodywhochatnobodywhomodel如图所示这里就放置我们的大模型刚刚的qwen的文件路径browse查找即可设置完毕后我们编写代码首先通过一个text接收到刚刚ai语音的代码然后里面nobody方法的nobodyWhoChat.Say(playerMessage) → 发送给大模型然后实现一个语音转文字具体流程如下玩家按下 P 键 / 点击按钮↓StartRecording() → 开始录音↓玩家松开 P 键 / 再次点击按钮↓StopRecording() → 停止录音↓OnRecordStop自动触发↓whisperManager.GetTextAsync() → 语音转文字playerSpeech↓CallAIAsync(playerSpeech)↓nobodyWhoChat.Say(playerMessage) → 发送给大模型↓responseUpdated 事件 → 实时更新 AI 回复框打字机效果当然ui方面的配置我们就不多赘述大致逻辑就是这样在我们配置好了对应的插件就可以调用方法实现我们的ai语音转文字让ai回答问题如果你也想尝试一下我会给出完整的代码片段链接给各位大家按照这个配置即可语音转文字脚本-CSDN博客

更多文章

前端开发 2026/4/18 19:37:11

《传世元神版》手游官网正版授权，双元神合击，重温中州热血！

风华经典手游平台是国内知名游戏门户网站官网经典IP端游授权开发1：1复刻手游，用户可通过风华经典手游官网获取游戏及资讯礼包码，官网设置专属游戏客服提供游戏服务！本次为各位新手玩家带来《传世元神版》2026年怀旧手游圈再掀狂潮…

1. 静息态fMRI预处理入门指南第一次接触静息态fMRI数据时，我被满屏的DICOM文件搞得晕头转向。这些医学影像数据就像一堆未经整理的拼图碎片，需要我们通过预处理流程将它们转化为可分析的标准化数据。静息态fMRI（rs-fMRI）记录了大…

张开发

前端开发 2026/4/18 18:54:14

ncmdumpGUI：解锁网易云音乐NCM加密文件的终极免费方案

ncmdumpGUI：解锁网易云音乐NCM加密文件的终极免费方案【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换，Windows图形界面版本项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否曾经在网易云音乐下载了心爱的歌曲&am…

张开发

Unity也能使用语音跟ai聊天了？Whisper + NobodyWho 小白教程教你如何在unity实现llm的搭建

最新文章

Lattice Planner实战避坑指南：从Frenet坐标推导到轨迹拼接，这些细节决定了成败

Nano-Banana Studio开源镜像：支持国产昇腾/寒武纪芯片的适配可行性分析

Rusted PackFile Manager：5分钟上手，打造你的全面战争专属模组

暗黑破坏神2存档编辑器：重塑你的游戏体验

ARINC429芯片HI-3582避坑指南：并行总线时序、±10V电源与FIFO状态监控的那些坑

Obsidian PDF导出终极指南：从笔记到专业文档的完美转换

推荐文章

【读书笔记】《背影》

PCB布局踩坑实录：FB走线怎么布，才能让你的COT电源不振荡？（附MPS芯片实战案例）

LSM6DS0惯性测量单元驱动开发与嵌入式IMU实战

HD44780大字体显示方案：基于CGRAM的嵌入式字符放大技术

i18n 2026.04.11

电子取证必备：U盘镜像分析中的FAT32/NTFS文件系统恢复技巧大全

相关文章

如何为AMD 780M APU解锁2-3倍AI性能？ROCmLibs-for-gfx1103终极优化指南

企业内网必看：用U盘搞定Ubuntu服务器Docker离线部署（含依赖树分析）

OpenCode智能编程助手全面部署指南：从环境搭建到高级应用

大语言模型背后的秘密：从预训练到微调，揭秘LLM高效训练的核心技术（含QLoRA/ZeRO实战）

RBDdimmer：嵌入式AC相位调光库详解

新手零失败指南：利用快马ai轻松完成openclaw的ubuntu环境搭建

分享文章

更多文章

《传世元神版》手游官网正版授权，双元神合击，重温中州热血！

5步快速搭建原神私服：KCN-GenshinServer一键GUI服务端完全指南

3步快速将B站m4s缓存视频转换为MP4：免费工具终极指南

UnityLive2DExtractor完整指南：5分钟掌握Live2D资源提取终极技巧

Ubuntu 22.04 LTS 服务器部署 R 与 RStudio Server 全栈指南

PatchCore算法升级手记：当ViT（CaiT）遇见工业缺陷检测，效果提升了多少？

5分钟快速上手：WeChatExporter微信聊天记录备份终极指南

别再被‘子仓库’报错吓到！手把手教你用git submodule搞定项目依赖管理

抖音下载器终极指南：5分钟掌握批量下载抖音视频的完整方案

深度指南：构建现代B站视频下载器的5大核心技术

静息态fMRI预处理实战：从DICOM到ALFF的完整流程解析

ncmdumpGUI：解锁网易云音乐NCM加密文件的终极免费方案