# 007、首次训练:在自定义游戏数据集上训练第一个YOLO模型

张开发
2026/4/15 22:05:48 15 分钟阅读

分享文章

# 007、首次训练:在自定义游戏数据集上训练第一个YOLO模型
---## 一、从黑屏到第一行loss 昨晚在服务器上敲下训练命令,屏幕刷出几行日志后直接卡住——GPU显存占满,loss一个数都没出来。这种事在第一次跑训练时太常见了。打开nvidia-smi一看,好家伙,batch_size设成了64,显存直接爆掉。调回8,重新跑,终于看到loss开始往下跳: ```Epoch 1/100: 100% |██████████| 120/120 [01:2300:00, 1.44it/s, loss=12.34, obj_loss=5.67]```第一个数字出来那一刻,心里才算踏实。训练没崩,数据流通了,剩下的就是调优和等待。 ---## 二、数据配置的“暗坑” YOLO的配置文件里有个细节容易翻车:`classes`数量必须和数据集标注文件里的类别完全对应。我一开始在`data.yaml`里写了: ```yamlnames: ['enemy', 'ally', 'neutral']```但标注文件里第三个类别写的是`neutral_unit`,训练时直接报错`IndexError`。这种错误不会立刻崩,往往跑到一半才暴露。 **经验:** 用这个小脚本先验证一遍: ```pythonimport yamlfrom pathlib import Path# 加载你的data.yamlwith open('data.yam

更多文章