分类任务中常用的损失函数有哪些？

张开发

• 2026/6/7 22:00:14 • 15 分钟阅读

分享文章

1. Binary Cross Entropy (BCE, 二元交叉熵)公式−[ylog⁡(y^)(1−y)log⁡(1−y^)]-[y\log(\hat{y}) (1-y)\log(1-\hat{y})]−[ylog(y^)(1−y)log(1−y^)]特点专门用于二分类任务。衡量预测概率分布与真实分布0或1之间的差异。核心机制当真实标签为1时预测值越接近1损失越小当真实标签为0时预测值越接近0损失越小。对错误分类的惩罚呈指数级增长。搭配通常与Sigmoid激活函数配合使用。2. Cross Entropy Loss (Categorical Cross Entropy, 交叉熵损失)公式−∑yilog⁡(y^i)-\sum y_i \log(\hat{y}_i)−∑yilog(y^i)特点BCE 在多分类任务上的推广。用于衡量两个概率分布的距离。核心机制希望预测概率集中在真实类别上。只要真实类别对应的预测概率高损失就会很小。搭配通常与Softmax激活函数配合使用确保输出是一个概率分布和为1。3. Hinge Loss (合页损失)公式max⁡(0,1−y⋅y^)\max(0, 1 - y \cdot \hat{y})max(0,1−y⋅y^)特点主要用于支持向量机 (SVM)。核心机制它不仅要求分类正确还要求分类确信度足够高函数间隔大于1。只有当样本被正确分类且距离决策边界超过一定范围时损失才为0。区别不像交叉熵那样关注概率它更关注分类的边界。4. KL Divergence (KL 散度 / 相对熵)公式DKL(P∣∣Q)∑P(x)log⁡P(x)Q(x)D_{KL}(P || Q) \sum P(x) \log \frac{P(x)}{Q(x)}DKL(P∣∣Q)∑P(x)logQ(x)P(x)特点衡量两个概率分布PPP真实分布和QQQ预测分布之间的“距离”。与交叉熵的关系交叉熵熵KL散度 \text{交叉熵} \text{熵} \text{KL散度}交叉熵熵KL散度在分类任务中因为真实分布PPP的熵是常数所以最小化交叉熵等价于最小化 KL 散度。用途更多用于生成模型如 VAE、GAN或知识蒸馏而在普通分类任务中直接使用 Cross Entropy 更为普遍和直接。总结对比表损失函数适用任务典型场景核心特点Binary Cross Entropy二分类逻辑回归、神经网络输出层输出概率配合 SigmoidCross Entropy Loss多分类图像分类、文本分类输出概率分布配合 SoftmaxHinge Loss二分类支持向量机 (SVM)追求最大间隔不输出概率KL Divergence分布匹配生成模型、知识蒸馏衡量分布相似度非对称

分类任务中常用的损失函数有哪些？

最新文章

图灵机：什么是计算的本质？

Windows任务栏透明化解决方案：TranslucentTB技术深度解析与实践指南

大模型 Prompt Engineering 实战与模式总结：解锁 LLM 的隐藏能力

微信聊天记录如何实现永久保存与智能分析？WeChatMsg工具深度解析

别再硬解方程了！用PyTorch搭建你的第一个物理信息神经网络（PINN），5分钟搞定一维热传导

FanControl华硕主板兼容性终极指南：3步解决传感器识别难题

推荐文章

CSDN AI数字营销卡片配置手册（跳转权限解禁版）：官方未公开的3种合规跳转变通方案

MetaGPT 插件开发：扩展 AI Agent Harness Engineering 功能的实战教程

类型化特征架构：用类型系统解决机器学习特征复用难题

网盘直链下载助手：免费解锁8大网盘高速下载的终极指南

从DeepWalk到GraphSAGE：Node Embeddings技术演进与选型避坑指南

终极游戏资源编辑器：Harepacker-resurrected完整指南与实战教程

相关文章

终极ESP32 Arduino开发指南：从零开始快速上手物联网项目

如何打造个人专属的数字记忆库：WeChatMsg终极数据管理指南

Windows 11下SecureCRT 8.5安装激活全攻略（附注册机与避坑指南）

Gemini推送通知优化终极手册（2024Q2最新API v1.5实测数据+AB测试报告）

【Gemini社交媒体运营实战指南】：20年AI营销专家亲授7大高转化内容公式

保姆级教程：在Ubuntu 22.04上为GStreamer 1.22编译NVIDIA NVENC/NVDEC插件（含CUDA 12.x适配）

分享文章

更多文章

被测需求理解

GetQzonehistory：重新定义个人数字记忆管理

陈刚直言 | 工业 AI 做不成产品，不在 AI，而在泛化能力

Sora 2艺术作品重现成功率提升400%的关键参数矩阵（含12维超参对照表+GPU显存优化阈值红线）

在 VS Code 里打开 ABAP 开发对象，从一个快捷键开始理解现代 ABAP 开发体验

微软机器学习峰会：虚拟化转型下的前沿技术深度解析与参与指南

HarmonyOS 组件参数类型校验怎么做才对？TypeUtil 全面实战

告别批次效应困扰：手把手教你用scVI整合单细胞RNA-seq数据（Python实战）

FPGA图像处理避坑指南：帧差法多目标跟踪在Zynq平台上的实战与优化（以Artix7/Kintex7为例）

React基础

别再用笨方法了！给Firefly RK3588开发板做系统备份，这招更省硬盘空间

资源等待与系统吞吐—— 从线程、连接到 TCP 带宽利用率