激活函数可视化对比：用Python和Matplotlib亲手绘制sigmoid、tanh、ReLU及其梯度图

张开发

• 2026/4/22 2:31:54 • 15 分钟阅读

分享文章

激活函数可视化对比：用Python和Matplotlib亲手绘制sigmoid、tanh、ReLU及其梯度图

激活函数可视化实战用Python绘制并解析神经网络核心组件在深度学习的世界里激活函数如同神经网络的灵魂它们决定了神经元是否应该被激活以及激活到什么程度。对于初学者来说理解这些函数的特性往往停留在数学公式层面而缺乏直观感受。本文将带你用Python和Matplotlib亲手绘制sigmoid、tanh、ReLU等常见激活函数及其梯度图通过可视化手段揭示它们的核心特性。1. 环境准备与基础设置在开始绘制之前我们需要配置好Python环境并导入必要的库。推荐使用Anaconda作为Python环境管理器它可以方便地处理各种依赖关系。import numpy as np import matplotlib.pyplot as plt plt.style.use(seaborn) # 使用更美观的绘图风格为了确保绘图的准确性我们需要定义一个统一的x值范围。大多数激活函数在-8到8的区间内已经能够展示其主要特征x np.linspace(-8, 8, 1000) # 生成-8到8之间的1000个均匀分布点提示使用linspace而不是arange可以确保在边界点也能正确采样避免绘图时出现不连续现象。2. Sigmoid函数经典的S型曲线2.1 函数定义与绘制Sigmoid函数是最早被广泛使用的激活函数之一它将任意实数输入映射到(0,1)区间非常适合作为二分类问题的输出层。def sigmoid(x): return 1 / (1 np.exp(-x)) plt.figure(figsize(10, 5)) plt.plot(x, sigmoid(x), labelSigmoid, linewidth3) plt.title(Sigmoid Function, fontsize15) plt.xlabel(x, fontsize12) plt.ylabel(sigmoid(x), fontsize12) plt.grid(True, alpha0.3) plt.legend(fontsize12) plt.show()关键观察点当x0时函数值为0.5当x趋近于正无穷时函数值趋近于1当x趋近于负无穷时函数值趋近于0函数在原点附近近似线性在两端呈现饱和状态2.2 梯度分析Sigmoid函数的导数有一个有趣的特点它可以用函数本身表示。这在计算上非常高效。def sigmoid_derivative(x): s sigmoid(x) return s * (1 - s) plt.figure(figsize(10, 5)) plt.plot(x, sigmoid_derivative(x), labelSigmoid Derivative, linewidth3, colororange) plt.title(Sigmoid Function Derivative, fontsize15) plt.xlabel(x, fontsize12) plt.ylabel(gradient, fontsize12) plt.grid(True, alpha0.3) plt.legend(fontsize12) plt.show()梯度图揭示了Sigmoid函数的一个主要缺点当输入值的绝对值较大时梯度会变得非常小称为梯度消失问题这使得深层网络难以训练。3. Tanh函数改进的S型激活3.1 函数特性与实现Tanh函数可以看作是Sigmoid函数的缩放和平移版本它将输入映射到(-1,1)区间具有零中心化的特性。def tanh(x): return np.tanh(x) # 也可以使用 (np.exp(x) - np.exp(-x)) / (np.exp(x) np.exp(-x)) plt.figure(figsize(10, 5)) plt.plot(x, tanh(x), labelTanh, linewidth3, colorgreen) plt.title(Tanh Function, fontsize15) plt.xlabel(x, fontsize12) plt.ylabel(tanh(x), fontsize12) plt.grid(True, alpha0.3) plt.legend(fontsize12) plt.show()与Sigmoid相比Tanh的优势在于输出以0为中心有利于下一层的处理梯度在原点附近更强有助于加快收敛速度3.2 梯度表现Tanh函数的导数同样可以用函数本身表示这使得计算非常高效。def tanh_derivative(x): return 1 - tanh(x)**2 plt.figure(figsize(10, 5)) plt.plot(x, tanh_derivative(x), labelTanh Derivative, linewidth3, colorred) plt.title(Tanh Function Derivative, fontsize15) plt.xlabel(x, fontsize12) plt.ylabel(gradient, fontsize12) plt.grid(True, alpha0.3) plt.legend(fontsize12) plt.show()虽然Tanh解决了Sigmoid的一些问题但它仍然存在梯度消失的问题特别是在深层网络中。4. ReLU函数简单而强大4.1 ReLU及其变体ReLU(Rectified Linear Unit)因其简单性和有效性成为现代深度学习中最常用的激活函数。def relu(x): return np.maximum(0, x) plt.figure(figsize(10, 5)) plt.plot(x, relu(x), labelReLU, linewidth3, colorpurple) plt.title(ReLU Function, fontsize15) plt.xlabel(x, fontsize12) plt.ylabel(ReLU(x), fontsize12) plt.grid(True, alpha0.3) plt.legend(fontsize12) plt.show()ReLU的主要优点计算非常简单只有比较和取最大值操作在正区间不会出现梯度消失问题能够产生稀疏激活有助于模型压缩4.2 梯度与死亡ReLU问题ReLU的梯度在正区间为1负区间为0def relu_derivative(x): return np.where(x 0, 1, 0) plt.figure(figsize(10, 5)) plt.plot(x, relu_derivative(x), labelReLU Derivative, linewidth3, colorbrown) plt.title(ReLU Function Derivative, fontsize15) plt.xlabel(x, fontsize12) plt.ylabel(gradient, fontsize12) plt.grid(True, alpha0.3) plt.legend(fontsize12) plt.show()死亡ReLU问题当输入始终为负时神经元将永远不激活对应的权重也不会更新。为了解决这个问题研究者提出了几种变体变体名称公式特点Leaky ReLUmax(αx, x) α0.01负区间有小的斜率Parametric ReLUmax(αx, x) α可学习负区间斜率可自适应ELUx if x0 else α(exp(x)-1)负区间平滑过渡均值接近05. 综合对比与应用建议5.1 函数对比可视化将三种主要激活函数放在同一坐标系中比较plt.figure(figsize(12, 6)) plt.plot(x, sigmoid(x), labelSigmoid, linewidth2) plt.plot(x, tanh(x), labelTanh, linewidth2) plt.plot(x, relu(x), labelReLU, linewidth2) plt.title(Activation Functions Comparison, fontsize15) plt.xlabel(x, fontsize12) plt.ylabel(Activation, fontsize12) plt.grid(True, alpha0.3) plt.legend(fontsize12) plt.show()5.2 梯度对比可视化plt.figure(figsize(12, 6)) plt.plot(x, sigmoid_derivative(x), labelSigmoid Derivative, linewidth2) plt.plot(x, tanh_derivative(x), labelTanh Derivative, linewidth2) plt.plot(x, relu_derivative(x), labelReLU Derivative, linewidth2) plt.title(Activation Function Derivatives Comparison, fontsize15) plt.xlabel(x, fontsize12) plt.ylabel(Gradient, fontsize12) plt.grid(True, alpha0.3) plt.legend(fontsize12) plt.show()5.3 实际应用选择指南根据不同的网络层和任务类型激活函数的选择也有所不同隐藏层首选ReLU及其变体特别是深层网络对于浅层网络可以尝试Tanh避免使用Sigmoid输出层二分类问题Sigmoid多分类问题Softmax回归问题线性激活无激活函数特殊架构LSTM/GRUTanh和Sigmoid组合生成对抗网络特定情况下可能使用Tanh注意激活函数的选择并非绝对实际效果需要通过实验验证。现代深度学习框架使得切换激活函数非常容易建议在开发过程中进行多种尝试。

更多文章

前端开发 2026/4/22 2:21:15

React与ChatGPT API开发智能文本改写工具实践

1. 项目概述：基于React与ChatGPT的智能改写工具开发最近在内容创作领域，文本改写工具的需求量激增。无论是营销文案的A/B测试、学术论文的查重规避，还是多平台内容分发的格式适配，都需要快速生成语义相同但表述不同的文本变体。传…

5分钟极速搭建跨平台文件共享：DockerSamba全攻略为什么选择Docker部署Samba？ 每次需要在不同设备间共享文件时，传统Samba配置总让人头疼——Windows和macOS的权限机制差异、Linux下的复杂参数调试，还有那些莫名其妙的连接失败提示…

张开发

前端开发 2026/4/22 1:13:32

CSS代码如何快速重构_使用Sass的@import逻辑重组结构

张开发

激活函数可视化对比：用Python和Matplotlib亲手绘制sigmoid、tanh、ReLU及其梯度图

最新文章

告别报错！在Vue-CLI创建的Electron项目里优雅使用ipcRenderer（附完整通信示例）

用Python+OpenCV给YOLOv5加个‘眼睛’：手把手教你实现车道线检测（附完整代码）

ADS新手避坑指南：用Smith圆图搞定LNA输入输出匹配，别再被‘自动生成’坑了

从组装到精通：BUFF67 V3 R2双模PCB的蓝牙5.2连接与多设备切换实战

ORB_SLAM3实战：IMU与相机时间戳不同步？手把手教你解决D435i数据融合的“老大难”问题

动物森友会存档编辑器NHSE：打造你的完美岛屿生活体验

推荐文章

《前沿洞察：AI 面试季、Agent 开发痛点与人机协作架构的未来》

别再插错线了！一张图看懂USB 2.0/3.0线序与颜色定义（附ZYNQ开发板实测）

别再只靠复位了！Xilinx FIFO IP核清空的三种实战方法（附Verilog代码）

如何在 CGO 中正确处理带 const char- 参数的 C 回调函数

JavaScript的Symbol.unscopables：影响with语句行为的属性

一次由Nginx的proxy_pass尾随斜杠引发的重定向循环

相关文章

如何为AMD 780M APU解锁2-3倍AI性能？ROCmLibs-for-gfx1103终极优化指南

企业内网必看：用U盘搞定Ubuntu服务器Docker离线部署（含依赖树分析）

OpenCode智能编程助手全面部署指南：从环境搭建到高级应用

大语言模型背后的秘密：从预训练到微调，揭秘LLM高效训练的核心技术（含QLoRA/ZeRO实战）

RBDdimmer：嵌入式AC相位调光库详解

新手零失败指南：利用快马ai轻松完成openclaw的ubuntu环境搭建

分享文章

更多文章

React与ChatGPT API开发智能文本改写工具实践

一键安装mysql8.0.44（附脚本）

从CAN信号到暗电流：手把手教你搭建ADAS控制器实验室测试环境（含工具清单）

如何5分钟从图表中提取数据：WebPlotDigitizer完整指南

给ESP8266智能时钟加个‘离线记忆’：断网后如何优雅显示上次天气数据（附完整代码）

从一条CAN报文说起：深入理解J1939多帧传输（BAM/TP.DT）的底层逻辑与抓包分析

第 35 课：任务详情抽屉与地址栏同步

收藏｜2026最新版大语言模型（LLM）系统化学习路线，小白程序员都适用

计算机毕业设计：Python农产品电商数据可视化分析大屏 Flask框架数据分析可视化机器学习数据挖掘大数据大模型（建议收藏）✅

从零搭建PHP本地开发环境：除了phpStudy，你还可以试试手动配置Apache+PHP（含环境变量详解）

告别虚拟机！用Docker容器5分钟搞定Samba共享，Mac/Win/Linux都能用

CSS代码如何快速重构_使用Sass的@import逻辑重组结构