新方法精确定位统计离群值的根本原因

张开发

• 2026/5/8 16:28:09 • 15 分钟阅读

分享文章

新方法识别统计离群值的根本原因在某机构ICML论文中提出了一种量化因果贡献的信息论测量方法。离群值是系统偏离其通常行为的罕见观测结果。它们出现在许多现实世界的应用中例如医学、金融并且比普通事件更需要解释。如何在检测到离群值后识别其“根本原因”离群值问题是统计学中最古老的问题之一。它作为学术研究的主题已有一个多世纪。尽管在检测离群值方面已做了大量工作但一直缺乏定义离群值“根本原因”的正式方法。本周在国际机器学习大会ICML上我们展示了关于识别离群值根本原因的研究工作。首要任务是引入“根本原因”的正式定义因为在学术文献中未能找到这样的定义。相关内容某机构为DoWhy贡献了新颖的因果机器学习算法新功能超越了传统的效应估计将事件归因于复杂系统的各个组成部分。该定义包含了对观察到的离群值的每个根本原因的量化因果贡献的形式化。换句话说该贡献描述了一个变量在多大程度上对离群事件负责。这也与哲学问题相关即使事件是否是其他事件的“实际原因”这一纯粹定性的问题在哲学家中也一直存在争论。该方法基于图形化因果模型这是一个由图灵奖得主朱迪亚·珀尔开发的用于建模系统中变量间因果关系的正式框架。它有两个关键要素。第一个是因果图它以可视化的方式表示观测变量之间的因果关系箭头从代表原因的节点指向代表结果的节点。第二个是一组因果机制它描述了每个节点的值如何从其因果图中的父节点即直接原因的值生成。例如想象一个由分布式网络服务驱动的零售网站。某个客户经历了异常缓慢的加载时间。为什么是后端的数据库缓慢还是购物服务出现故障左侧显示了为简单假设的零售网站提供支持的分布式网络服务之间的依赖关系。中间一个客户ID 5经历了非常慢的加载时间。目标是在分布式服务中识别出其根本原因右侧。存在许多离群值检测算法。为了识别由这些算法之一检测到的离群值的根本原因首先引入了一个信息论IT离群值得分该得分从概率角度校准了现有的离群值得分。该离值得分依赖于尾概率的概念——即随机变量超过某个阈值的概率。一个事件的IT离群值得分是在某种变换下该事件尾概率的负对数。其灵感来自克劳德·香农在信息论中对随机事件信息内容的定义。观察到比所讨论事件更极端事件的概率越低该事件携带的信息就越多其IT离群值得分就越大。概率校准还使得IT离群值得分在不同维度、范围和尺度的变量之间具有可比性。反事实为了将离群事件归因于一个变量我们提出反事实问题“如果该变量的因果机制是正常的该事件还会是离群值吗”反事实是珀尔因果关系阶梯的第三级因此需要函数因果模型FCM作为变量的因果机制。相关内容在相关时间序列中确定因果关系新方法超越了格兰杰因果关系在给定某些图约束的情况下仅识别目标时间序列的真正原因。在FCM中每个变量 Xj 是其因果图中观测父节点 PAj有指向 Xj 的直接箭头和一个未观测噪声变量 Nj 的函数。由于根节点——那些没有观测父节点的节点——只有噪声变量因此噪声变量的联合分布产生了观测变量的随机特性。未观测噪声变量扮演着特殊角色可以将 Nj 视为一个随机开关它从一组由直接原因 PAj 到其效果 Xj 定义的函数 Fj 中选择一个确定性函数或机制。如果不是固定噪声项 Nj 的值而是将其设置为从某个分布中随机抽取的值那么从集合 Fj 中选取的函数也是随机的并且可以使用此过程为 Xj 分配正常的确定性机制。如果认为噪声变量是不受控制的东西——甚至更糟是无法观测的——这种随机化操作可能看起来不可行但我们可以将其解释为对观测变量的干预。左侧对于变量 Xj 及其父节点 PAj 的观测对 (xj, paj)变量 Xj 的确定性机制 fj(1) 由与对 (xj, paj) 对应的噪声值Nj 1标识。中间不同的噪声值Nj n标识了反事实的确定性机制 fj(n)。右侧通过根据某种分布随机抽取噪声项 Nj 的样本为 Xj 分配“正常”的确定性机制橙色背景表示替换。为了将目标变量 Xn 的离群事件 xn 归因于变量 Xj首先将 Xj 的确定性机制替换为正常的因果机制。然后测量这种替换对离群事件对数尾概率的影响。为了将离群事件 xn属于目标变量 Xn归因于变量 Xj首先将其观测值 xj 对应的确定性机制替换为正常机制。这种替换对对数尾概率的影响定义了 Xj 对离群事件的贡献。特别地该贡献衡量了通过将 Xj 的因果机制替换为正常机制通过随机抽取噪声 Nj 的样本离群事件发生的可能性降低的倍数。但以这种方式计算的贡献取决于替换因果机制的顺序。这种对顺序的依赖性给归因过程带来了任意性。为了消除对变量顺序的依赖性我们取所有顺序的平均贡献这也是博弈论中沙普利值方法背后的思想。沙普利贡献之和等于离群事件的IT离群值得分。为了了解该方法工作原理的概要再次考虑上面提到的零售网站示例。网络服务之间的依赖关系通常以依赖图的形式提供。通过反转依赖图中的箭头得到服务延迟的因果图。从观测延迟的训练样本中学习因果机制。因果机制也可以直接利用领域专业知识建立。该方法利用这些因果机制将特定客户的缓慢加载时间归因于网络服务中最有可能的根本原因。左侧是服务延迟的因果图这是通过反转服务依赖图的箭头得到的。通过学习训练数据中节点的因果机制该方法得出每个节点对离群事件的贡献——这里指的是异常高的网络服务延迟。由于沙普利贡献之和等于离群事件的IT离群值得分能够显示祖先节点——这里是各个服务——的相对贡献。如果想将该方法应用于你的使用场景其实现可在 Python DoWhy 库的“gcm”包中找到。要快速入门可以查看示例笔记本。研究领域机器学习标签因果推断 | 因果分析 | ICMLFINISHED更多精彩内容请关注我的个人公众号公众号办公AI智能小助手或者我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享

更多文章

前端开发 2026/5/8 16:28:10

STEP3-VL-10B保姆级教程：小白也能轻松上手的多模态AI

STEP3-VL-10B保姆级教程：小白也能轻松上手的多模态AI 1. 认识STEP3-VL-10B多模态模型 STEP3-VL-10B是阶跃星辰开源的一款轻量级多模态基础模型，拥有100亿参数规模。这个模型最大的特点就是"小而强"——虽然参数规模不算特别大，但…

Qwen3-VL-8B-Instruct-GGUF效果展示：跨文化图片理解准确率92% 在人工智能快速发展的今天，多模态模型已经成为理解和处理视觉语言任务的核心技术。Qwen3-VL-8B-Instruct-GGUF作为阿里通义Qwen3-VL系列的中量级"视觉-语言-指令"模型&#xff0c…

张开发

前端开发 2026/5/8 16:39:06

ESP32嵌入式地图渲染：OSM瓦片轻量级获取与双核解码

1. OpenStreetMap-esp32 库深度技术解析：面向嵌入式GIS应用的轻量级地图渲染框架 1.1 项目定位与工程价值 OpenStreetMap-esp32 是一个专为 ESP32 平台设计的、高度集成化的开源地图获取与缓存库，其核心目标并非构建完整 GIS 系统，而是解决…

张开发

新方法精确定位统计离群值的根本原因

最新文章

2025最权威的五大AI论文神器解析与推荐

圣诞手势特效指挥圣诞节交互魔法树项目源码

认识BLE MESH架构和实际开发过程

智能体工作流：用规范文件与MCP协议重塑AI编程协作

保姆级教程：用PSIM 2022给DSP28335的ADC采样数据‘拍个照’并SCI发回电脑

基于AgentScope框架构建多智能体协作平台：从GitHub项目到实战部署

推荐文章

全面掌握AssetRipper：从Unity资源提取到多平台部署的完整指南

LLM个性化评估技术：方法与实战解析

终极AI翻唱生成器AICoverGen：零代码实现专业级声线定制与歌曲翻唱

从流水灯到中断处理：手把手教你用Verilog在FPGA上玩转MIPS模型机

NVIDIA Omniverse Kit 106：云端OpenUSD应用开发指南

开发者如何将ChatGPT无缝集成到本地开发环境与工作流

相关文章

R 4.5新增s2_geometry()函数实测：全球10亿点集距离计算耗时从47分钟降至89秒（附基准测试完整复现代码）

Hotkey Detective：3分钟解决Windows热键冲突的完整指南

5步掌握跨平台数据采集：MediaCrawler智能爬虫工具终极指南

预推免‘赶考’全记录：一周内辗转广州、长沙四场线下复试的真实体验与行程攻略

HALCON 20110 + Python 3.8 环境搭建避坑指南：从dll配置到复杂测量功能实现

算法公平性审查官认证考试全攻略：软件测试从业者的进阶之路

分享文章

更多文章

STEP3-VL-10B保姆级教程：小白也能轻松上手的多模态AI

LevelDB终极指南：如何实现高性能键值存储与多媒体元数据管理

如何使用Amber语言实现安全的数据保护策略

Stable Diffusion v2-1-base零基础入门：从环境搭建到AI绘画精通指南

嵌入式天气API开发：OAuth1.0a与JSON解析实战

CD-HIT高效序列聚类：从原理到实战的完整解决方案

操作系统资源管理：在Windows/WSL2上高效运行Realistic Vision V5.1

Ostrakon-VL-8B保姆级部署：Ubuntu 22.04 + vLLM 0.6.3 + Chainlit 1.3.10 兼容配置

避坑指南：face_recognition库CUDA加速配置中的常见问题与解决方案

八层PCB叠层设计原理与高速信号布线实战

Qwen3-VL-8B-Instruct-GGUF效果展示：跨文化图片理解（如春节场景/西方节日）准确率92%

ESP32嵌入式地图渲染：OSM瓦片轻量级获取与双核解码

新方法精确定位统计离群值的根本原因

最新文章

2025最权威的五大AI论文神器解析与推荐

圣诞手势特效指挥 圣诞节交互魔法树项目源码

认识BLE MESH架构和实际开发过程

智能体工作流：用规范文件与MCP协议重塑AI编程协作

保姆级教程：用PSIM 2022给DSP28335的ADC采样数据‘拍个照’并SCI发回电脑

基于AgentScope框架构建多智能体协作平台：从GitHub项目到实战部署

推荐文章

全面掌握AssetRipper：从Unity资源提取到多平台部署的完整指南

LLM个性化评估技术：方法与实战解析

终极AI翻唱生成器AICoverGen：零代码实现专业级声线定制与歌曲翻唱

从流水灯到中断处理：手把手教你用Verilog在FPGA上玩转MIPS模型机

NVIDIA Omniverse Kit 106：云端OpenUSD应用开发指南

开发者如何将ChatGPT无缝集成到本地开发环境与工作流

相关文章

R 4.5新增s2_geometry()函数实测：全球10亿点集距离计算耗时从47分钟降至89秒（附基准测试完整复现代码）

Hotkey Detective：3分钟解决Windows热键冲突的完整指南

5步掌握跨平台数据采集：MediaCrawler智能爬虫工具终极指南

预推免‘赶考’全记录：一周内辗转广州、长沙四场线下复试的真实体验与行程攻略

HALCON 20110 + Python 3.8 环境搭建避坑指南：从dll配置到复杂测量功能实现

算法公平性审查官认证考试全攻略：软件测试从业者的进阶之路

分享文章

更多文章

圣诞手势特效指挥圣诞节交互魔法树项目源码