可解释机器学习- LIME模型讲解｜interpretable machine learning-LIME|电子爱好者

admin管理员组
文章数量:1609902

原理
计算流程
优势
劣势
Reference

原理

LIME生成了一个新的数据集，数据集由扰动的样本（permuted samples）和黑箱模型对应的预测构成。LIME在这个数据集上训练一个可解释模型（比如lasso或决策树），该模型根据生成样本与真实样本的近似程度（proximity）来加权
如何生成扰动的样本：
- 对于图像和文字，可以通过隐藏一些像素点（pixels）或单词
- 对于表格数据（tabular），LIME对于每一个特征单独进行扰动，比如说从正态分布中采样，该正太分布由特征的均值和方差决定
LIME是在保持可解释模型复杂度较低的情况下，尽可能减小loss（可解释模型与原始模型的接近程度，也就是对扰动后产生的数据集拟合）
但在实际应用中，用户需要确定复杂度

计算流程

选择ML模型和需要解释的样本点
生成样本
根据生成样本，使用blackbox模型产生预测值
对样本进行加权，权重是生成样本点和参考点的相似程度，相似程度通过不同的核函数进行计算（比如RBF kernel）
加权线性回归，回归系数就是对应特征的解释

使用InterpretML对 PCA+Random Forest组合成的黑箱模型进行解释，结果如下

如何使用请参考：https://blog.csdn/qq_41103204/article/details/125796207

优势

即使替换了底层（underlying）的机器学习模型，仍然可以用局部的可解释模型进行解释
当使用lasso或者决策树的时候，解释是简短的（有选择性的），并且是可以比较的（contrastive）。但需要更全面的解释的时候，LIME就不合适了
可用于表格数据（tabular），文本和图像
保真度度量fidelity measure (可解释模型与黑盒预测的近似程度) 使我们很好地了解了可解释模型在解释感兴趣的数据实例附近的黑盒预测方面的可靠性
用局部代理模型创建的解释可以使用除原始模型所用以外的其他 (可解释) 特征。当然，这些可解释的特征必须从数据实例中派生。文本分类器可以将抽象词嵌入作为特征，但解释可以基于句子中是否存在词。回归模型可以依赖于某些属性的不可解释的转换，但是可以使用原始属性来创建解释。与其他方法相比，对LIME 使用可解释特征可能是一个很大的优势，尤其是当模型使用不可解释特征进行训练时。
比如上面的例子，分类模型Random Forest是基于PCA降维后的特征，但是LIME可以把PCA+Random Forest当成一个黑箱，直接在原始数据上进行解释。

劣势

当对表格式数据使用 LIME 时，**正确定义邻域（correct definition of the neighborhood）**是一个很大的未解决的问题，需要尝试不用的核函数，来看解释是否合理
采样可能不合理。现在只通过高斯分布来采样，忽略了特征之间的相关性，这会导致一些不可能的数据出现在训练样本中
解释不稳定（instability）。两个相近的样本点，解释非常不同

从第一张图可以看到，正确的邻域应该是绿色圆圈表示的区域，要尽可能包括ML的线形区域。但是不同的核函数的宽度会带来不同的邻域，如图二。

Reference

https://interpret.ml/
https://christophm.github.io/interpretable-ml-book/
https://towardsdatascience/lime-explain-machine-learning-predictions-af8f18189bfe

本文标签：模型机器可解释 machine Learning

版权声明：本文标题：可解释机器学习- LIME模型讲解｜interpretable machine learning-LIME 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1728577088a1164602.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

[网络安全自学篇] 十.论文之基于机器学习算法的主机恶意代码

2天前

这是作者的系列网络安全自学教程，主要是关于网安工具和实践操作的在线笔记，特分享出来与博友共勉，希望您们喜欢，一起进步。前文分享了Web漏洞及端口扫描之Nmap、ThreatScan和DirBuster工具，社会工程学中的IP物理位置定位、I

工业机器人入门实用教程_机器学习实用入门

2天前

工业机器人入门实用教程 Following on from my earlier post on Data Science, here I will try to summarize and compile the major practi

【linux服务器】大语言模型实战教程：LLMS大模型快速部署到个人服务器

1天前

🎬 鸽芷咕：个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想，就是为了理想的生活!引言说到大语言模型相信大家都不会陌生&a

JustView(Office、CAD、三维模型)在线预览平台调用说明

1天前

简介 justview在线预览平台由自主开发，支持office、图片、pdf、cad、等常用文件在线预览今天，我们新增了三维模型的预览功能，市面上基本上所有三维设计软件

固态硬盘比机器硬盘好很多吗？

1天前

固态硬盘和机械硬盘都好，机械盘价格优廉，固态硬盘读写速度快，（注意主板要支持sata3才更有效）两者各有优缺点&#xff0

2017年最受欢迎的十大机器学习Python库

1天前

1. Pipenv 项目地址：https:githubpypapipenv 2017 年排名第一的 python 库非 Pipenv 莫属。用于管理依赖项的官方推荐工具。 Pipenv 源自大牛 Kennet

总结过去2017年最受欢迎的十大机器学习Python库

1天前

2017 年已经过去，又到了总结的时刻。本文作者把范围限定为机器学习，盘点了 2017 年以来最受欢迎的十大 Python 库；同时在这十个非常流行与强大的 Python 库

盘点2017年最受欢迎的十大机器学习Python库

1天前

选自tryolabs 机器之心编译参与：蒋思源、黄小天、刘晓坤 2017 年即将结束，又到了总结的时刻。本文作者把范围限定为机器学习，盘点了 2017 年以来最受欢迎的十大

【论文笔记】Learning Distinctive Margin toward Active Domain Adaptation(CVPR 2022)

19小时前

论文：https:arxivabs2203.05738 代码：https:githubTencentYoutuResearchActiveLearning-SDM 摘要目前主

重磅！Llama-3，最强开源大模型正式发布！

16小时前

4月19日，全球科技、社交巨头Meta在官网，正式发布了开源大模型——Llama-3。据悉，Llama-3共有80亿、700亿两种参数，分为基础预训

科普文：Java基础系列之【互联网基石：TCPIP四层模型】

15小时前

前言 TCPIP是迄今为止最常用的网络互联协议套件，在全球互联网运营方面发挥了巨大作用，可以这样说TCPIP在互联网世界无处不在！ TCPIP 最初由 DARPA&

Gartner发布采用美国防部模型实施零信任的方法指南：七大支柱落地方法

15小时前

零信任是网络安全计划的关键要素，但制定策略可能会很困难。安全和风险管理领导者应使用美国国防部模型的七大支柱以及 Gartner 研究来设计零信任策略。战略规划假设到 2026 年，10% 的

第十七章模型压缩及移动端部署

12小时前

Markdown Revision 1;Date: 2018114Editor: 谈继勇Contact: scutjy2015163updata:贵州大学硕士张达峰 17.1 为什么需要模型压缩和加速？

我的模型有多快？——深度学习网络模型的运算复杂度、空间占用和内存访问情况计算

12小时前

前段时间看了几个笔试题，涉及模型复杂度，主要是参数量和计算复杂度的问题。当时搜了一下感觉中文网上的内容比较乱。刚好本文是对神经网络模型资源消耗情况的一篇介绍，就不自己写了&a

我的模型有多快？——深度学习网络模型的运算复杂度、空间占用和内存访问情况计算...

12小时前

向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程公众号：datayx 端午情浓，粽飘香免费领取定制珍贵品牌香粽实物见下图，领取方式

Mac下OpenGL环境搭建以及OpenGL解析渲染OBJ模型

9小时前

一、MAC上OpenGL环境搭建方法参考文章：http:my.oschinarockbabyblog102732 Mac下搭建OpenGL环境很简单，建立一个Command Line Tool的 Xcode Applicat

机器学习-Probabilistic interpretation

3小时前

Probabilistic interpretation，概率解释解释为何线性回归的损失函数会选择最小二乘表示误差，表示unmodeled因素或随机噪声，真实的y和预

Deep Learning Meets SAR

3小时前

Deep Learning Meets SAR Abstract Deep learning in remote sensing has become an international hype, but it is mostly li

初识支持向量机(support vector machine)

3小时前

在学习机器学习的时候，当学到支持向量机的时候可能会有一点懵了，这篇文章主要是像大家介绍一下支持向量机的思想，不会有过多的数学。在介绍之前，先看一个非常有意思的故事，故事来源于知乎，原文链接，故事是这样的：在很久以前的情人节，大侠要去救他的

低成本搭建Time Machine 服务器

1小时前

低成本搭建Time Machine 服务器 Time Machine 是什么？自建Time Machine 服务器的理由硬件的选择软件的部署Mac 备份到Time Machine 服务器从Time Machine 服

电子爱好者 - 最新技术资讯及电子产品介绍！

可解释机器学习- LIME模型讲解｜interpretable machine learning-LIME

Contents

原理

计算流程

优势

劣势

Reference

更多相关文章

[网络安全自学篇] 十.论文之基于机器学习算法的主机恶意代码

工业机器人入门实用教程_机器学习实用入门

【linux服务器】大语言模型实战教程：LLMS大模型快速部署到个人服务器

JustView(Office、CAD、三维模型)在线预览平台调用说明

固态硬盘比机器硬盘好很多吗？

2017年最受欢迎的十大机器学习Python库

总结过去2017年最受欢迎的十大机器学习Python库

盘点2017年最受欢迎的十大机器学习Python库

【论文笔记】Learning Distinctive Margin toward Active Domain Adaptation(CVPR 2022)

重磅！Llama-3，最强开源大模型正式发布！

科普文：Java基础系列之【互联网基石：TCPIP四层模型】

Gartner发布采用美国防部模型实施零信任的方法指南：七大支柱落地方法

第十七章 模型压缩及移动端部署

我的模型有多快？——深度学习网络模型的运算复杂度、空间占用和内存访问情况计算

我的模型有多快？——深度学习网络模型的运算复杂度、空间占用和内存访问情况计算...

Mac下OpenGL环境搭建以及OpenGL解析渲染OBJ模型

机器学习-Probabilistic interpretation

Deep Learning Meets SAR

初识支持向量机(support vector machine)

低成本搭建Time Machine 服务器

发表评论

推荐文章

zookeeper客户端连接的使用

计算机如何更新苹果系统,苹果电脑系统怎么升级_苹果电脑升级系统的操作步骤...

服务器无线网卡ap软件,无线网卡虚拟成无线AP工具(将无线网卡虚拟成无线AP软件) 2017最新版...

[Image Interpretation] Object detection

遥感智能解译相关产品及公司

热门文章

混合硬盘计算机,什么是混合硬盘 混合硬盘和固态硬盘的区别详解

天问Block的下载与安装

你真的了解Linux(Deepin)的软件商店吗？（内附极力推荐的软件）

法国工程师IMT联盟 密码学及其应用 2022年期末考试

MiniGui、TinyOS相继开源中，国产loT操作系统大阅兵

手机选择之我见——需求分析

OCP考完提交hands on以后遇到的一个常见问题： needs further clarification

app中常见的测试点

探索地震学的新边界：Seismic DeepLearning框架详解

搭建一台学习主机 乔思伯U1-Plus

最新文章

Win10自动关机设置无效解决方案

在 装的Qt commercial 4.6.0 时报错

Toad DBA Suite for Oracle 12.6 64-bit Commercial 简单连接

Intel Non-Commercial Software Download

Toad for Oracle 10.5.1 Commercial

10电脑睡眠后自动关机怎么回事 win_解决win10睡眠变自动关机的处理方法

电脑定时自动关机的多种实现方法

Toad for Oracle 10.5 Commercial

编译qt-win-commercial-src-4.3.0全过程。

java指令工具_jvm 指令工具 jcmd 命令（Java多功能命令行）

计算机延时关机小程序,电脑自动关机小程序

Windows2000 server + Microsoft Visual Studio 6.0 + Qt-commercial4.22-src编译过程

每日论文推荐：我们距离GPT-4V有多远，最接近GPT-4V的开源多模态大模型

国际贸易术语(incoterms)

smartgit 授权文件 Free Trial License to Non-Commercial

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

第十七章模型压缩及移动端部署

混合硬盘计算机,什么是混合硬盘混合硬盘和固态硬盘的区别详解

法国工程师IMT联盟密码学及其应用 2022年期末考试

搭建一台学习主机乔思伯U1-Plus

在装的Qt commercial 4.6.0 时报错

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载