【机器学习基础】信息熵（Information Entropy）及其部分应用|电子爱好者

admin管理员组
文章数量:1638819

熵

来自维基百科的定义：

在信息论中，熵（英语：entropy）是接收的每条消息中包含的信息的平均量，又被称为信息熵、信源熵、平均自信息量。这里，“消息”代表来自分布或数据流中的事件、样本或特征。

熵最好理解为不确定性的量度而不是确定性的量度，因为越随机的信源的熵越大。

普遍人物熵是代表了混乱程度，熵越大，则越混乱。

信息熵

信息熵（Information Entropy）是度量样本集合纯度最常用的一种指标。假定当前样本集合 D D D中第 k k k类样本所占的比例为 p k ( k = 1 , 2 , . . . , ∣ Y ∣ ) p_k(k = 1,2,...,|Y|) pk(k=1,2,...,∣Y∣)，则 D D D的信息熵定义为

E n t ( D ) Ent(D) Ent(D)的值越小，则 D D D的纯度越高。

举例说明：

以下事件发生概率和为 1 1 1：

两个事件，事件 A A A发生概率为 1 1 1，事件 B B B发生概率为 0 0 0，经计算信息熵为0。
两个事件，事件 A A A发生概率为 1 / 3 1/3 1/3，事件 B B B发生概率为 2 / 3 2/3 2/3，经计算信息熵为0.918。
两个事件，每个事件发生的概率为 1 / 2 1/2 1/2，经计算信息熵为1。
三个事件，每个事件发生的概率为 1 / 3 1/3 1/3，经计算信息熵为1.585。
四个事件，每个事件发生的概率为 1 / 4 1/4 1/4，经计算信息熵为2。

可见事件发生的种种情况中，越稳定，则信息熵越小。

部分应用

1. 决策树

决策树中ID3算法利用信息增益进行计算，C4.5算法利用增益率进行计算，均用到了信息熵。

2. 主动学习 Active Learning

在Uncertainty Sampling策略中计算不确定度可以利用信息熵，根据预测类别的混乱程度判断不确定度。
在Query by Committee策略中选择query instance时也利用到了信息熵，根据投票结果的混乱程度。

参考

部分参考：
《机器学习》, 周志华, 2012
Active Learning, B Settles, 2012.

本文标签：机器基础信息 Entropy information

版权声明：本文标题：【机器学习基础】信息熵（Information Entropy）及其部分应用内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/xitong/1729279987a1193943.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Variation information（信息差异指标）

2小时前

Variation information（信息差异指标） #信息差异指标介绍在概率论和信息论中，信息或共享信息距离的变化是对两个聚类（元素分区&

深度多视图信息瓶颈：Deep Multi-view Information Bottleneck

2小时前

论文题目：Deep Multi-view Information Bottleneck Summary 单个视图的信息瓶颈模型已经发展较为成熟，但尚未有在多视图上的信息瓶颈理论&#xf

java.lang.SecurityException: class “xxxx“‘s signer information does not match signer information

2小时前

java.lang.SecurityException: class “org.bouncycastle.jcajce.provider.symmetric.IDEA$Mappings”s signer information does n

cannot load information for github.com

2小时前

今天上传一个项目到GitHub，提交到git上都没问题，到了分享到GitHub上时报了个错误，说网络连接超时，不能加载GitHub信息解决办法&am

idea编译报错：Information:java: javacTask: 源发行版 8 需要目标发行版 1.8

2小时前

解决方法：点击File->Setting->Build, Execution, Deployment-> Compiler->Java Compiler，选择对应的项目&a

Information:java: Errors occurred while compiling module

2小时前

Information:java: Errors occurred while compiling module ‘lucene-first’ Information:javac 1.8.0_162 was used to compile

The information provided for this listener is currently in use by other software on this computer

2小时前

根据 linux安装Oracle11G 安装oracle，到 #13 以静默方式配置监听时报如下错误： [oracle@56server ~]$ netca silent responseFile homeoracleresp

Information:java: Errors occurred while compiling module ‘xxx‘

2小时前

问题如下：原因： 导入模块的发行版与正在使用的idea不一致解决： 以下设置与模块一致 1.FILE->project structure2.FILE-

Neural Information Processing System --神经信息处理系统NIPS 顶级会议

2小时前

Practice The deep learning toolbox IO modalities architectures losses deep learning building models Three details :Pl

Guideline 2.1 - Information Needed 审核被拒的问题

2小时前

最近上架app大量被拒，且Guideline 2.1 - Information Needed类型特变多。可能苹果针对进行新增的规则），所有app机审遇到就自动被拒并回复此类邮件。一、大概意思如下准则 2.1-所需信息这种类型的应用

在线BCI衡量指标丨信息传输速率 Information Transfer Rate

2小时前

在线BCI衡量指标丨信息传输速率 Information Transfer Rate 用来衡量在线脑机接口系统的一个重要指标：信息传输速率ITR。摘自论文：Brain-computer inte

Error during job, obtaining debugging information... FAILED: Execution Error, return code 2 from org

2小时前

报错： Error during job, obtaining debugging information... FAILED: Execution Error, return code 2 from org.apac

关于审核被拒Guideline 2.1 - Information Needed的问题

2小时前

刚开始看到这个问题的时候懵逼了，卧槽怎么这么多，问了一些朋友，也有不少遇到类似情况的，我自己的看法，应该是机器审核在过年这段时间新

ansys workbench 中模态分析的solution information都包含什么信息？

1小时前

以Z方向的模态信息为例 （1）MODE FREQUENCY 模态频率 （注意不是圆频率！！！&#

【Java学习笔记】 Information:javac 1.8.0_181 was used to compile java sources

1小时前

导入新包然后运行的时候，报错”无效的发行版“、”javac 1.8.0_181 was used to compile java sources“ 报错原因：因为Idea中已经配置了jdk 1.

启动服务器时Information:javac 1.8.0_181 was used to compile java sources解决办法

1小时前

https:blog.csdnlameraaaarticledetails96325535

linux教程— license information(license not accepted)

1小时前

问题： vm 下启动CentOs7时，出现一个license information页面解决办法： 出现license information，即说

System Volume Information清理

1小时前

综述关于System Volume Information占用的大量磁盘空间步骤进入控制面板： 系统和安全系统系统保护成功！

Information:Internal caches are corrupted or have outdated format, forcing project rebuild问题处理办法

1小时前

Intellij编译报 Information:Internal caches are corrupted or have outdated format, forcing project rebuild等拒绝访问异常之处理办法&

centos7 安装出现 license information(license not accepted)解决办法

1小时前

安装centos7出现license这个提示。大概意思就是需要通过许可信息，提供两种办法跳过这个环节。 1 输入1-回车 2-回车 c-回车 c-回车，之后就可以进入系统 2 输入1-回车 2-回

电子爱好者 - 最新技术资讯及电子产品介绍！

【机器学习基础】信息熵（Information Entropy）及其部分应用

目录

熵

信息熵

部分应用

1. 决策树

2. 主动学习 Active Learning

参考

更多相关文章

Variation information（信息差异指标）

深度多视图信息瓶颈：Deep Multi-view Information Bottleneck

java.lang.SecurityException: class “xxxx“‘s signer information does not match signer information

cannot load information for github.com

idea编译报错：Information:java: javacTask: 源发行版 8 需要目标发行版 1.8

Information:java: Errors occurred while compiling module

The information provided for this listener is currently in use by other software on this computer

Information:java: Errors occurred while compiling module ‘xxx‘

Neural Information Processing System --神经信息处理系统NIPS 顶级会议

Guideline 2.1 - Information Needed 审核被拒的问题

在线BCI衡量指标丨信息传输速率 Information Transfer Rate

Error during job, obtaining debugging information... FAILED: Execution Error, return code 2 from org

关于审核被拒Guideline 2.1 - Information Needed的问题

ansys workbench 中模态分析的solution information都包含什么信息？

【Java学习笔记】 Information:javac 1.8.0_181 was used to compile java sources

启动服务器时Information:javac 1.8.0_181 was used to compile java sources解决办法

linux教程— license information(license not accepted)

System Volume Information清理

Information:Internal caches are corrupted or have outdated format, forcing project rebuild问题处理办法

centos7 安装出现 license information(license not accepted)解决办法

发表评论

推荐文章

计算机桌面word不见怎么办,电脑桌面word 电脑桌面上word不见了怎么办

Rme Babyface Pro FS娃娃脸声卡安装调试教程

按键手机java下载_经典按键java手机游戏

红队培训班作业 | 免杀过360和火绒 四种方法大对比

出厂安卓11的机型之VAB架构的详细分析

热门文章

BulkCopy from source table to destination table with a column whose type is different

apple music学生订阅续期认证网页打不开问题解决办法

用DevStack安装OpenStack(单机)

JAVA里面的关键字&quot;extends&quot; &amp;&quot;implement&quot;有什么区别

一根网线同时搭载电信itv及网络 解决方案

PSP游戏卡 列表展示

使用Bootkit绕过Windows 登录密码

使用HTTPTunnel绕过企业封端口

OpenAI被币圈黑客盗号，15个月内第四起，网友：还敢相信他们的AI安全吗？

如何重装系统win7(怎么重装系统win7)

最新文章

ABB机器人示教器无法读取U盘怎么办

【嵌入式linux】U盘自动识别和挂载

centos7能读取的u盘格式_在CentOS7CentOS6中支持exfat格式的U盘

centos7能读取的u盘格式_CentOS 7 挂载ntfs磁盘格式的U盘

linux虚拟机系统如何读取u盘文件,linux如何读取U盘

qt读取U盘文件

deepin学习笔记--u盘无法识别

Linux读取U盘文件——挂载与卸载

linux 无法识别NTFS格式的u盘

Ubuntu18.0.4版本无法识别外部U盘的解决方法

U盘的工作原理（读取和存储数据）

解决virtualbox虚拟机unbuntu20.04无法识别u盘、sd卡

戴尔笔记本不能识别U盘和鼠标解决方法

qt linux不能读写u盘文件,Qt读取U盘文件内容

centos7能读取的u盘格式_centos7 加载 exfat格式U盘

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

红队培训班作业 | 免杀过360和火绒四种方法大对比

JAVA里面的关键字"extends" &"implement"有什么区别

一根网线同时搭载电信itv及网络解决方案

PSP游戏卡列表展示

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载