sklearn feature selection特征选择|电子爱好者

admin管理员组
文章数量:1650765

一、特征选择器

1. sklearn.feature_selection.SelectKBest(score_func, k)

Select features according to the k highest scores.

其中参数score_func是评分函数，默认是f_classif ; k默认为10，指定选择特征的个数。

2. sklearn.feature_selection.SelectFpr(score_func, alpha=0.05): score_func参数默认如上。

根据FPR测试选择alpha以下的pvalues。FPR测试代表假阳性率/误检率测试。它控制错误检测的总量。

false-positive rate(误检率)= sum(fp) / (sum(fp)+sum(tn))

其中P值就是当原假设为真时，比所得到的样本观察结果更极端的结果出现的概率”。如果P值很小，就表明，在原假设为真的情况下出现的那个分布里面，只有很小的部分，比出现的这个事件更为极端。

P值	碰巧的概率	对无效假设	统计意义
P>0.05	碰巧出现的可能性大于5%	不能否定无效假设	两组差别无显著意义
P<0.05	碰巧出现的可能性小于5%	可以否定无效假设	两组差别有显著意义
P <0.01	碰巧出现的可能性小于1%	可以否定无效假设	两者差别有非常显著意义

3. sklearn.feature_selection.SelectFdr(score_func=<function f_classif>, alpha=0.05)

选择估计的错误发现率的p值

这使用Benjamini-Hochberg程序。 alpha是预期错误发现率的上限。

二、Score_func

1. feature_selection.chi2(X, y) : 基于卡方检验

2. feature_selection.mutual_info_classif(X, y)：基于互信息

3. feature_selection.f_classif(X, y)：计算所提供样本的ANOVA F值，即方差分析F值（F检验）。

三、应用实例

from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris 


# 获取iris数据集
iris = load_iris()
X_data = iris.data
y_data = iris.target

X_train, X_test, y_train, y_test = train_test_split(X_data, y_data, \
                                                    test_size = 0.25, random_state = 1)

from sklearn.feature_selection import SelectKBest, chi2
skb = SelectKBest(chi2, k=2)

X_train_chi2 = skb.fit_transform(X_train, y_train)
X_test_chi2 = skb.transform(X_test)

from sklearn.linear_model import LogisticRegression
lr = LogisticRegression(random_state = 1)
lr.fit(X_train_chi2, y_train)
print('Test accuracy: %.3f' % lr.score(X_test_chi2, y_test))

Test accuracy: 0.684

[source]

本文标签：特征 sklearn feature Selection

版权声明：本文标题：sklearn feature selection特征选择内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1729534393a1205228.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

Direct3D 12 Graphics Hardware Feature Levels

5小时前

To handle the diversity of video cards in new and existing machines, Microsoft Direct3D 11 introduced the concept of fea

Emulator: handleCpuAcceleration: feature check for hvf Emulator: added library vulkan-1.dll的一种解决办法

5小时前

这几天玩Android Studio的时候虚拟手机总是有小问题，明显感觉有些功能不对，甚至到后面返回键那些都失效了。找了很多方法都不行。后来重新下载了一个新的虚拟手机，不到几

Epic & Feature & Story & Task

5小时前

1、华为云访问地址 https:auth.huaweicloudauthuilogin 2、Epic & Feature & Story & Task 含义 （1）

2.在代码中分析VINS---图解特征点管理(feature_manager.h)

5小时前

这篇博客主要讲解VINS中特征点的管理，它主要涉及3个类，位于feature_manager.h中的FeaturePerFrame、FeaturePerId、FeatureManager 1.特征

筛选重要特征的方法feature_importance_

5小时前

排列表示： importancesmodel.feature_importances_ indicesnp.argsort(importances)[::-1]feat_labelsX_train.c

特征匹配损失（feature matching loss，LFM），区别于但相似于感知损失

5小时前

目录 1.特征匹配损失 2. 感知损失 3.特征匹配损失英文 4.参考文献 1.特征匹配损失其中，中的k主要为了对高分辨率进行的多尺度进行判别，k1,2,3表示为原图、2倍下采样、4倍下

学习笔记 | Feature Toggle

5小时前

Feature Toggle 是一种开发技术，允许团队在不更改代码或者修改少量代码的情况下修改系统行为控制特性发布控制突发事件权限策略测试策略 Feature Toggle优点（与feature

Few-shot Object Detection via Feature Reweighting

5小时前

Few-shot Object Detection via Feature Reweighting 模型组成Feature ExtractorReweighting ModulePrediction Layer 训练策略摘要&#x

git feature分支远落后于dev分支解决方案

5小时前

在团队合作中，每个人基本都是从dev分支建立自己的feature分支，完成feature分支开发任务后，merge到dev分支。如果我们的feature分支开发周期十分长&a

Android studio运行模拟器报错handleCpuAcceleration: feature check for hvf 和added library vulkan-1.dll

5小时前

可以参考这篇文章的内容：地址

ECharts 使用toolbox.feature.saveAsImage.type设置图片导出格式

5小时前

1 使用详解 toolbox.feature.saveAsImage.type 说明：选择保存的图片格式。默认：png 。参数类型：string。可选值&am

openlayers 给Feature提供修改撤销功能

5小时前

最近在开发燃气管道布线gis系统，需要用到openlayers，功能需要自己做一个撤销的功能，openlayers API找了一圈没有发现有提供相应的api&#xff

特征选择 feature_importance

5小时前

%matplotlib inlineimport matplotlib.pyplot as pltimport seaborn as snscolorsns.color_palette()sns.set_style(darkgr

RESA: Recurrent Feature-Shift Aggregator for Lane Detection 论文阅读+代码复现(车道线检测)

5小时前

文章目录 RESA: Recurrent Feature-Shift Aggregator for Lane Detectionadvantages:上采样数据集贡献相关工作traditional methodsdeep learning

Android Studio：missing feature Watch

5小时前

导入一个项目，修改gradle、version，忙活了一阵开始run。因为我手机API太低，于是我用虚拟机，但是新建虚拟机准备跑，

Opendaylight将自己写的feature添加到控制器当中

5小时前

背景在Opendaylight中提供了将自己写的feature添加到karaf中。第一步，拷贝文件首先，我们需要编译自己的项目，这一步可以参照官网的指导 mvn

成功解决python3装库时ImportError: cannot import name ‘Feature‘ from ‘setuptools‘报错

5小时前

错误提示：ImportError: cannot import name Feature from setuptools 查阅相关文档发现是setuptool版本的问题，python3源中的se

安装matlab2020a出现 Unable to open the requested feature. Check your internet connection and proxy sett

4小时前

安装matlab2020a出现 Unable to open the requested feature. Check your internet connection and proxy settings in MATLAB Web p

【语义分割】DFANet --Deep Feature Aggregation for Real-Time Semantic Segmentation

4小时前

efficient inferrence speed and high accuracy with high resolution Architecture DFANet从整体上可看做是encoder-decoder结构&#xf

FSSD: Feature Fusion Single Shot Multibox Detector论文笔记

4小时前

论文：FSSD: Feature Fusion Single Shot Multibox Detector caffe实现：链接我自己的更高精度的pytorch实现在这：

电子爱好者 - 最新技术资讯及电子产品介绍！

sklearn feature selection特征选择

更多相关文章

Direct3D 12 Graphics Hardware Feature Levels

Emulator: handleCpuAcceleration: feature check for hvf Emulator: added library vulkan-1.dll的一种解决办法

Epic &amp; Feature &amp; Story &amp; Task

2.在代码中分析VINS---图解特征点管理(feature_manager.h)

筛选重要特征的方法feature_importance_

特征匹配损失（feature matching loss，LFM），区别于但相似于感知损失

学习笔记 | Feature Toggle

Few-shot Object Detection via Feature Reweighting

git feature分支远落后于dev分支解决方案

Android studio运行模拟器报错handleCpuAcceleration: feature check for hvf 和added library vulkan-1.dll

ECharts 使用toolbox.feature.saveAsImage.type设置图片导出格式

openlayers 给Feature提供修改撤销功能

特征选择 feature_importance

RESA: Recurrent Feature-Shift Aggregator for Lane Detection 论文阅读+代码复现(车道线检测)

Android Studio：missing feature Watch

Opendaylight将自己写的feature添加到控制器当中

成功解决python3装库时ImportError: cannot import name ‘Feature‘ from ‘setuptools‘报错

安装matlab2020a出现 Unable to open the requested feature. Check your internet connection and proxy sett

【语义分割】DFANet --Deep Feature Aggregation for Real-Time Semantic Segmentation

FSSD: Feature Fusion Single Shot Multibox Detector论文笔记

发表评论

推荐文章

vue预览pdf文件的几种方法_vue pdf预览

mac bigsur 360极速浏览器闪退问题解决方法

启动Matlab安装包时出现Unable to open the requested feature.

U盘的资料删除了还能恢复吗？U盘误删除文件恢复技巧分享

关于Ubuntu系统重启后桌面图标和应用变大的解决方案

热门文章

pe系统如何读取手机_什么是otg(pe系统如何读取手机)

linux ubuntu14.04安装QQ，只需三条命令。

【转】word 高效经典教程

大型软件系统设计与体系结构Chapter12

修改ArcGIS Server Account站点管理员的 账号、密码

计算机管理服务没有nvidia,win7没有nvidia控制面板怎么解决 电脑没有nvidia控制面板解决方法...

Windows10专业版任务栏右下角按钮左键无效右键有效的问题的解决

from sklearn.feature_extraction.text import CountVectorizer

Python下载酷狗音乐歌曲

python爬虫教程：爬取酷狗音乐

最新文章

驰为vi10旗舰版linux,驰为Vi10平板电脑完全安装Win10步骤 BY Chinasred

windows7系统屏幕一直闪屏的解决教程

windows7电脑删除文件特别慢的解决方法

iwork8旗舰版 android,性能彪悍 双面神兽——酷比魔方iwork8旗舰版体验

win7如何设置通电自动开机_windows7自动开机怎么设置？

计算机文件预览取消,关闭视频文件预览，保留图片文件预览（windows7） -电脑资料...

Win7 64位旗舰版系统取消电脑开机自动检测硬盘的方法

如何避免计算机被别人共享,win7如何防止别人偷窥电脑 win7防止别人偷窥电脑操作方法...

如何把win7电脑设置成网站服务器吗,如何为win7电脑设置服务器

windows7电脑怎么永久关闭广告

Windows7共享文档—开启方法及用户权限设置

计算机管理记事本,win7旗舰版系统下自带记事本的强大功能汇总【图文详解】...

计算机全盘搜索功能不见了,新萝卜家园win7旗舰版电脑中的搜索功能不见了怎么办...

电脑Windows7系统上的appdata是什么文件夹

电脑windows7系统环境Framework 4.6.2无法安装的解决方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Epic & Feature & Story & Task

修改ArcGIS Server Account站点管理员的账号、密码

计算机管理服务没有nvidia,win7没有nvidia控制面板怎么解决电脑没有nvidia控制面板解决方法...

iwork8旗舰版 android,性能彪悍双面神兽——酷比魔方iwork8旗舰版体验

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载