疝气病病症预测病马的死亡率(逻辑回归)"/>
从疝气病病症预测病马的死亡率(逻辑回归)
写在前面: 我是「虐猫人薛定谔i」,一个不满足于现状,有梦想,有追求的00后
\quad
本博客主要记录和分享自己毕生所学的知识,欢迎关注,第一时间获取更新。
\quad
不忘初心,方得始终。
\quad❤❤❤❤❤❤❤❤❤❤
文章目录
- 数据预处理
- Logistic回归
- 结果
- 总结
数据预处理
数据集来自2010年1月11日的UCI机器学习数据库
该数据集存在的主要问题就是部分数据缺失,因此,在数据预处理阶段,我们主要解决此问题。
如何处理数据中的缺失值呢?
- 使用可用的特征的均值来填补缺失值
- 使用特殊值来填补缺失值
- 忽略有缺失值的样本
- 使用相似样本的均值填补缺失值
- 使用另外的机器学习算法预测缺失值
在数据预处理阶段,我们主要做两件事,第一件是用实数0来替换所有缺失值,第二件是对数据类别标签缺失的数据进行丢弃操作。
数据集如下所示
Logistic回归
使用Logistic回归方法进行分类时,我们需要把测试集上的每个特征向量乘以最优化方法得到的回归系数,再将该乘积的结果求和,最后喂给Sigmoid函数即可。
如果对应的sigmoid值大于0.5,就预测类别标签为1,否则为0。
import numpy as np# 使用逻辑回归来预测病马的死亡率def sigmoid(inX):"""sigmoid函数"""
更多推荐
从疝气病病症预测病马的死亡率(逻辑回归)
发布评论