admin管理员组

文章数量:1646316

这是一种检验样本数据概率分布(例如正态分布)的方法。
使用方法如下:
fig = plt.figure()
res = stats.probplot(train[‘SalePrice’], plot=plt) #默认检测是正态分布
plt.show()

红色线条表示正态分布,蓝色线条表示样本数据,蓝色越接近红色参考线,说明越符合预期分布(这是是正态分布)

q-q 图是通过比较数据和正态分布的分位数是否相等来判断数据是不是符合正态分布

本文标签: statsprobplotqq