admin管理员组

文章数量:1660165

  • OOB:


列gi为从已有的资料中选出的一部分,行(Xi,Yi)为资料元数据。矩阵中红星代表未选中,Di代表被gi选中.



打红星的即为OOB。



N笔资料里面抽N笔资料(有放回抽样),(Xn,Yn)未被选中的概率为

N足够大时,极限为1/e


  • OOB versus Validation

1. 打红星的资料在训练时没被用到。

2. 用打红星的资料验证小gt?没这个必要。

3. 用打红星的资料验证大G?  Yes!用Eoob来检测大G的表现。


Eoob在RF中衡量大G的表现时相当准确。

这样就不用再专门划分训练集和验证集。


  • Fun Time
Q:

A:2.(1/e)

本文标签: 台大机器笔记RFbag