- OOB:
列gi为从已有的资料中选出的一部分,行(Xi,Yi)为资料元数据。矩阵中红星代表未选中,Di代表被gi选中.
打红星的即为OOB。
N笔资料里面抽N笔资料(有放回抽样),(Xn,Yn)未被选中的概率为
N足够大时,极限为1/e
则
- OOB versus Validation
1. 打红星的资料在训练时没被用到。
2. 用打红星的资料验证小gt?没这个必要。
3. 用打红星的资料验证大G? Yes!用Eoob来检测大G的表现。
Eoob在RF中衡量大G的表现时相当准确。
这样就不用再专门划分训练集和验证集。
- Fun Time
A:2.(1/e)
更多推荐
台大机器学习听课笔记---RF 10-2 Out-Of-Bag Estimate
发布评论