学习笔记一 —— 匹配原理及SAS实现"/>
Greedy Match学习笔记一 —— 匹配原理及SAS实现
Greedy Match学习笔记一 —— 匹配原理及SAS实现
Greedy Match 是基于 Greedy Algorithm 的思想,根据实验组样本在受到特定干预前的各项属性,贪婪的、不放回的生成一个虚拟对照组的方法。该方法的思想清晰透明,且可以根据需要灵活调整约束条件。在大样本的情况下,可以很好的生成所需的对照组。
Greedy Algorithm(贪婪算法)简介
基本思想
贪婪算法的核心在于,在每一个阶段,都选择当前阶段的局部最优解。在大多数情况下,依靠这种方法并不能得到全局最优解,但这个算法可以很有效率的逼近全局最优,而且它得到的路径在每个小范围内来看都是“很优秀”的。
构造逻辑
在生成虚拟对照组这一问题上,Greedy Algorithm的思路如下:
1. 不放回。
按一定的逻辑从实验组取出一样本,然后在对照池(control pool)中寻找最佳匹配。成功后再取另一样本,从剩余的对照池中寻找最佳匹配。若还存在阈值,则每次需检查最佳匹配间的距离是否超过阈值,若超过则需舍弃。
2. 1:K mapping。
若K>1,则先对实验组的全部样本1:1寻找其最佳匹配,再将整个过程重复K次(不放回)。
何为最佳匹配
最佳匹配意味着对照池中的该样本和选取的样本距离最近。
下面是几种常见的距离定义:
1. 欧氏距离(Euclidean distance)
2. 曼哈顿距离(Manhattan Distance)
d2(x⃗ ,y⃗ )=|x1−y1|+⋯+|xn−
更多推荐
Greedy Match学习笔记一 —— 匹配原理及SAS实现
发布评论