Greedy Match学习笔记一 —— 匹配原理及SAS实现

编程入门行业动态更新时间:2024-10-09 22:22:42

Greedy Match<a href=https://www.elefans.com/category/jswz/34/1770117.html style= 学习笔记一 —— 匹配原理及SAS实现"/>

Greedy Match学习笔记一 —— 匹配原理及SAS实现

Greedy Match 是基于 Greedy Algorithm 的思想，根据实验组样本在受到特定干预前的各项属性，贪婪的、不放回的生成一个虚拟对照组的方法。该方法的思想清晰透明，且可以根据需要灵活调整约束条件。在大样本的情况下，可以很好的生成所需的对照组。

Greedy Algorithm(贪婪算法)简介

基本思想

贪婪算法的核心在于，在每一个阶段，都选择当前阶段的局部最优解。在大多数情况下，依靠这种方法并不能得到全局最优解，但这个算法可以很有效率的逼近全局最优，而且它得到的路径在每个小范围内来看都是“很优秀”的。

构造逻辑

在生成虚拟对照组这一问题上，Greedy Algorithm的思路如下：
1. 不放回。
按一定的逻辑从实验组取出一样本，然后在对照池（control pool）中寻找最佳匹配。成功后再取另一样本，从剩余的对照池中寻找最佳匹配。若还存在阈值，则每次需检查最佳匹配间的距离是否超过阈值，若超过则需舍弃。

2. 1:K mapping。
若K>1，则先对实验组的全部样本1:1寻找其最佳匹配，再将整个过程重复K次（不放回）。

何为最佳匹配

最佳匹配意味着对照池中的该样本和选取的样本距离最近。
下面是几种常见的距离定义：
1. 欧氏距离（Euclidean distance）

d1(x⃗ ,y⃗ )=(x1−y1)2+⋯+(xn−yn)2−−−−−−−−−−−−−−−−−−−−−−√ $d_1(\vec{x},\vec{y})=\sqrt{(x_1-y_1)^2+\dots+(x_n-y_n)^2}$
2. 曼哈顿距离（Manhattan Distance）
d2(x⃗ ,y⃗ )=|x1−y1|+⋯+|xn−

更多推荐

Greedy Match学习笔记一 —— 匹配原理及SAS实现

本文发布于:2024-02-13 21:17:19，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/34/1760241.html