余弦相似度而不用欧式距离?"/>
【小笔记】为什么文本相似度要用余弦相似度而不用欧式距离?
欧式距离
它计算的是高维空间中两个点之间的绝对距离,不考虑向量的方向性
余弦相似度
它计算的是两个向量夹角的cos值,只关注向量的方向,不考虑向量的绝对大小(因为不管长短,都会除以模变成单位向量),这也是它的缺点。
一个只关注距离,一个只关注方向,为什么NLP就选择了余弦相似度呢?
为什么?
更多推荐
【小笔记】为什么文本相似度要用余弦相似度而不用欧式距离?
余弦相似度而不用欧式距离?"/>
它计算的是高维空间中两个点之间的绝对距离,不考虑向量的方向性
它计算的是两个向量夹角的cos值,只关注向量的方向,不考虑向量的绝对大小(因为不管长短,都会除以模变成单位向量),这也是它的缺点。
一个只关注距离,一个只关注方向,为什么NLP就选择了余弦相似度呢?
更多推荐
【小笔记】为什么文本相似度要用余弦相似度而不用欧式距离?
发布评论