自然语言处理NLP培训讲师叶梓:人工智能之最新NLP自然语言处理技术与实战"/>
自然语言处理NLP培训讲师叶梓:人工智能之最新NLP自然语言处理技术与实战
接上一页
P39-P40
向量空间模型
VSM将文档表示为一个向量空间中的一个向量,
由所有文档中提取出来的词典和各份文档构成的一个矩阵。
余弦相似度
• 文本处理中最常用的相似性度量方式是余弦距离。 • 根据向量在其向量空间的坐标值,求得它们的夹角, 夹角越小,它们的方向更加吻合,则越相似 。 • 夹角大小通过计算得出的余弦值来表示,夹角越小,余弦值越接近于 1 。因此,余弦值就可以用来表示这两个向量的相似性。未完,下一篇继续……
更多推荐
自然语言处理NLP培训讲师叶梓:人工智能之最新NLP自然语言处理技术与实战
发布评论