CS224W4.1——PageRank

编程入门 行业动态 更新时间:2024-10-26 07:31:45

CS224W4.1——<a href=https://www.elefans.com/category/jswz/34/1753495.html style=PageRank"/>

CS224W4.1——PageRank

在这篇中,我们将关注如何将图表示为矩阵,并讨论我们可以探索的后续属性。我们定义了PageRank的概念,进一步探索随机游走,并引入矩阵分解作为生成节点嵌入的视角。在第一部分,我们将介绍PageRank作为在图中对节点重要性进行排序的方法。在这样做时,我们提出了PageRank的矩阵公式,并展示了与解决图上随机游走的平稳分布的联系。

文章目录

  • 1. 将网络视为图结构
  • 2. 给不同页面(节点)排序:
  • 3. Link Analysis 算法
    • 3.1 Links as votes思想
    • 3.2 PageRank——流式模型
    • 3.3 与Random Walk联系
    • 3.4 与特征向量联系
  • 4. 总结

在后续中,我们将图表示为矩阵:

  • 这可以让我们通过随机游走去定节点的重要性。
  • 可以通过矩阵分解方法获得节点embedding

1. 将网络视为图结构

将网页看作有向图,以链接指向作为边的方向(这个网页/节点能直接跳转到的网页就作为其下一个节点successor)将网页看作有向图,以链接指向作为边的方向(这个网页/节点能直接跳转到的网页就作为其下一个节点successor):

其他可表现为有向图形式的信息网络示例:论文引用,百科全书中词条间的互相引用:

将Web网络看作有向图结构:

2. 给不同页面(节点)排序:

3. Link Analysis 算法

  1. 在图中,我们想要定义节点的重要性,通过网络图链接结构来为网页按重要性分级rank。目前有3种常见用以计算图中节点重要性的方法:
  2. PageRank
  3. Personalized PageRank (PPR)
  4. Random Walk with Restarts

衡量节点重要性:认为一个节点的链接越多,那么这个节点越重要。有向图有in-coming links和out-going links两种情况。可以想象,in-links比较不容易造假,比较靠谱,所以用in-links来衡量一个节点的重要性。可以认为一个网页链接到下一网页,相当于对该网页重要性投了票(vote)。所以我们认为一个节点的in-links越多,那么这个节点越重要。同时,我们认为来自更重要节点的in-links,在比较重要性时的权重更大。这就成了一个递归的问题。所以要计算一个节点的重要性就要先计算其前驱节点的重要性,计算这些前驱节点的重要性又要先计算它们前驱节点的重要性。

3.1 Links as votes思想

3.2 PageRank——流式模型

  1. ageRank是谷歌搜索用的算法,用于对网页的重要性进行排序。在搜索引擎应用中,可以对网页重要性进行排序,从而辅助搜索引擎结果的网页排名。
  2. 在现实世界中,将整个互联网视作图

主要思想:

矩阵形式:

举例:

3.3 与Random Walk联系

3.4 与特征向量联系

4. 总结

更多推荐

CS224W4.1——PageRank

本文发布于:2023-12-02 05:28:32,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1651778.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:PageRank

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!