admin管理员组

文章数量:1578033

做SEO的,如果不懂搜索引擎的工作原理是很难恰当开展工作的。前几天给学生讲SEO课程中的搜索引擎工作原理时,很多同学表示不太懂。后来我画了搜索引擎主要工作流程的示意图给大家,很多同学表示“懂了”。
我们先来看搜索引擎的主要工作:页面收录、页面分析、页面排序及关键字查询。搜索引擎的工作流程是:页面收录——页面分析——页面排序——关键字查询。
一、搜索引擎工作原理——页面收录

 
搜索引擎工作原理示意图——页面收录流程

页面收录的最终目的是将网站上的内容加入到URL列表,积累URL资源。
第一步:搜索引擎的爬行程序(俗称蜘蛛)发现网站,来到网站上。也就是说网站首先要存在,且能够被蜘蛛发现。比如我的博客www.xiaoyuqiang如果要被搜索引擎收录,首先要存在而且要有内容。

第二步:蜘蛛开始对入口页面进行抓取,并存储入口的原始页面,包含页面的抓取时间、URL、最后修改时间等。存储原始页面的目的是为了下次到来比对页面是否有更新,蜘蛛喜欢经常更新的网站。
第三步:提取URL,提取URl包含两个两个内容:域名URL和内部URL。域名URL即网站首页地址,如

本文标签: 工作原理搜索引擎