搜名吧 - 汇聚各行业优秀网站大全!
百度360必应搜狗淘宝本站头条
当前位置:网站首页 > SEO技术 > 正文

SEO新手入门系列2022(三):搜索引擎工作原理

admin 2024-12-21 23:59 2 浏览 0 评论

通过《SEO新手入门系列2022(二):SEO 101》这篇文章已经简单的介绍了什么是SEO,和搜索引擎,这一篇文章来详细的介绍下搜索引擎的工作原理,搜索引擎的工作顺序大致是:抓取网页(Crawing)建立索引(Indexing),排名显示(Ranking)

就像在前一篇文章提到的,搜索引擎就是一个问答机器,他们去挖掘,理解,组织网上能发现的任何信息,然后把他们以相关的方式组织起来,再返回给使用者,为了能把你的网站展现给用户之前,最重要的一件事就是你的网站能够被搜索引擎发现 ,否则在SEPRs(搜索引擎结果页)是不会有你网站信息的。

搜索引擎是怎么工作的?

就如SEO小也开头说的,搜索引擎想把网站信息提供给用户,需要完成三个主要任务:

  • 爬取网站(Crawing)会有很多蜘蛛程序,顺着URL一个网站一个网站的爬取网站内容。
  • 创建索引(Indexing)对蜘蛛爬取的内容进行分类,创建相关索引,并储存在数据库中。
  • 建立排名(Ranking)为可能的问题建立相关性排名,相关性最高的内容排在靠前的位置。

当然其中的技术实现是非常复杂的,作一名SEO新人,可能占时不需要深究这些问题,SEO小也在大学毕业的时候,作的毕业设计就是搜索引擎,当然那时候是使用第三方的索引分词库,我们大部分时间只要配置规则就可以,更深入的内容我会另写些篇文章来分享。

搜索引擎抓取(Crawing)

搜索引擎要想把相关内容展示给用户,第一步做的就是派出他的小弟——搜索引擎爬虫(蜘蛛),他们会不停的抓取互联网上新的内容,或者更新数据库中旧的内容,内容的形式多种多样,有可能是网页,PDF文件,MP3音频文件,什么形式都有,但是他们都是通过URL去找到这些内容的。


SEO新手入门系列2022(三):搜索引擎工作原理


搜索引擎一开始会有一些种子URL,这些URL都是一些质量比较高的链接地址,而且蜘蛛们就会顺着这些地址不断的往下抓取,在这个过程中,新发现的链接又会被作为新一轮爬取任务的种子URL,直到没有新的链接可以爬取。

搜索引擎索引(Indexing)

建立索引是一个非常复杂的过程,这个过程涉及的内容比较多的是计算机方面的内容,有算法,有地理环境,有社会学研究等等因素,搜索引擎会根据很多参数去控制这些内容的分类,但是最重要的一点,就是这些内容的相关性,相关性越高,被分在同一个分类的可能性就越高,建立索引是为了后期能快速展现给用户作准备,也是为排名提供数据基础。

搜索引擎排名(Ranking)

用户在搜索引擎输入框输入他的关键词,搜索引擎会用惊人的效率在他庞大的索引数据库中找到相关的内容,并按内容的相关性和一些其它的参数来对内容进行排序,这个过程就是搜索引擎排名,靠前的内容,在搜索引擎看来就是和用户的问题相关性越高的回答。

如果我们不想让搜索引擎把一些内容展示给用户,这也是可以办到的,但是大多数情况下我们不会这么做,搜索引擎优化的目的就是为了让用户看到我们,并能让搜索引擎优先展示我们想给用户看的内容。

搜索引擎能找到你么?

就像前面说的,如果要让自己的网站出现在SERPs中,那前提就是让网站被搜索引擎蜘蛛爬取和索引,如果你已经有了网站,你可以使用site命令来查看自己网站被收录的情况,就拿SEO小也为例,在谷歌搜索框输入site:www.seozen.top你可以看到如下类似的结果:


SEO新手入门系列2022(三):搜索引擎工作原理


可以看到SEO小也已经有135个网页已经被谷歌收录,这个结果是经常会变动的,能看到一个大概的数据,并不是特别的精准,还有很多没有显示的网页,用一些关键词也是能搜索到。如果想看更精准的结果,可以使用Google Search Console在收录功能中查看,这就相当于我们百度的站长平台,但是SEO小也个人觉得比百度站长的作用要大的多,所以SEO小也一般只会看GSC的数据,很少去看百度站长平台的数据,以后也会专门写几篇文章来介绍。

如果你使用site命令找不到网站的收录,那有可能是下面几种原因:

  • 网站是新站,搜索引擎还没有收录。
  • 网站没有外部导入链接,可以到一些平台发一些外链。
  • 网站目录结构太深,太复杂,让搜索引擎爬虫抓取的效率太低。
  • 网站可能包含一些阻止搜索引擎爬虫的代码,如noindexnofollow
  • 网站可能被搜索引擎处罚,因为一些作弊或者垃圾广告等。

我们有时候把精力太多的放在如何让搜索引擎抓取内容,却忽略如何不让搜索引擎不要爬取一些内容,比如说一些重复的页面,一些搜索参数,还有比如说公司的联系方式,留言等,这些内容被收录意义并不大,而且还会让搜索引擎不知道具体哪个界面是你最想展示给用户的,所以这时候我们就要告诉搜索引擎,哪些资源他不要花时间去爬取,这就要robots.txt文件出场了,这篇SEO教程先到这。

相关推荐

SEO整站优化值得注意的4个细节
SEO整站优化值得注意的4个细节

SEO日常工作中,我们最为常做的几件事情就是批量的生产内容,定期更新链接,这基本上是每个SEO人员常做的一些事情,但有的时候,我们仍然会忽略一小问题,比如:内链...

2024-12-21 23:59 admin

SEO新手入门系列2022(三):搜索引擎工作原理
SEO新手入门系列2022(三):搜索引擎工作原理

通过《SEO新手入门系列2022(二):SEO101》这篇文章已经简单的介绍了什么是SEO,和搜索引擎,这一篇文章来详细的介绍下搜索引擎的工作原理,搜索引擎的...

2024-12-21 23:59 admin

SEO新手入门系列2022(七):站内SEO优化
SEO新手入门系列2022(七):站内SEO优化

前一篇文章主要围绕站内内容优化,这篇文章继续说一些站内SEO优化方法。其实想要做好站内优化,就要先把一些基础优化做好,基础的优化占到了站内优化比例90%左右,最...

2024-12-21 23:59 admin

SEO优化:如何挖掘谷歌关键词-实例讲解(2022最新)
  • SEO优化:如何挖掘谷歌关键词-实例讲解(2022最新)
  • SEO优化:如何挖掘谷歌关键词-实例讲解(2022最新)
  • SEO优化:如何挖掘谷歌关键词-实例讲解(2022最新)
  • SEO优化:如何挖掘谷歌关键词-实例讲解(2022最新)
谷歌为什么不收录你的网站?
谷歌为什么不收录你的网站?

谷歌不收录你的网站,有很多潜在问题可能阻止谷歌收录你的网站,本文为您总结了13种可能的原因。1.网站域名设置不正确Google不收录您的网站,这可能是因为您为...

2024-12-21 03:48 admin

SEO入门一篇就够-SEO教程
SEO入门一篇就够-SEO教程

SEO是什么?大家口中的SEO(SearchEngineOptimization),中文翻译为“搜索引擎优化”,从本质上来说,其实就是如何迎合搜索引擎的规则...

2024-12-21 03:48 admin

谷歌SEO优化入门:Google SEO优化方法(2022最新)
谷歌SEO优化入门:Google SEO优化方法(2022最新)

在写这篇文章的时候,SEO小也先挖掘了下什么网站关键词适合当标题,这篇文章分享如何做谷歌SEO优化,内容是谷歌推荐的SEO方法,本来想用SEO优化方案作为标题关...

2024-12-21 03:22 admin

新站百度不收录的原因和解决办法(2022最新)
  • 新站百度不收录的原因和解决办法(2022最新)
  • 新站百度不收录的原因和解决办法(2022最新)
  • 新站百度不收录的原因和解决办法(2022最新)
  • 新站百度不收录的原因和解决办法(2022最新)
什么是长尾关键词?如何挖掘长尾关键词-SEO优化2022
什么是长尾关键词?如何挖掘长尾关键词-SEO优化2022

首先给大家说说什么是长尾关键词,我们SEO的关键字一般由“短词”和“长词”组成,比如说“租车”,这个租车就是“短词”,包含的意思就很多了,在搜索引擎的收录量上也...

2024-12-21 03:22 admin

做网站SEO优化要注意以下三个方面
做网站SEO优化要注意以下三个方面

众所周知,网站SEO的目的是让网站的关键词在搜索引擎中排名靠前,但是除了网站的关键词排名之外,还有很多方面需要考虑,...

2024-07-02 00:30 admin

新手站长在SEO过程中会遇到什么问题
新手站长在SEO过程中会遇到什么问题

在SEO的过程中,我们不可避免地会遇到这样或那样的问题,特别是当我们次接触SEO的时候,现在当搜索引擎每天更新800...

2024-07-02 00:30 admin

影响网站排名的五个因素
影响网站排名的五个因素

据说影响网站排名的因素有300多个,但对于网站优化来说,把这300个因素考虑进去,使之完善,是不现实的,也是不必要的...

2024-07-02 00:30 admin

为什么网站是稳定更新还没有排名?
为什么网站是稳定更新还没有排名?

网站每天更新,没有排名?成都SEO认为很多朋友都遇到过这个问题,那么如何解决这个问题呢?很多朋友认为网站可以通过每天...

2024-07-02 00:30 admin

网站坚持发布原创文章有利于排名吗?
网站坚持发布原创文章有利于排名吗?

网站是否坚持原创文章做好排名?虽然百度现在越来越重视原创文章,但很多SEO网站的站长,特别是一些新手站长认为,只要坚...

2024-07-02 00:30 admin

响应式网站和传统网站有什么区别?
响应式网站和传统网站有什么区别?

传统的网站建设可以说是“过去式”的产物。到目前为止,各行业企业基本告别了传统网站,一小部分企业还停留在传统网站上,这...

2024-07-02 00:30 admin

取消回复欢迎 发表评论: