google-seo网络爬虫浅谈分析

     各位网站长朋友是不是有遇到过,你们的网站一开始被google收录很多,但过一段时间发现越来越来少索引页面在减少,是什么原因?看完下面这篇文章我想你会有所了解.

   Google有两种网络爬虫,主爬虫和新爬虫.主爬虫主要负责发现新的网页、一个网页在新索引建立之后,马上会被主爬虫发现。如果一个网页建立索引需要经过一个月的时间,这个网页就会失效。

   新索引的建立还需要考虑其它非询问式的决定因素。这些决定因素关系着网页排名的高低。为了充分利用这些网页,而不是浪费时间等着下一次索引算法的更新,Google必须采取一些简单的措施来猜测排 名,猜测访客难以利用的新内容是什么.

尽管Google在作猜测,下列内容都是真实可信的:

1 幽灵登陆页上的排名不能等同于索引页的排名。
2 在每月新数据库建立之前,必须将幽灵登陆页从数据库中移走。但是,这只是暂时的移走。

如果您的索引中有这样登陆页,您的主要目标应该是让该页在Google新页上拥有排名。若您想做到这点,您需要定期、有规律、最好是每天,有一定间隔地更新网站内容。

为什么您想要在Google的新页上获取排名?因为在新页上有排名的网站更容易被抓取,索引更容易更新。但是在新页上的排名不是真正的排名,新页排名有很强的不稳定性。新页排名转化为真正排名需要经过一段时间。

Google搜索蜘蛛抓取一个新网页后,这个新网页会有什么反映?

一个新网页没有被Google主目录收取,直到:
1. 该网页被Google主目录搜索蜘蛛抓取。
2. 该网页在被Google主目录搜索蜘蛛抓取之后,须经过一段更新时间。

只有以上两条全都满足,新网页被Google主目录确确实实抓取到,新网页上的排名才有可能转化成真正排名

Google有两种抓取形式
1. 主抓取
2. 新抓取

一个新的网页首先被新抓取蜘蛛抓取。但也有特例的时候。在Google月更新刚刚完成那一段时间之后,一个网页通常被主抓取蜘蛛抓取。每月更新一般在每个月的20号到28号之间,能够持续几天。

为了区分两种蜘蛛的差异,我们可以先来看一下一组IP 地址。

1. “主抓取蜘蛛= 216.239.46.*
2. “
新抓取蜘蛛= 64.68.82.*

为了进一步解释明白新网页发生的Google幽灵现象,我们假设该网页首先被新抓取蜘蛛抓取。在Google两个月更新之间,新抓取蜘蛛来抓取新网页。在主抓取期间,通过链接新网页能够被抓 取。新抓取期间,情况也是一样。

尽管这个网页没有经过此次更新,也没有收录在Google主目录里,但是抓取之后,搜索蜘蛛开始衡量该网页内容和质量,并把该网页收录在搜索结果里。这次衡量是十分不稳定的,易受外界影响,经常发生变化。

   当每月定期更新来临时,这些网页会产生波动。每月定期更新就是Google波动。但是,您需要记住,主抓取蜘蛛没有阅读该网页,所以这个网页没 有加入主索引中。所以,当每月更新结束后,这个新 网页仍被看作是新网页但是不久以后,主抓取蜘蛛将会阅读这个新网页,在下个月更新之后,该页面才能被收录进主索引。这需要经历一段时间。在此之前, Google不显示任何导入链接,这个网页的排名也因此多变、不稳定。

看完这段资料之后也许对你有所启发,从目前状况来看,不单单Google存在搜索幽灵现象了,百度也有幽灵出现喽,当然,踏踏实实做站,认认真真发 展内容的站点是不用担心这点的,搜索引擎对于所有的站点都是公平的,为什么一些站点起步是相同的,经过半年的发展就有不同的搜索表现,不同的发展呢? Webmaster们是不是应该考虑考虑了?你们都做了些什么?(仅供参考)

 

声明: 本文采用 BY-NC-SA 协议进行授权 | helloyi
转载请注明转自《google-seo网络爬虫浅谈分析
标签:网站seo

给我留言

留言没头像?这里教你设置头像!