谷歌的算法更改和数据刷新

2007年7月18日星期三

[译者按] 我们在中文网管论坛上总能看到一些关于算法更改和数据刷新的讨论. Matt Cutts , 谷歌反网络作弊组的带头人, 于2006年12月23日在他的个人博客上发表了他对这两个概念的理解.

原文 Explaining algorithm updates and data refreshes

这两天一组发表在管理员世界上的帖子在问Google是否进行了更新,我在这里可以很明确地回答:并没有。

如果想要更具体的解释,让我们先来熟悉一下相关的定义。你可以参考 这篇blog文章 或者看看 这段视频 (我视频集的第八部分)。我下面会尽力用简短的语言概括一下重点:

算法更改: 通常算法的更新会对搜索结果整体产生影响。算法随时可能改变,但是并不会很频繁地发生明显的变化。

数据更新 :指现有算法内的数据的更新。这种更新多数是对于那些对搜索结果影响较小的部分,并且变化如此细微以至于我们是不会感觉到的。更小规模的数据更新的一种是:

索引更新 : 指新的索引数据被传送到各个服务器。从2000年到2003年间,目录大约是每个月更新一次。带来的变化被称作 Google Dance 。Google Dance会持续大约6到8天,因为服务器的更新需要轮流进行,直到这些数据库全部被更新为一个全新的网络数据索引,而这是需要一定的时间来完成的。在2003年的夏天(这次的Google Dance被称为“弗里茨更新”),Google 的索引更新由原来的每月一次变成了每天一次(甚至更频繁)。Google几乎每天都会更新一部分索引的内容,这样每天的变化就远远不如先前那么明显(有人称Google 索引的明显变化为 everflux )。

近些年来,Google的索引已经进行了改进,使大多数人根本感觉不到它的更新。 由此,诸如“everflux”、“Google Dance”以及“索引更新”这类词汇就很少被提起了(除非是被用错了地方 :) )。取而代之的是,大部分SEO会去关注算法更改或数据更改/刷新。大多数的数据升级就是索引更新,虽然偶尔数据升级会独立于每天的索引更新而进行。例如,每3、4个月会察觉到反向链接和PageRanks的变化。

好了,我们来做个小测验,看你刚才读的够不够仔细:

问:判断对错:索引更新是一种数据刷新。

答:当然正确!注意,我在第四段里刚刚提到。 :) 不要纠缠“更改”和“更新”的区别,因为他们基本上是一回事。其实就是算法,和算法所使用的数据。数据的变化很大程度上就是我们索引的更新。

可以确定的是,过去的几年中并没有大规模的算法更新,而仅有的数据升级都是最普通的(索引更新)。因此,在管理员世界上发帖的人讨论的是什么呢?再去看看 这段视频 吧。听清楚其中有关“6月27号,7月27号和8月17号的数据升级”的部分。我曾经在网上说过,这些更新很可能会每天发生。在过去的一个月里,数据升级变得更频繁(从原来的3-4周一次到现在每天一次)。我能做的最好的猜测是:人们所看到的任何变化是源于相关数据的升级更为频繁了。

较早对“谷歌的算法更改和数据刷新”的21个评论存档