ALEXA排名机制


ALEXA排名机制

 

ALEXA排名机制
ALEXA的排名积分主要计算参数有两个:REACH和PV(也就是大家每天去alexa那里查询是看到的两个常见参数)

 

REACH是同一天内每百万ALEXA活跃用户里访问网站的数量。通俗的说:比如某天有80个装了ALEXA工具条的用户访问你的网站,那你的REACH是多少呢?现在ALEXA最新情况是每天有120-150万活跃用户。REACH大概就是80X(100万/130万)这样子。REACH大体也就在60-70左右。

 

PV是平均每天访问你的网站的ALEXA用户平均访问的页面数量。比如这80个人一共访问了你的页面数量为200,那你的PV就是200/80=2.5.注意:同一个人一天内访问同一个网站的同一页面只算一次。比如一个人同一天内访问了你某个页面1万次,这和访问一次对PV的影响是一样的。ALEXA的PV和国内流量统计站里PV的概念是不同的。

 

那么ALEXA排名积分是用什么函数来计算这2个参数的呢,这个无人知道,但通过大量实例可以估算出。REACH的权重要大于PV,大体应该是这样子ALEXa的排名相对积分=REACH的平方乘以PV。
比如有个网站REACH是3,PV是4;另一个网站的REACH是6,PV是1。3X3X4=6X6X1,所以他们的排名是很接近几乎相同的。

 

中国网站时刻准备强奸"alexa"
一:中国网站与alexa的生与死

 

1:谁在强奸Alexa排名?揭开Alexa的中国面具!

 

这是一封据称从慧聪网内部流传出的E-mail,内容是让员工完成两件有利于慧聪网的两项排名的工作:各位亲爱的同事,你们好:七天的假期过的怎么样,一定非常好。休息好了,玩好了,我们又得努力工作了,今天和我一起来完成两件工作: 1、看一看自已的电脑中装没装ALEXA软件,默认主页是不是设成慧聪网。如果还没,一定要完成。 2、从慧聪网的首页右侧的方告:中国商业网站100强评选进入,选择:慧聪网和中国搜索投一票。我们的目标是紧挨阿里巴巴,不过千万可别超过它。   两件工作一共需要二分钟,它会对我们下一步的工作起到重要作用,亲爱的同事们,让我们团结起来,一起努力...

 www.tuigo.com

2.惊天大揭密:ALEXA中国网站排名真相调查
核心提示:用户通过工具条能大大提高相关网站在Alexa中的排名
汇编高手大都有能力利用Alexa漏洞作弊提高排名
  在一个国外的BBS上,很多个人网站的站长彼此分享提高Alexa排名的经验。一个名为rodpuga的用户说:“仅仅通过我每天正常地访问我的网站中的一个,我就能把排名前移50万位。我才安装了Alexa工具条两周时间!这个网站已经从第10万名跳到了第1万5千名。”另一个署名Bogglesworld的用户说:“两天前我安装了Alexa工具条,单位装了一个,家里装了一个。我已经从大约第10万名跳到了第3万名。这就是说只要安装一个或两个Alexa工具条,就能大幅度地往前跳。”
要想彻底搞清楚Alexa排名是否可信,必须从技术上对Alexa的全球网站流量监测进行全面的解剖,当然Alexa从来没有公布自己的技术细节,笔者决定“以彼之道,还施彼身”,既然Alexa声称其数据来源就是那个工具条,笔者决定首先从破解工具条入手。 圈内著名的Web技术专家XX,用了近一个晚上的时间,对Alexa工具条及其向Alexa返回的数据进行了细致的分析,得出了很多宝贵的第一手资料。多年前对Alexa就做过研究的XX认为,最近的这次分析揭示了一些Alexa更隐秘的技术细节。
  XX告诉笔者,现在最新版本的Alexa工具条的运作机理与以往没有太大的改变,每当用户以装有Alexa工具条的IE浏览器打开新页面时,Alexa的一台服务器都会收到加密的数据包,这个数据包中的核心信息就是十几个参数,这些参数包括当前网页地址、页面打开时间、用户端显示分辨率、Alexa工具条版本号、该用户是否为“亚马逊”的用户等,其中有一个重要的隐含参数,经XX分析,认为是Alexa为每个已安装的工具条自动生成的ID号码,这个号码应该是全球惟一的。Alexa可以通过这个ID对每个反馈数据包的发出者进行惟一标识,这是解决"每用户浏览页面数"重复计算问题和防止同一用户多次刷新作弊的一个重要手段。
  XX告诉笔者,从目前研究的结果来看,任何一个汇编高手都可以很容易地掌握 Alexa工具条返回的数据包中的秘密,如果这个人同时也是一个网络编程高手,那么要针对Alexa作弊就比较容易了。从笔者后来对一位上海的Alexa作弊高手的采访来看,XX的分析完全正确。该作弊者正是一位资深的Web开发工程师,其采用的手段与XX的分析也基本吻合——编写一个Alexa工具条返回码生成器,批量产生Alexa能够辨识的代码串,然后用虚拟多用户的方式发回data.alexa.com,这样就可以欺骗Alexa的服务器,让它误以为这些数据是不同用户发来的。XX认为,这种以编程方式模拟多用户访问的作弊方式的实现,最重要的环节就在于对那个Alexa用来惟一标识用户身份的ID号的生成算法的破解,这需要对足够多的Alexa工具条进行嗅探,抓取其数据包进行定量的算法分析。但XX同时也指出,这些工作对于一个编程高手来说,确实不算什么,只是最终作弊的实现仍需要模拟一个足够快的ID号生成程序,这可能会比较困难,不过据XX估计,国内能做这些事情的人不在少数,只是互联网这个圈子里的高手们很少去做罢了。
  核心提示:
  1、Alexa无法防止网站作弊
  2、Alexa工具在中国被大量下载
  3、花钱就可购买排行数据
  自2003年以来,一些网站在向投资人递交商业计划书的同时,开始有意无意地提一下自己的Alexa排名,按照某种大家默认的逻辑,排在全球300名的网站总是比排在全球1000名以外的网站更有价值。终于,在“圈内人”的口口相传中,Alexa排名在中国互联网上名声大噪,而此时,远在大洋彼岸的Alexa却对它的中国Fans们一无所知。
  当Alexa排名开始得到业界的普遍认可时,终于有人开始利用Alexa排名来创造“价值”了。大批个人网站的站长们开始研究Alexa的排名规则,网上开始流传各种针对Alexa的作弊工具,很多网站上开始刊登介绍Alexa作弊方法的文章,各种论坛里开始出现对Alexa排名的讨论。一时间,中国互联网业界刮起了“Alexa旋风”。
  在2003年底,针对这股Alexa热,一些业内人士又开始质疑Alexa排名的可信度,并揭发出很多网站作弊的“内幕”。事实上,有相当多网民都对Alexa的排名表示过怀疑,因为在2003年的大部分时间里,Alexa排名上的全球第三和第四的网站是两个韩国网站,Alexa对此的解释是,韩国的互联网用户中安装Alexa工具条的比例较高,因此Alexa在韩国网民中得到的采样数据比较高,这就导致韩国的两家门户网站进入了全球前五名。
  统计专家通过技术分析得知,若国内互联网用户以总数9000万计算,则其中安装了Alexa工具条的用户可能已超过130万。按照Alexa声称的1000万左右的工具条全球下载总量来看,中国网民对Alexa的热衷似乎显得更为突出,这或许也可以作为国内网站2004年在Alexa排行榜中整体排名提高的一个解释。
  而且,事情远没有这么简单,在Alexa网站上,笔者看到全球网站前10万名排行榜的报价是499美元,显然,在大洋彼岸,还是有人认可Alexa的排名数据,甚至会花钱去买那个排行数据。
此外,对于前文中笔者提到的以编程模拟Alexa工具条返回数据包的作弊方式,Alexa几乎没什么好办法去防范,甚至要探测到这样的作弊手段都比较难。
3.alexa大开杀戒:不分“自杀还是谋杀”!
Alexa终于开始下狠手清理作弊者,这是大快人心的事情。因为中国网站作弊之猖狂,手段之恶劣,的确已经令人发指,严重危害到Alexa整体的可信度。但是,这一次,Alexa的措施存在着巨大的问题,依然充当了“小人得意”的帮凶。对于Alexa来说,这个问题不能不妥善解决。
  Alexa排名在中国引发关注,很大程度上互联网实验室的推介和推广。因为,这是当下唯一能够获得相对比较可靠的第三方访问量数据。在业界动辄5倍,10倍,甚至数十倍厚颜无耻的数据兑水下,国内互联网界的数据基本失去了真实性。Alexa提供了有益的参照。虽然方法论上不尽完善,Alexa也无法保障准确性。但是,有总比没有好,起码目前还找不到比Alexa更好的参考数据。
  但是,随着Alexa影响力的增加,商业利益驱动下,少数国内网站开始“聘请”“高手”开始作弊。除了一些小网站之外,包括很多由风险投资投资的大型商业网站也加入其中。利用技术手法大幅度提升“Alexa流量”(网站真实的流量不会变化),提升排名。互联网实验室投入大量精力,辨析流量异常的网站,揭露一些明显的作弊者。因此得罪不少。博客中国多次因为发表揭露个别网站作弊的文章而被“攻击”,这一次也没能幸免。
  2005年1月22日,首先被Alexa清空排名数据的有yesky、chinabyte、blogcn等网站,然后再过1-2天,更多的网站,包括博客中国也被清空。中国网站一片血腥!
  根据我们长期的跟踪,作弊者其实只是少数几家网站,而且这里面很多网站的投资者都基本是同一家。这家风险投资公司投资的很多网站都手法娴熟。真正自己作弊的网站绝对不可能有如此众多。
  问题核心在于:alexa清理作弊者,自己却无法区分究竟是网站自己作弊,还是被作弊者陷害。反正一旦出现流量异常就格杀勿论,完全不问无辜与否。因为作弊者可以让自己流量暴涨,同时也可以很方便“掉转枪口”,让它“瞄准”的网站也一样暴涨。黑白难分。(当然由于存在成本问题,真正的作弊者一般在流量暴涨之后,会长时间维持,而被害的网站一般只是短期异常,控制害人的成本)
  所以,过去作弊者具有的能量是“我想让谁升就谁升”,使得这项工作成为一项收费的商业模式。而现在,在alexa新的举措下,作弊者拥有了更大的生杀大权:我想让谁死谁就死!作弊者的商业模式不再是从让谁升中获取利益,而是从让谁死中获取利益,广告语可以是:“你想干掉谁?”
  在alexa不加区分的情况下,害一个网站变成如此轻而易举的事情,作弊者的力量大大提升。如此下去,一家作弊者被发现,它就可以为了掩盖自己的“罪行”,让人把该行业的其他网站也“统统干掉”!让大家一起变黑!目前IT网站就是如此,几乎无一幸免。其中的真正作弊者只有个别,死者却无数,而且黑白无法分辩。(这一两天,一些真正的作弊者开始停止自我作弊,流量开始回升,但是很多被害者依然继续“中招”,无法摆脱脱离流量异常的局面。你想正常还要看别人愿不愿意。)
  “自杀和被谋杀”都一样结局。被害者几乎毫无办法,眼睁睁看着自己网站流量出现异常,然后被alexa清空。接下来,类似的事情肯定会很多,因为有了alexa的“配合”,杀一个网站不费吹灰之力了,只是举手之劳。成本更低,成果更大了。简直形态儿戏。
  alexa作为一个独立第三方的机构,这个问题不解决,只能成为“帮凶”,更大范围波及无辜,更大程度损害自己的可靠性和公信力。而其中,唯有小人始终是胜利者。因此,alexa本身必须承担更大的责任,必须有更好的技术和机制,有效辨析究竟是网站自我作弊还是被人陷害。
 

标签:ALEXA排名机制  


2008年1月28日/ALEXA研究室/

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。