最近Google中国工程研究院副院长刘骏在一个演讲中说到一个不大不小的事情。大致意思是,Pagerank是google的搜索算法的重要部分,该算法在美国的作用较大,是一个可靠的数据,但在中国往往不够准确。其主要原因就是网站内容盗版严重,一个网站常常会大量抄袭另外一个网站的内容,而不是采用引用的方式。
对Pagerank我感触不深,但是对盗版确是有着深刻的体会。
第一幕,为了一个问题去搜索解决方案,打开一个搜索结果,一试不行,再打开排名其后的,结果和第一个一直不差,打开第三个、第四个,靠,全都一模一样,copy也不检验一下有效否,这也算专业网站?往往要翻上好几页,大浪淘沙般找到一个不同的办法。慢慢的发现自己形成了一个习惯,跳跃性的看搜索结果,第一页看了就直接点到第3页,甚至更后面去。
第二幕,旅游回来,写了篇康定游记。过段时间一查,搜出N多篇,俺博客小,依照某种算法自然是要排在后面的。瞎算了一下,估计这篇文章只有1%的流量到了我这里,其他的就为大大小小的网站瓜分了。
也罢自己的文章被大小门户“垂青”,是件高兴的事情。有些多年前的文章,还感谢他们给我保存下来了。打开一看,好的标明了出处“玖头在线”,有的出处出处变成了“XX旅游”,看来是转了N到手了。差的嘛,就严肃的标明“版权所有,未经许可不得转载”。
Pagerank是Google的重要问题,也折射了中国互联网的大问题。
PS:其实这篇文章基本是废话,写的大家心知肚明的老问题,只不过借Pagerank来混点文字罢了。


One Comment
很认同,我刚刚就不得以转载了篇别人的文章,因为很多门户BLOG都找不到Trackback,次序太乱了··
One Trackback
以上内容转摘自与狼共舞 其实我根本不想全篇搬到自己的BLOG上,不知道是门户太落后还是我太SB,我在那个门户博客上根本找不到Trackback,如何引用?试了下发送到文章地址,没有成功,所以只有搬过来……很多时候,大家也都在这样做,所以又造成这样的结果,看这里。用百度搜索了下,这篇文章直接这样搬的人还真不少,看得出大伙对这样的人怀都有博大的同情心,愤愤这样的事实,但是却把网络次序搅得如泥水一般混乱。因为根本找不到这篇文章最初发表在哪里,九成以上的站点直接COPY,连文章出处都没有留下就更别说发送Trackback了,这只是个题外话。 看到这样的情景我是最受不了