博客首页|TW首页| 同事录|业界社区

  年底的时候,各个公司和机构都开始进行盘点,诸如“年度十大新闻热点”“行业十大新闻”“2009年最重要的十件大事”“2009年十大流行语”等等。做这些盘点,一是对一年来的内容做一次升华,二是显示自己公司在行业的权威地位。

  当排行榜公布的时候,我们更多的是排行榜里面排行的内容及顺序,很少去关心排行榜的科学性。比如来说,“2009年十大网络流行语”这个排行,如何来排出来的?难道是靠一些资深编辑评经验来排出来的吗?仅仅几名资深编辑,能代表几亿网民的行为吗?这种排行榜无法做到评选方法的科学性,客观性。有些公司要“科学”一些,编辑整理出来一堆内容,然后通过几万,甚至几十万网民的投票,来得出一个相对“客观”的排行榜。这种有投票的排行榜看似比第一张模式超前了一些,不过仍然存在以偏概全的情况。几十万网民很难代表全体网民,中国网民数量众多,几十万跟四亿相比较,简直可以忽略不计。第二,中国的初级网民数量众多,有些仅仅会看看简单的新闻,不会打字,也不懂得投票,所以这些投票网民的行为无法代表这些初级网民的行为,所以整体排行榜的客观性仍有待商讨。第三,年底的排行一般对于年初发生的热门事件有些已经淡忘,而对最近发生的小事记忆犹新,所以这个时间跨度问题也可能导致排行榜的不准确。

  中国网民数量众多,如果要制定出一份客观的排行榜,是件非常困难的事情。不过互联网的特性给了我们创造了很多机会。比如,互联网打破了空间的概念,做一份统计调查不必要挨家挨户的走访,只需用挂个问卷就可以让几万网民进行投票了。目前大多数公司利用的是互联网的空间特性来进行大规模的投票评选,不过这种仅仅把互联网的空间特性进行了初步的利用,没有更进一步挖掘互联网网民的“轨迹”特性。前几天,一家数据公司的年度盘点引起了行业的关注,万瑞数据将要举办《鼠标下的2009——中国互联网热点数据大盘点》。万瑞数据公司给新浪,搜狐,网易,CCTV,凤凰网等主流媒体提供嵌码流量统计服务,大概有近100家主流网站都用了万瑞数据的统计服务,可以统计超过3亿网民的行为,这些数据入库以后,大概有5000亿次的网民行为记录,这样就可以形成一个庞大的样本库,实在是让人震撼,对于现在的互联网公司,还没有哪家公司拥有如此庞大的样本库。其实这样的网民行为样本库可以挖掘出来太多有价值的内容,做一个年度排行榜来说简直轻而易举。万瑞数据这次做的是对15个行业进行盘点,从库中对网民的浏览新闻通过标题提取的方式,进行分类,排行,整理。这样就可以还原出一个真实的网民访问行为,从年初到年末,不论高端网民还是低端网民,都可以系统的进行还原,做出一个客观的排行榜。从海量的数据中挖掘出来的排行榜相对现有的排行模式来说,更具有权威性,而且也更具有客观性。(文/鲨鱼)


上一篇: 国家队CNTV对阵民营队PPTV 谁更有优势?
下一篇:“第一盗版商”优朋普乐被判罚121万

评论

Good.Be the first to comment on this entry.

发表评论