首页新闻体育娱乐视频财经科技汽车房产游戏女性天气短信邮箱导航通行证
爱问(iAsk.com)
科技时代新浪首页 > 科技时代 > 互联网 > 新浪科技评论空间专题 > 正文

ChinaByte王利兴:质疑CNNIC一个亿网民数据


http://www.sina.com.cn 2005年08月24日 11:33 ChinaByte

  作者: 王利兴

  对于中国互联网来说,一个亿的网民,着实让人兴奋,对中国互联网的发展也将是新纪元开始的象征。

  但对于这一个亿,我始终认为有一些问题。以下进行一点探讨。

  首先是关于网民(互联网用户)的定义。CNNIC将网民定义为平均每周使用互联网至少1小时的中国公民。仅从时间上来看,我不太能够接受。如果说一个人在一个星期里面上网一个小时就可以称为网民,那么真不知道他在网上可以干什么。如果他在某一天去那个地方上了四个小时的网,那么他就可以一个月不再接触网络。这样的人可以称为网民吗?事实上这样的网络用户不在少数。在身边就有不少,他们没有接受过高等教育,对于网络也没有多少“积极性”,上网也只是“一时兴起”的行为。尤其是城乡结合部的一些网吧,尽管生意不错,但都是“老客户”。

  其次就是抽样调查的总体分配问题。作为带有普查性质的调查,其抽样也应该具有随机性质。但是CNNIC的调查将抽样总体分成两种,一种是普通民众,一种是高校住校学生。按照目前高校的网络建设情况,几乎每个学校都有较好的网络基础设施。按CNNIC的网民定义,高校学生中的网民几乎可以达到100%。那么,在CNNIC中的计算方法中,却没有提及两个总体的加权数量。这对于网民的数量统计影响很大。

  还有是抽样调查中的A目标总体(全国有住宅电话的6岁以上的人群)的调查方法。首先设问的是,按照拥有住宅电话来进行调查是否合适?我认为,以电话作为调查工具,这本身就增加了受访者作为网民的几率。其次是样本量的问题。作为有13亿人口总体的调查,以5000作为调查总体样本,是否少了一些?按照31个省直辖市计算,每个省市只能调查到161.3个样本,而分到每个地级市则只有十几个样本(按其抽取方法最多也就不到五十个)。这样的抽查样本是否具有可靠性很值得商榷。

  第三个问题是省内各地市的抽样方法。“每省中,省会城市和副省级城市为一层,其他城市为另一层。省会和副省级城市层中所有城市都被抽中,另一层中按抽样指标运用PPS抽样方法抽取5~6个地市(此处的地市包括地级市和地区行署,每个地市下都包含城镇和乡村,为不引起歧义,以下简称为地市)。不同层间按照该层家庭户数占该省家庭户数的比例分配样本量,省会和副省级城市层内按照该城市家庭户数占该层家庭户数的比例分配样本量,另一层在每个被抽中的地市间平均分配样本量。抽取地市的方法:在各省中抽取地市,省会和副省级城市层中所有城市都被抽中,另一层按照PPS抽样方法进行抽样,抽样指标为“家庭户数”,每个地市被抽中的概率等于该地市“家庭户数”与该层“家庭户数”之比。利用EXCEL软件产生0~1之间的均匀分布的随机数,根据随机数落在各地市对应累计百分比的范围,抽取5~6个地市。如果一个地市被抽到两次以上,则该地市样本量相应加倍。例如:某地市被抽中一次,样本量为N个,如果该地市被抽中两次,则样本量为2N个。”如此分配,那么就存在省会和副省级城市的调查样本数量与其他地市调查样本数量的高低是否与其实际网民数量之间存在正比关系。如果正比那么误差就小,不成正比则误差就大。拿浙江省的宁波(副省级城市)和温州来比,两者发展情况相差不大。而按此方法计算,那么温州的调查样本就会相对减少。还有一个就是EXCEL的随机数问题。相信变成的朋友都有经验,其中的随机生成数据并不是完全均匀的,而更接近于正态分布。按照这样的数据来取,明显有失偏颇。

  脱离报告数据,从目前网民使用最多的即时通讯(IM)工具QQ来看这个数据的正确性似乎是一个有效方法。根据腾讯公司的数据,腾讯QQ目前总注册用户数为3.55亿,活跃用户数1.19亿,最高同时在线730万。此中活跃该为当前还在使用状态的QQ号码。那么既然如此,我们完全可以认为,其中的2.36亿用户应该是“常年”不用的号码,几乎处于“遗弃”状态。而在这里,活跃用户的定义便成为关键。在QQ成为网民通讯交流首选软件的今天,我们可以这样假设,QQ该是每个网民都有的东西。而一般来说,平均每个网民所使用的QQ数目应该在1.0以上。如果将活跃用户定义为一个月使用一次,那么我们可以认为网民数目就要少许多。而如果将活跃用户定义为一天使用一次,那么我们可以认为网民数目应该超过一亿。从商家的角度去思考,腾讯公司不会将判断是否活跃的时间定的太短。另外的一个问题是,在QQ普及的今天,它已经不仅仅是个人交流的工具,也已经成为众多社会行为的交流工具。众多企业、商家和组织已经将QQ作为在线服务的选择工具。因此,这1.19又要被占去不少。

  在此调查报告中,一个让人相信CNNIC工作态度的数据就是其中的成功率。“按美国舆论研究协会(AAPOR)的成功率公式三计算,本次抽样调查的成功率为38%。” 这与调查样本95%的置信区间似乎不太协调。

  那么,我们是否能够按照此成功率下做出的数据来推算中国的网民数量呢? 显然不行!

  而正是如此的数据,引起了全国甚至世界的强烈反响,也导致了当前大家所关注的阿里和雅虎的联姻,也让人们对中国的互联网充满了无比向往!

  如此分析,仅个人意见,仅供参考!

爱问(iAsk.com)



评论】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5828   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2005 SINA Inc. All Rights Reserved

版权所有 新浪网