不支持Flash

第20次互联网调查报告:调查方法

http://www.sina.com.cn 2007年07月17日 17:39  新浪科技

    中国互联网络信息中心(CNNIC)2007年7月18日发布第20次中国互联网络发展状况统计报告。本次调查显示,中国内地网民总人数已达1.62亿人。以下为调查方法。

  调查方法

  依据统计学理论和国际惯例,在前19次调查工作基础之上,本次调查采用了网下抽样、网上联机、网上自动搜索和统计数据上报的调查方法。

  (一)电话抽样调查

  电话抽样调查侧重于了解中国网民数量与结构特征、上网条件、网民行为与观念和非网民状况。

  1.调查总体

  目标总体细分如下:

  子总体A:有住宅固定电话的居民

  子总体B:住校的高等院校学生

  子总体C:没有住宅电话的居民

  子总体C又进一步细分为:

  子总体C1:有小灵通(无线市话) 的居民

  子总体C2:有手机(移动、联通)的居民

  子总体C3:无任何移动电话的居民

  由于小灵通属于无线市话,接听免费,从访问实施的角度看,住宅固话与小灵通在局号上无法区分,所以把两者合并,即从访问实施的角度看,目标总体“全国6岁以上的居民”分为:

  子总体A+C1 :有住宅固定电话(含小灵通)

  子总体B: 住校的高等院校学生

  子总体C2: 无住宅固定电话,有手机

  子总体C3: 无住宅固定电话、无手机

  2.抽样方法

  此次只针对子总体A+C1、C2进行调研。不对子总体B和C3调研的原因在于,子总体B中上网普及率已经达到90%以上,网民比例变化很小,可以采用2006年6月调研数据;子总体C3中网民规模较小,考虑到随着社会经济的发展,此部分人群会越来越少,忽略不访问。

  按照科学性和可操作性相结合的原则,我们先对子总体A+C1和C2按省进行分层。

  △抽样指标的确定

  对于子总体A+C1,从全国的情况来看,各省的城市住宅电话与乡村住宅电话的比例差异很大,由于城市与农村家庭的平均人口数差异很大,所以在确定各省样本量时,考虑的指标是“住宅电话覆盖6周岁以上的人数”。对于子总体C2,确定各省样本量时,考虑的指标是各省手机用户数;在确定各省中地市州的样本量时,均采用地市州的“6周岁以上人口数”作为抽样指标。

  △样本量

  综合考虑调查的精度和费用、时间的要求,将全国按省分为31层,各层独立抽取样本,抽取子总体A+C1样本量5000个,此外,为更好地分析网民行为,按照同样的抽样调查方式追加网民样本量2500个;抽取子总体C2样本量5000个。

  △省内各地市的抽样方法

  第一步:从精度上考虑,为使样本更接近自加权样本,每省按PPS抽取7个地市州,其中广东和四川由于地市州比较多,抽取8个地市州;考虑到省会以及副省级城市比较发达,在本次调查中先分层,即把省会以及副省级城市作为一层单独提出来,一定被抽中,剩下的其他地市州是另一层,从中抽取6或7个地市州。按照PPS抽样法,使每个地区被抽中的概率,等于该地区“6周岁以上人口”与该省“6周岁以上人口”之比。

  第二步:获得各地市州的所有电话局号和移动号段,号码中除局号和号段外的后四位,由随机数生成,分别组成固定电话号码库和移动号码库。

  第三步:确定调查对象,寻找子总体A+C1样本时,在电话(包括无住宅固定电话的小灵通)拨通后,把接听电话的人作为被访对象,先询问家庭基本状况和他(她)本人上网(不上网)的有关情况、个人背景资料和家庭其他成员的最简要资料。如果他(她)不上网,但家中有人上网,则再随机抽取一名上网的成员来接听电话,回答有关上网的问题以及自己的个人基本资料。

  寻找子总体C2样本时,拨通手机后,询问他(她)本人是否是大学生,如不是,则询问住所是否有固定电话或者小灵通,如果没有,则属于子总体C2,确定访问对象,访问其上网情况。

  △全国加权方法

  对全国的推断采用对各省的调查结果进行事后加权处理的方法。

  3.抽样调查成功率

  按美国舆论研究协会(AAPOR)成功率公式三计算,本次抽样调查成功率为38.7%。

  4.数据预处理

  在数据处理之前,对数据中变量的取值、变量之间的逻辑关系等进行检查,对其中的不合格样本进行了核对、删除和补充,并对部分变量进行了事后编码。

  在统计报告中有一些平均数(比如每周上网小时数等),在计算这些平均数前,首先采用以大于或小于平均数的三个标准差和检查观测量的各变量之间的逻辑关系等方法对数据中的异常值进行排除。

  (二)网上调查

  网上调查重在了解网民对互联网评价及典型互联网应用的使用情况。

  CNNIC在2007年6月8日~6月30日进行了网上调查,具体方法是将问卷放置在CNNIC的网站上,同时在中央媒体网站、全国较大ICP/ISP网站与各省的信息港上设置问卷链接,由网民主动参与填写问卷的方式来获取信息。回收问卷后,通过技术手段进行答卷有效性检验,筛除无效答卷。网上问卷调查得到各大网站的大力支持和广大网民的热情参与。本次网上调查共收到调查问卷32,161份,经过有效性检查处理得到有效答卷21,714份。

  (三)网上自动搜索与统计数据上报

  网上自动搜索主要是对域名、网站及其地域分布等指标进行技术统计;而统计上报数据主要包括IP地址数、网络国际出口带宽数等内容。

  1.IP地址总数

  IP地址分省统计的数据来自亚太互联网注册机构(APNIC)和中国互联网络信息中心IP地址数据库。数据统计方法是将两个数据库中已经注册且可以判明地址所属省份的数据,按省分别相加得到,由于地址分配使用是动态过程,所统计数据仅供参考。同时,IP地址的国家主管部门信息产业部也会要求中国IP地址分配单位(如中国电信、中国网通等)每半年上报一次其拥有的IP地址数。为确保IP数据准确,CNNIC会将来自亚太互联网注册机构(APNIC)的统计数据与这些上报数据进行比较,确定最终的IP地址数。

  2.中国域名总数和网站总数

  以下两部分数据相加,即可得到中国的网站和域名总数、分类数与地域分布等数据。

  第一部分是中国通用顶级域名与网站数,由国内各通用顶级域名注册单位协助提供。这些数据包括:所有通用顶级域名(gTLD)和域名下已开通的网站数;按.COM、.NET、.ORG分类的通用顶级域名(gTLD)和网站数;按注册单位所在省份分类的通用顶级域名(gTLD)和网站数。

  第二部分是CN下的域名数和网站数,由CNNIC采用计算机网上自动搜索得到。

  3.网络国际出口带宽数

  信息产业部通过电信企业的报表制度,定期得到中国各运营商与其他国家和地区相连的网络出口带宽总数。CNNIC的中国互联网络发展状况统计报告中纳入了这些上报数据。

发表评论 _COUNT_条
爱问(iAsk.com)
不支持Flash

频道精选

不支持Flash