第18次中国互联网络发展报告:调查方法 | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| http://www.sina.com.cn 2006年07月19日 10:36 新浪科技 | ||||||||||
|
中国互联网络信息中心(CNNIC)2006年7月19日发布第18次中国互联网络发展状况统计报告。本次调查显示,中国内地网民总人数已达1.23亿人。以下为该报告调查方法: 第六部分 调查方法 依据统计学理论和国际惯例,在前17次调查工作基础之上,本次调查采用了计算机网
一、域名数、网站数调查 (一)中国的通用顶级域名数及对应网站数: 通过各通用顶级域名注册单位协助提供。这些数据包括:所有通用顶级域名(gTLD)和有网站(即有WWW服务)的通用顶级域名(gTLD)总数、所有通用顶级域名(gTLD)和有网站的通用顶级域名(gTLD)按.COM、.NETt、.ORG分类的数目、所有通用顶级域名(gTLD)和有网站的通用顶级域名(gTLD)按注册单位所在省份分类的数目。 (二)中国的CN域名数及对应网站数: 采用计算机网上自动搜索可得到如下数据:CN下的域名数及地域分布情况;CN下网站数及其地域分布情况。 (三)中国域名总数、网站总数: 将以上(一)、(二)两部分的相关数据分别相加,即可得到中国的域名总数、网站总数、域名和网站的地域分布、网站分类数等数据。 (四)IP地址总数: IP地址分省统计的数据来自APNIC,中国互联网络信息中心(CNNIC)IP地址数据库,数据统计方法是将两个数据库中已经注册且可以判明地址所属省份的数据,按省分别相加得到,由于地址分配使用是动态过程,所统计数据仅供参考。 二、网上联机调查 网上联机调查重在了解网民对网络的使用情况、行为习惯以及对热点问题的看法和倾向。具体方法是将问卷放置在CNNIC的网站上,同时在全国各省的信息港与较大ICP/ISP上设置问卷链接,由网民主动参与填写问卷的方式来获取信息。 CNNIC在2006年6月9日~6月30日进行了网上联机调查。调查得到了国内众多知名网站、媒体的大力支持,国内许多知名网站均在主页为本次联机调查问卷放置了链接。本次网上联机调查共收到调查问卷32,320份,经过有效性检查处理得到有效答卷16,332份。 三、电话抽样调查 电话抽样调查侧重于了解中国网民的总量、相关的特征及行为特点等。 (一)调查总体 结合调查目的,网下调查的目标总体定义为:全国6周岁以上的居民。从访问实施的角度,把目标总体细分为:1、全国有住宅固定电话的6周岁以上的人群(子总体A),采用电话调查的方式;2、全国所有高等院校中的住校学生(子总体B),采用电话调查的方式;3、没有住宅固定电话、但有小灵通的6周岁以上的人群(子总体C1),采用电话调查的方式。在对全国结果进行推断时,将三个子样本的统计量应用加权公式进行汇总。 (二)子总体A和子总体C1抽样方法 按照科学性和可操作性相结合的原则,我们对子总体A和子总体C1按省进行分层。 ◇抽样指标的确定 从全国的情况来看,各省的城市住宅电话与乡村住宅电话的比例差异很大,由于城市与农村家庭的平均人口数差异很大,所以在确定各省样本量时,我们考虑的指标是“住宅电话覆盖6周岁以上的人数”;在确定各省中地市州的样本量时,我们采用地市州的“6周岁以上人口数”作为抽样指标。 ◇样本量 综合考虑到调查的精度和费用、时间的要求,将全国按省分为31层,各层独立抽取样本,总计样本量为7,200。 ◇省内各地市的抽样方法 第一步:从精度上考虑,为使样本更接近自加权样本,每省按PPS抽取7个地市州,其中广东和四川由于地市州比较多,抽取8个地市州;考虑到省会以及副省级城市比较发达,在本次调查中先分层,即把省会以及副省级城市作为一层单独提出来,一定被抽中,剩下的其他地市州是另一层,从中抽取6或7个地市州。按照PPS抽样法,使每个地区被抽中的概率,等于该地区“6周岁以上人口”与该省“6周岁以上人口”之比。 第二步:获得各地市州的所有电话局号,根据该地市州的局号生成电话号码库。电话号码中除局号外的后四位,由随机数生成。 第三步:确定调查对象,在电话(包括没有住宅固定电话的小灵通)拨通后,把接听电话的人作为被访对象,先询问家庭基本状况和他(她)本人上网(不上网)的有关情况、个人背景资料和家庭其他成员的最简要资料。如果他(她)不上网,但家中有人上网,则再随机抽取一名上网的成员来接听电话,回答有关上网的问题以及自己的个人基本资料。 ◇全国加权方法 对全国的推断采用对各省的调查结果进行事后加权处理的方法。 (三)子总体B抽样方法 按照科学性和可操作性相结合的原则,我们对子总体B按省和学校(本科、专科)进行分层。 ◇抽样指标的确定 子总体B为全国所有高等院校中的住校学生,我们就用“在校学生人数”作为抽样指标。在校学生包括:普通本科生;普通专科生*;硕士研究生;博士研究生。 *专科层次的高校,只有普通专科生 ◇样本量 本次年中小样本调查全国的高校在校学生样本量为4,000,并按 “各省高校学生数占全国高校学生总数的比例×200”分配各省的高校样本量。 ◇省内高校的抽样方法 采用分层抽样、PPS抽样方法相结合的方法。 第一步:确定每层应抽取的学校数、学校及宿舍数。全国共抽取200所学校,按照分层抽样,每层应抽取的学校数目=该层学生数占全国学生总数的比例×200。按照PPS抽样方法,确定每层中抽取的学校,抽样指标为在校学生人数。每所学校抽取20个宿舍。 第二步:获得抽中学校的所有宿舍电话局号,根据该学校的所有宿舍电话局号生成电话号码库。电话号码中除宿舍局号外的后四位或后三位数字,由随机数生成。利用每个学校的宿舍电话抽样框,随机抽取宿舍电话进行拨打,每个宿舍电话只访问一人,直到调查了20个宿舍为止。 第三步:确定调查对象,在电话拨通后,只要接听电话者为本校学生(排除在高校学生宿舍居住的社会人员),即可询问宿舍基本状况和他(她)本人上网(不上网)的有关情况、个人背景资料。 通过以上方法确定了调查对象后,分别对有住宅电话的住户、没有住宅电话的小灵通用户、住校的高等院校学生进行电话访问,经过事后加权得出子总体A、子总体B、子总体C1。最后将这三部分调查结果综合加权计算以后即得到中国网民的总量、相关特征、行为特点等数据。 (四)抽样调查成功率 按美国舆论研究协会(AAPOR)的成功率公式三计算,本次抽样调查的成功率为38.9%。 (五)数据预处理 在数据处理之前,对数据中变量的取值、变量之间的逻辑关系等进行检查,对其中的不合格样本进行了核对、删除和补充,并对部分变量进行了事后编码。 在统计报告中有一些平均数(比如每周上网小时数等),在计算这些平均数前,首先采用以大于或小于平均数的三个标准差和检查观测量的各变量之间的逻辑关系等方法对数据中的异常值进行排除。 |

