科技时代新浪首页 > 科技时代 > 互联网 > 05年中国互联网络信息资源调查专题 > 正文

互联网信息资源调查报告:抽样调查


http://www.sina.com.cn 2006年05月16日 10:05 新浪科技

  新浪科技讯 5月16日,第五次中国互联网信息资源调查报告在京发布,本次调查始于2005年12月,结束于2006年2月,为期3个月。调查结果显示,2005年包括域名、网站及网页等在内的互联网络信息资源继续大幅度提升,其中CN域名已经成为亚洲最大的国家顶级域名。

  以下为:抽样调查:

  (一)抽样指标

  在确定分层后各层的样本量以及用各层样本数据推断全国数据时,我们考虑的指标是“网站数量”。

  (二)目标量分类

  总量:比如说总体中拥有在线数据库的网站数等;

  比例:本调查的总体目标量大部分都是以比例的形式出现的。

  (三)样本量

  在置信度为95%,最大允许绝对误差为3%时,综合考虑设计效应等因素,设计样本量为2200个,本次电话调查实际得到的有效网站样本数为2208个。

  (四)抽样方法

  本次调查抽样所采用的样本框为2005年中国

信息产业部开展的全国互联网站集中备案工作所得到的全国备案网站数据库,主要采用等距抽样的方法来抽取样本,方法如下:

  步骤1:排序

  采用网站所在省份主为关键词,备案时间为次关键词进行升序排列。省份编码如下:

 

序号

省市区

序号

省市区

序号

省市区

序号

省市区

1

北京

9

上海

17

湖北

25

云南

2

天津

10

江苏

18

湖南

26

西藏

3

河北

11

浙江

19

广东

27

陕西

4

山西

12

安徽

20

广西

28

甘肃

5

内蒙古

13

福建

21

海南

29

青海

6

辽宁

14

江西

22

重庆

30

宁夏

7

吉林

15

山东

23

四川

31

新疆

8

黑龙江

16

河南

24

贵州

 

 

  步骤2:抽取样本

  排序后的网站编号依次为1、2、3、…、M(M为全部备案网站的数目)。如果需要抽取的样本网站数量为n,取T=Round(M/ n),抽取规则如下:首先随机从1到T中选出一个数S,那么编号为P=S+k*T(k=0、1、2、3、…、n-1) (M为全部备案网站的数目)的网站即为被抽取的样本网站(当P>M时,取P=P- M)。

  步骤3:获取样本相关资料

  将以上步骤所抽取的样本网站及其相关信息(包括:网站名称、网站域名、网站所在地、网站联系人、联系电话、E-mail等)存为Excel工作表文件。格式如下:

序号

网站名称

网站域名

网站所在地

网站联系人

联系电话

其它指标

1

 

 

 

 

 

 

2

 

 

 

 

 

 

  将所有抽取数据合并即成为调查所需样本。

  步骤4:访问过程和搜索过程

  根据所抽取样本的联系人及联系电话,对样本进行电话访问。先询问网站的一些基本情况,然后根据网站的不同类型进行不同网站的详细情况的调查,之后询问各种网站共同的内容和在线数据库的内容。

  上述的问卷调查过程可获得网站、在线数据库的相关特征、影响等指标。网页特征的相关指标,可通过网络搜索系统对网站进行搜索获得。

  (五)结果估计

  由于样本抽取采用的是等距抽样方法进行的,因此整个样本可视为近似的自加权样本,采用简单随机样本的公式对估计量进行计算。同时可对结果以各类网站数占网站总数的比例作为权重进行事后加权以校正误差。

发表评论

爱问(iAsk.com)



评论】【论坛】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5595   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2006 SINA Corporation, All Rights Reserved

新浪公司 版权所有