科技时代新浪首页 > 科技时代 > 互联网 > 05年中国互联网络信息资源调查专题 > 正文

互联网信息资源调查报告:限制说明


http://www.sina.com.cn 2006年05月16日 10:00 新浪科技

  新浪科技讯 5月16日,第五次中国互联网信息资源调查报告在京发布,本次调查始于2005年12月,结束于2006年2月,为期3个月。调查结果显示,2005年包括域名、网站及网页等在内的互联网络信息资源继续大幅度提升,其中CN域名已经成为亚洲最大的国家顶级域名。

  以下为:限制说明

  1.中国互联网络信息资源定义为:中国互联网络上公开发布的网页和在线数据库的总和。

  2.中国互联网络是指所有域名注册单位属于中国大陆的网站总和。

  3.在线数据库是指以Web为界面,提供公共检索的收费或免费的数据库。

  4.网站是指有独立域名的Web站点,其中包括CN域名和通用顶级域名(gTLD)下的Web站点。此处的独立域名指的是每个域名最多只对应一个网站"WWW+域名"。 如:对域名cnnic.cn来说,它只有一个网站www.cnnic.cn,并非它有whois.cnnic.cn、mail.cnnic.cn……等多个网站,它们只被视为网站www.cnnic.cn的不同频道。

  5.商业网站是指对公众提供互联网信息服务,以网上虚拟业务为主的网站;企业网站是指通过网站对自己的产品进行宣传,而业务主要是在网下进行的以实体业务为主的网站。其他公益性网站主要指除教育科研外的医疗、

图书馆、博物馆等提供公益性服务的网站。

  6.网页搜索是指对抽取的网站从其首页(WWW+域名)开始搜索,通过网页上的层层链接,抓取所有属于该网站的网页的特征及其文本内容。

  7.静态网页是指URL中不含?和输入参数的网页,包括:*.htm、*.html、*.shtml、*.txt、*.xml等。

  8.动态网页是指URL中含?或输入参数的网页,包括:ASP,PHP,PERL,CGI等在Server方进行处理的网页。

  9.网页的编码形式:是根据网页本身的信息通过分析得到的,不是通过一篇网页在HTML中的声明来判断的。因为大量国内的英文网页在其HTML声明中都是简体中文。

  10.网页的内容形式:是通过文件后缀获得的。关于图像、音频、视频的文件后缀定义标准参考MIME标准。

  11.网页的更新情况:网页的更新时间是指网页的最后更新日期与当前时间之间的时间差。

  12.考虑到抽样调查的可操作性,本次调查暂不包括香港、澳门及台湾的互联网络信息资源状况及海外中文网络信息资源状况。

发表评论

爱问(iAsk.com)



评论】【论坛】【收藏此页】【 】【多种方式看新闻】【下载点点通】【打印】【关闭




科技时代意见反馈留言板 电话:010-82628888-5595   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2006 SINA Corporation, All Rights Reserved

新浪公司 版权所有