科技时代新浪首页 > 科技时代 > 滚动新闻 > 互联网信息资源数量调查报告专题 > 正文

2004互联网络信息资源数量调查报告:限制说明


http://www.sina.com.cn 2005年04月13日 16:39 新浪科技

  4月14日,中国互联网络信息中心(CNNIC)将在北京发布《2004年中国互联网络信息资源数量调查报告》,本次调查由国务院信息化工作办公室委托,CNNIC实施,调查内容涉及域名、网站数、网页及数据库等多项内容。

  以下为调查限制说明:

  1.中国互联网络信息资源定义为:中国互联网络上公开发布的网页和在线数据库的总和。

  2.中国互联网络是指所有域名注册单位属于中国大陆的网站总和。

  3.在线数据库是指以Web为界面,提供公共检索的收费或免费的数据库。

  4.网站是指有独立域名的Web站点,其中包括CN和通用顶级域名(gTLD)下的Web站点。此处的独立域名指的是每个域名最多只对应一个网站"WWW+域名"。 如:对域名cnnic.cn来说,它只有一个网站www.cnnic.cn,并非它有whois.cnnic.cn、mail.cnnic.cn……等多个网站,它们只被视为网站www.cnnic.cn的不同频道。

  5.商业网站是指对公众提供互联网信息服务,以网上虚拟业务为主的网站;企业网站是指通过网站对自己的产品进行宣传,而业务主要是在网下进行的以实体业务为主的网站。其他公益性网站主要指除教育科研外的医疗、图书馆、博物馆等提供公益性服务的网站。

  6.网页搜索是指对抽取的网站从其首页(WWW+域名)开始搜索,通过网页上的层层链接,抓取所有属于该网站的网页的特征及其文本内容。

  7.静态网页是指URL中不含?和输入参数的网页,包括:*.htm、*.html、*.shtml、*.txt、*.xml等。

  8.动态网页是指URL中含?或输入参数的网页,包括:ASP,PHP,PERL,CGI等在Server方进行处理的网页。

  9.网页的编码形式:是根据网页本身的信息通过分析得到的,不是通过一篇网页在HTML中的声明来判断的。因为大量国内的英文网页在其HTML声明中都是简体中文。

  10.网页的内容形式:是通过文件后缀获得的。关于图像、音频、视频的文件后缀定义标准参考MIME标准。

  11.网页的更新情况:网页的更新时间是指网页的最后更新日期与当前时间之间的时间差。

  12.考虑到抽样调查的可操作性,本次调查暂不包括香港、澳门及台湾的互联网络信息资源状况及海外中文网络信息资源状况。



评论】【 】【打印】【下载点点通】【关闭


 
新 闻 查 询
关键词
缤 纷 专 题
春意融融
绿色春天身临其境
摩登老人
摩登原始人登场啦
请输入歌曲/歌手名:
更多专题 缤纷俱乐部
 
 


科技时代意见反馈留言板 电话:010-82628888-5828   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

Copyright © 1996 - 2005 SINA Inc. All Rights Reserved

版权所有 新浪网