调查结果:网页数量及性质特征 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| http://www.sina.com.cn 2005年04月13日 17:35 新浪科技 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
4月14日,中国互联网络信息中心(CNNIC)将在北京发布《2004年中国互联网络信息资源数量调查报告》,本次调查由国务院信息化工作办公室委托,CNNIC实施,调查内容涉及域名、网站数、网页及数据库等多项内容。 以下为网页数量及性质特征: 一、全国网站的网页情况 1.网页数及网页字节数 表 12 网页数及网页字节数情况
![]() 图41:静、动态网页比例 [1]本次统计在先行剔除了网站与网站之间的完全重复等大量重复后网页总数为867576400个,再去掉网页与网页的重复后的网页总数为650682300个。 [2]该比例中动态网页数与实际情况相比是偏小的,这是由于:网上包含大量的动态网页,搜集到的网页只是网上动态网页的一部分。动态网页按照访问的方式可以分为两种:(1)通过点击超链,无需额外输入即可访问的网页;(2)必须通过输入内容才可以访问的网页。搜集到的动态网页不是全部,因为:(1)搜索引擎一般只搜集上述第一种动态网页。(2)各包含动态网页的站点上一般会有大量的动态网页,且动态网页的内容质量相对静态网页低得多,因此搜索引擎一般只搜集有限的动态网页以保证其数据的质量。 2.网页的编码分类
3.网页的内容分类情况(按多媒体形式) 表 14 网页的内容分类情况(按多媒体形式)
4.网页形式分类(比例) 表 15 网页形式分类(比例)
5.网页的更新周期
|









