图表:全国网站的网页情况 |
---|
http://www.sina.com.cn 2004年03月31日 17:05 新浪科技 |
2004年4月1日,国务院信息化工作办公室将发布2003年中国互联网络信息资源数量调查报告,本次调查是我国互联网络信息资源的第三次数量调查,开始于2003年12月,结束于2004年2月,历时3个月。 以下为报告的第三部分:全国网站的网页情况 1.网页数及网页字节数 表11网页数及网页字节数情况
![]() 图78全国网站的静动态网页数
![]() 本次统计与上次统计一样,已经先行剔除了重复网页,网页总数为3.118亿。目前,中国互联网中网页的重复率比较高,估计有25-40%,为了数据的准确,我们没有计入这些重复网页。 该比例中动态网页数与实际情况相比是偏小的,这是由于:网上包含大量的动态网页,搜集到的网页只是网上动态网页的一部分。 动态网页按照访问的方式可以分为两种:(1)通过点击超链,无需额外输入即可访问的网页;(2)必须通过输入内容才可以访问的网页。 搜集到的动态网页不是全部,因为:(1)搜索引擎一般只搜集第一种动态网页。(2)各包含动态网页的站点上一般会有大量的动态网页,且动态网页的内容质量相对静态网页低得多,因此搜索引擎一般只搜集有限的动态网页以保证其数据的质量。 2.网页的编码分类 表12网页的编码情况
![]() 3.网页的内容分类情况(按多媒体形式) 表13网页的内容分类情况(按多媒体形式)
![]() 4.网页的更新周期 表14网页的更新周期情况
![]() 图79网页的更新周期
![]() |