全国客服热线:4006-880844

网站建设定制采取适当的网页归档技术

- 编辑:admin -

推送模式由政府或者第三方机构主动将网站信息主动呈缴或捐赠到保存机构,这种主动的方式有助于深层网页和数据库资源等采集难度较大的资源也能够安全、便捷地转移到保存机构。

       采取适当的网页归档技术。目前主流的网页归档技术包括推送和拉取两种模式,两种模式的采集主体不同,适用不同的网页收集情况和要求。推送模式由政府或者第三方机构主动将网站信息主动呈缴或捐赠到保存机构,这种主动的方式有助于深层网页和数据库资源等采集难度较大的资源也能够安全、便捷地转移到保存机构。拉取模式则是由保存机构使用特定软件工具,将网站信息资源采集、下载并保存在本地服务器中。

       采集方法又可进一步划分为四类:一是广泛式采集,即采用收割软件自动采集国家域名范围内或整个因特网的网页及其他在线资源,能够实现大范围、全面、快速采集,但采集质量和时间难以把控;二是选择性采集,即根据资源主题、内容、价值等要素有选择地采集部分网络空间或特定资源,经过选择收集的资源内容质量相对较高,但目前以人工甄选为主,工作量较大且判断会受个人主观因素影响;三是专题性采集,一般针对具体的专题或事件进行采集;四是复合式采集,即综合利用以上多种采集方法,实现优势互补,能够在一定程度上同时满足广度与深度的要求。

       因此,上述采集方式适用于不同的主体及其各异的资源收集需求,对资源广度要求较高的采集活动可以选择广泛式采集;有特定工作开展或研究需求的主体通常需要在某一领域深度挖掘信息,因此可以在实施选择性采集或专题采集;复合式采集则适用于掌握一定经济实力、技术基础较好的大型组织机构,实施广度采集的同时,选择重点领域或重要事件进行深度采集,实现资源采集全面性与深入性相结合。