首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
随着网络技术的飞速发展,Web资源日益成为我们文化遗产的重要组成部分。本文通过比较研究,认为建立Web档案馆是适合于中文Web资源保存与管理的最佳选择。文章首先提出了Web档案馆的概念,接着对建设中文Web档案馆的意义、必要性及可行性进行详细论证,然后集中讨论了Web档案馆建设的目标与原则、组织与管理机制、馆藏建设、技术方案、资金、法律以及社会条件等问题。  相似文献   

2.
一种Web多维分析模型及应用   总被引:1,自引:0,他引:1  
朱家稷  闫宏飞 《情报学报》2004,23(5):553-560
Web上的网页正以惊人的速度增长和变化 ,给传统搜索引擎的效率和质量带来了许多新的问题和挑战。我们迫切需要一种研究方法 ,能够对搜索引擎收集来的海量网页进行有效的分析 ,以便对Web保持完整清晰的认识来指导搜索引擎进行更有效的服务。本文提出一种基于时间、空间和内容的三维Web分析模型 ,通过它可以对海量的网页数据进行多维度、多层次的分析工作 ,为我们认识Web提供一种全新的视角。在实验中我们简单地实现了该模型 ,并通过对 3批网页数据进行分析 ,得到网页变化率、网页空间分布、复制强度大的网页特点等数据 ,以及Internet作为“第四媒体”在信息传播上的一些特点。  相似文献   

3.
黎雨铭 《大观周刊》2012,(36):72-72
现今我们打开浏览器后看到的动感网页多是通过Jave在Web中的应用来实现的。1994年,Java语言以其简单安全、高性能、多线性、动态性等特点开始成为因特网中最受欢迎的开发与编程语言,经过18年发展而日趋成熟的Java语言在Web中的应用已经涵盖了教学、商务、政务乃至医疗等与我们日常生活密切相关的各方各面。本文通过对Java语言Web应用的概览,为读者提供一个对网页Java的整体印象。  相似文献   

4.
Web多媒体网页中多媒体资源的相关文本对于描述Web多媒体资源具有重要意义,利用Web多媒体网页搜集器搜集网络中包含多媒体资源的网页,对网页进行区域分析.根据多媒体资源所在网页中的嵌入形式,设计Web多媒体资源相关文本信息提取系统,准确提取Web页面中多媒体资源的相关文本.实验结果表明,该系统提取Web多媒体资源的相关文本准确率较高,有助于提高多媒体信息检索系统的查全率与查准率.  相似文献   

5.
在Web标准出现之前,绝大多数的网页开发都采用表格布局法,Web标准技术的出现是一种技术的进步和更替,以CSS布局为代表的Web标准技术逐步为大家所接受.直到今天,Web标准已经成为网页设计行业的共识,成为Web开发通用的技术标准,传统技术方式受到挑战并逐步被淘汰,Web标准技术成为行业新的标准和开发指南.对新一代的网页设计师、开发者和网站管理者来说,应该开始思考在“漂亮”的页面背后,我们长期忽略并应该关注的东西,包括:网站的成本、易用性、可维护性、SEO以及可访问性.  相似文献   

6.
基于超链分析的Web资源自动发现技术   总被引:2,自引:0,他引:2  
传统的Web资源自动发现是基于Web页面内容实现的。本文试图从超链分析的角度探讨Web资源的自动发现技术。超链分析技术起源于社会网络分析和科学引文分析理论,它只分析页面之间的关系,而不关心页面本身的属性。通过试验证明,单纯使用超链,根据用户提供的网页实例,我们能够自动发现与学科资源相关的网站。该技术可以有效的减少网络爬行器的无谓爬行,提高采集效率,减轻网络负担,在学科资源建设中起了重要的作用。  相似文献   

7.
在数字图书馆Web 学术信息资源的优化采集中,有效结合网页空间特征、内容特征和标签信息对网页进 行分块,研究对分块结果进行识别和合并,然后输出网页的主题文本和相关链接块集合,最后通过实验分析该方法能 够进一步去除页面中噪音、准确地分析页面的主题相关性和提高Web 主题信息采集的质量。  相似文献   

8.
Web网页信息变化的时间局部性规律及其验证   总被引:6,自引:0,他引:6  
孟涛  闫宏飞  王继民 《情报学报》2005,24(4):398-406
掌握Web网页信息变化的时间规律可以更有针对性的指导搜索引擎等Web应用系统更有效地进行搜集。本文旨在研究中国范围内Web网页变化的时间规律,针对网页变化的频率和间隔两项指标,随机选取数百万网页作为样本,设计试验在一个月内对上述两项指标进行考察。从结论中,我们发现网页变化的若干规律,并发现其中可能存在时间局部性规律。因此,我们引入了堆栈距离模型,在针对Web网页的变化特性和具体实验方法对其修正之后,再次设计实验对网页变化的时间局部性规律进行考察。结果表明,网页的变化存在明显的时间局部性。最后,介绍了这种时间局部性规律在网页搜集中的实际应用。  相似文献   

9.
Web资源保存现状与思考   总被引:7,自引:0,他引:7  
杨道玲 《图书馆杂志》2004,23(10):32-36
随着网络通信技术的发展,Web资源已经日益成为我们文化遗产的重要组成部分。网络信息的迅速增长,为数字图书馆和数字档案馆的内容采集、保存和利用提出了新的挑战,这种挑战使我们面临新的课题。本文通过对国内外几个主要相关项目的介绍与评述,在对比研究的基础上,提出Web资源保存所面临的几个问题与思考。  相似文献   

10.
我国公共图书馆应为青少年提供Web服务   总被引:4,自引:0,他引:4  
我国公共图书馆的Web站点建设已初具规模并进入快速发展时期,但需引起我们重视的是各公共图书馆的Web站点上都缺少专门为青少年提供服务的网页。一般而言,面向青少年的Web服务应主要包括网络安全知识介绍、书目推荐、家庭作业辅导、网络资源导航、游戏娱乐等内容。  相似文献   

11.
语义Web为我们提供了一个通用的框架,是现有Web的扩展.语义Web以资源描述框架(RDF)为基础,RDF以XML作为语法、URI作为命名机制,将各种不同的资源集成在一起.本文探讨了基于语义Web的图书馆门户建设,并阐明此类门户的信息结构更加合理和灵活,具有更好的扩展性、可持续性和个性化的特点.  相似文献   

12.
基于结构对Web网页区域分割与语义识别,实现网页语义理解,给出Web多媒体相关文本的定义,并结合其分布特点,采用个体级、区域级、网页级三级分析方法分别进行提取,从而实现Web多媒体相关文本准确提取。  相似文献   

13.
Web资源保存面临的挑战及其对策   总被引:1,自引:0,他引:1  
Web资源作为人类文化遗产的重要组成部分,日益受到各国的重视。本文概述了国内外几个主要的Web资源保存项目,同时在对保存项目所面临的五大挑战进行分析的基础上,提出了相应的对策。  相似文献   

14.
Web多媒体网页中多媒体资源的相关文本对于描述Web多媒体资源具有重要意义,利用Web多媒体资源所在的网页中的嵌入形式,设计Web多媒体资源相关文本信息提取系统,准确提取Web页面中多媒体资源的相关文本。实验结果表明,该系统提取Web多美资源的相关文本准确率较高,有助于提高多媒体信息检索系统的查全率与查准率。  相似文献   

15.
主要介绍了我们设计的Web主题信息采集系统的一项核心工作——Web信息主题的识别,主题识别算法从构造专业性较强的主题词典着手,充分分析和考虑Web网页文本的特点,从而大大提高了主题信息采集的效率和精度,该算法同样适用于其他领域的主题信息识别。  相似文献   

16.
以网易汽车资讯网页信息抽取为例,研究了基于领域本体的Web信息抽取技术的设计与实现.  相似文献   

17.
基于Web结构挖掘的网络动态竞争情报采集研究   总被引:2,自引:0,他引:2       下载免费PDF全文
通过挖掘蕴含在Web内部结构和网页中的关联信息与结构模式,Web结构挖掘为企业实现多维度和多层面的竞争情报采集提供了一种有效途径。基于Web结构挖掘的网络动态竞争情报采集方法有:URL挖掘、Web内部结构挖掘和超链接挖掘。图1。参考文献15。  相似文献   

18.
Web资源采集策略评析与思考   总被引:1,自引:0,他引:1  
Web资源的采集是目前业界讨论的焦点问题之一,各国都在积极探索Web资源采集的策略。本文围绕Web空间的划定、采集方式、采集频率等三个问题,对国际Web资源采集的各种策略进行了评析,并对制定我国Web资源采集策略提出了几点建议。  相似文献   

19.
通过对2000到2003年期刊论文中的Web引文记录的统计分析,提出了引文有效率、年衰减指数和有效性半衰期等指标。基于这些指标,我们对Web资源是否适合学术引用进行了探讨,并得出结论是:在目前这种互联网环境下,鉴于网络的动态性和不稳定性,Web资源的可查证性是有问题的。同时我们还看到,由于网站发布成本下降,Web信息趋于更加不稳定,其可查证性也随之降低。  相似文献   

20.
文化遗产是人类历史上精神或物质产品的沉淀和遗存,在正在到来的Web 3.0时代,文化遗产将会呈现出全新的形态和应用方式,相关技术也将全方位多角度地对文化遗产的保护、传承和利用产生颠覆性影响,并对其价值实现起到前所未有的促进作用。本文梳理总结文化遗产价值认识和价值构成的相关研究,重新审视文化遗产价值建构在新技术革命中的适应性;在此基础上,提出Web 3.0环境下文化遗产价值重构的实现路径与可能方式,探讨通过数据化、资产化和虚拟化,使文化遗产的内在价值和外在价值得到充分彰显和外化,促进文化遗产价值的全面实现。图2。表2。参考文献40。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号