首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
Web信息主题采集技术研究   总被引:9,自引:0,他引:9  
李春旺 《图书情报工作》2005,49(4):77-80,70
简单介绍主题信息采集系统;从5个方面对其核心技术进行深入研究,包括种子页面生成、主题表示、相关度计算策略、爬行策略以及结束搜索策略等;详细讨论种子页面生成的人工方式、自动方式及混合方式,基于关键词的主题表示与基于Ontology的主题表示,多种相关度计算启发式策略比较,基本爬行策略与隧道技术以及结束爬行的多种情形等;在分析相关技术的算法、特点与应用情况的同时,针对主题信息采集特点提出相应的改进意见。  相似文献   

2.
基于Ontology的文档过滤研究   总被引:2,自引:0,他引:2  
区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用,重点阐述公共本体、用户本体和文档本体的构建方法以及实施过程中涉及的技术体系;最后指出今后的努力方向。  相似文献   

3.
基于叙词表的领域本体构建研究   总被引:15,自引:2,他引:15  
论述了叙词表与领域本体(Domain Ontology)的区别与联系,讨论了基于叙词表构建领域本体的优越性,简要介绍了本体开发工具,最后提出了一种基于叙词表的领域本体构建方法,通过一个本体原型构建过程对该方法进行了详细阐述。  相似文献   

4.
大型Ontology构建工具KAON的使用和评价   总被引:4,自引:0,他引:4  
分析了大型Ontology构建工具KAON的工作原理和基本功能,分别介绍了其对Ontology的文件处理、内容编辑和功能设置等功能,同时给出相应的使用评价和体会,文章的目的是通过推荐使用KAON,促进我国图书情报领域对Ontology构建的关注和研究,示范本体论的构建方法。  相似文献   

5.
基于Ontology的语义检索研究   总被引:19,自引:0,他引:19  
本文从语义检索和概念空间的内涵入手,分析了现有的两种概念空间形式,重点分析了基于Ontology的概念空间的构建方法、描述语言及其编辑工具Protégé.在此基础上,分析了基于Ontology的语义检索系统的构建步骤及其关键技术.最后利用Protégé实现了简单的语义检索.  相似文献   

6.
网络竞争情报主题采集技术研究   总被引:2,自引:0,他引:2  
文章设计与实现了一种网络竞争情报的主题采集系统。该系统在进行主题预测时采用的基于改进的朴素贝叶斯算法提高了主题判断准确率,在进行链接预测时采用的基于规则与锚文本主题相似度结合的算法,避免了URL锚文本较短和噪声的问题。与宽度优先的采集技术相比,通过实验验证该方法具有明显的优越性。  相似文献   

7.
区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用,重点阐述公共本体、用户本体和文档本体的构建方法以及实施过程中涉及的技术体系;最后指出今后的努力方向。  相似文献   

8.
以概念格理论为基础,在形式概念分析的基础上,提出以粒度概念分析(GCA)的方法进行文献关键词分析,并针对Ontology领域开放存取文献的关键词,构建不同粒度概念格。通过基于粗细不同粒度概念格的挖掘,对Ontology领域相关文献进行领域高频关键词和相关低频关键词的分析,从而揭示和呈现Ontology领域相关知识的结构和内在关联,以期探索一种基于概念格的文献关键词分析的新途径。  相似文献   

9.
Ontology在数字图书馆领域中的应用与研究综述   总被引:2,自引:0,他引:2  
刘颖  詹萌 《图书馆杂志》2005,24(6):53-58
Ontology作为一种能在语义和知识层次上描述概念体系的有效工具,是知识工程及其相关领域的研究热点之一,在数字图书馆领域也得到了相当广泛的关注。本文简要介绍了OntologY在数字图书馆领域的研究和应用现状,包括Ontology与叙词表、分类法、知识库、元数据的关系,Ontology构建方法以及Ontology在数字图书馆领域的应用等。  相似文献   

10.
谷俊  翁佳  许鑫 《图书情报工作》2014,58(20):91-99
面向互联网的主题采集是情报获取的重要手段,面对爆发式增长的互联网信息资源,设计并实现一套由采集准备、URL分析及提取、模板学习、正文抽取等几阶段组成的主题采集工具,其中URL分析与提取采用基于链接类型的URL筛选方法,实现正文网页URL的筛选;模板学习和正文抽取部分采用基于DOM树的节点比对方法,完成模板的构建与正文抽取。实验结果表明,本文所提出的主题采集工具采集准确率较高,能够适应目前情报信息采集的需求。  相似文献   

11.
本文介绍了在校园网络教学系统设计中应用Web内容自动生成技术的设计思想,充分利用数字化图书馆的资源优势,结合实际讨论了基于数字图书资源结合ASP技术智能化网络教学系统的建设方法。  相似文献   

12.
基于超链分析的Web资源自动发现技术   总被引:2,自引:0,他引:2  
传统的Web资源自动发现是基于Web页面内容实现的。本文试图从超链分析的角度探讨Web资源的自动发现技术。超链分析技术起源于社会网络分析和科学引文分析理论,它只分析页面之间的关系,而不关心页面本身的属性。通过试验证明,单纯使用超链,根据用户提供的网页实例,我们能够自动发现与学科资源相关的网站。该技术可以有效的减少网络爬行器的无谓爬行,提高采集效率,减轻网络负担,在学科资源建设中起了重要的作用。  相似文献   

13.
一种基于源网页质量的锚文本相似度计算方法--LAAT   总被引:8,自引:0,他引:8  
陆一鸣  胡健  马范援 《情报学报》2005,24(5):548-554
锚文本作为对目标网页的描述,往往分布在不同的源网页上,质量也参差不齐。本文利用了超链接分析算法的成果,提出一种基于源网页质量的锚文本相似度计算方法——LAAT(Link Aid Anchor Text)。实验表明,利用源网页质量能够有效地综合各源网页上的锚文本组成,从而能够提高检索性能。  相似文献   

14.
运用共词分析的方法,检索CNKI数据库中的链接分析领域论文,确定高频关键词,用Bicomb建立关键词共词矩阵,以SPSS为工具进行因子分析和聚类分析,探讨国内链接分析的研究现状与研究热点,发现应用于链接分析的方法主要有引文分析、共链分析、可视化、社会网络分析等,链接分析算法主要包括PageRank算法、HIST算法、网页排序等,应用研究集中于网络信息资源评价、网站的网络影响力评价和大学评价.  相似文献   

15.
在数字图书馆建设中,不同资源库和平台使用独立的技术框架、资源格式和应用程序,导致存在"孤岛"问题,不同机构在资源共享上存在障碍,尽管近年业界就数字资源集成开展了一系列研究和实践,但这些研究和实践主要面向发现服务,读者在资源使用和管理上仍然受"孤岛"问题制约。国际图像互操作框架(IIIF)是由国际图书馆、博物馆、档案馆等机构推出的一项技术标准,用于定义一组规范的资源传输接口(API),促进异构平台和资源库对图像资源的交换和共享。文章引入IIIF技术,讨论如何促进用户一站使用和多来源集成资源,并就改进发现服务的性能进行探讨。文章采用文献调研法、访谈法、案例分析法等方法对IIIF在数字图书馆中的应用展开研究。首先就IIIF的特点进行分析,包括:独立于系统环境;开放的应用建设;保存与使用分离。在此基础上,提出IIIF在数字资源集成中的应用设想。在数字资源集成中,IIIF的主要应用包括:搭建一站资源使用环境;为用户安装专业浏览器;为用户集成资源创造条件;建设虚拟特色数据库。  相似文献   

16.
网页重现是利用相关技术方法、工具来恢复网页原貌。文章结合Warrick和Past Web Browser等实际案例分析了基于网络资源长期保存的网页重现技术在网站恢复、网站重建、历史页面重现应用的方法、过程、效果,为相关研究提供了参考价值。该文为2009年第七期“网络信息资源保存”专题文章之一。  相似文献   

17.
It is well documented that government agencies, at all levels, continue to have problems ensuring that government web sites follow laws related to web accessibility for people with disabilities. Although there are a number of published studies on government web accessibility that are point-in-time, there are no published studies consisting of a longitudinal analysis of state-level government web site accessibility. This paper contributes to the research literature in three ways: 1) an accessibility inspection of 25 Maryland state government homepages in 2012 which involved 150 human inspections of web pages, 2) a comparison of the results from 2012 to a similar accessibility evaluation in 2009, and 3) a discussion of the role of a web page template, which was introduced in Maryland state government shortly after the 2009 evaluation. The data from this longitudinal evaluation leads to the conclusion that web page templates do tend to result in more accessible sites within state government.  相似文献   

18.
高校学术文库网页的栏目设计   总被引:5,自引:0,他引:5  
高校图书馆的学术文库主要收藏本校教师、校友的学术著作和其他作品及与本校有关的各类资料,是高校图书馆的特色资源,建立本校文库网页非常必要。本文探讨了高校文库网页栏目的设计原则,并在清华大学图书馆文库网页栏目设计中作了尝试。  相似文献   

19.
 针对农产品市场行情信息的精确采集,综合运用WebClient类和开源类库HtmlParser.NET,自动生成行情信息动态网页的分页下载链接,将每个分页下载转换为静态网页。建立基于HTML结构特征的网页数据精确提取通用方法,实现循环提取所有行情信息数据。  相似文献   

20.
从网页设计看高校图书馆的网站建设   总被引:19,自引:0,他引:19  
高校图书馆拥有特殊的用户群 ,其网页设计应该体现这一特点。本文抽取国内 30所高校图书馆的网页进行调查 ,在对调查结果进行分析总结的基础上 ,提出了对高校图书馆网站建设的一些建议  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号