首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
乔建忠 《图书情报工作》2013,57(14):114-120
针对主题爬行技术中的单一分类算法在面对多主题Web抓取和分类需求时泛化能力不强的局限,设计一种利用多种强分类算法形成的分类器组合,主题爬行器根据当前主题任务在线评估并为分类器排名,从中选择最优分类器分类的策略,并开展在多个主题抓取任务下的分类实验,比较每种分类算法的准确率和组合后的平均分类准确率以及对分类效率等评价指标的综合分析,结果证明该策略对领域局域性有所克服,普适性较强。  相似文献   

2.
为解决图书馆特色文献数据库建设及特色文献检索服务的问题,本文选取"辛亥革命"历史文献资源作为研究对象,利用TopicMaps技术整合了相关网络资源,分析了历史文献分类组织中的"主题"选取原则,定义了各"主题"文献资源之间的"关联"关系,结合Ontopia主题图工具软件完成了历史文献资源的网络化、系统化组织,并展示了组织效果。  相似文献   

3.
互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost算法获得文档在主题上的概率分布,然后利用训练集提取出的隐含主题-文本矩阵进行分类器训练,最终构建文本分类系统。研究结果显示,该系统能够有效完成文本混合自动分类,分类误差率较低,分类性能明显优于传统的文本分类方法。  相似文献   

4.
国外学术信息主题网关特点分析   总被引:7,自引:1,他引:6  
对Internet上60个国外学术信息主题网关的概况进行调查,从主题覆盖、资源类型、分类和组织、浏览和检索、网页设计等方面对其主要特点进行分析,归纳国外学术信息主题网关的主要特点,认为国外学术信息主题网关涉及学科全面,分类和著录规范,强调资源的选择性,网页设计简洁明了,整体制作标准规范,值得我国同行予以借鉴。  相似文献   

5.
分类主题一体化在网络信息资源组织中的应用   总被引:18,自引:1,他引:17  
本文简述了分类主题一体化的含义 ,分析了分类主题一体化语言四种模式组织网络信息资源的优劣 ,探讨了网络信息资源组织中成功应用的六种分类主题一体化系统。  相似文献   

6.
本文在分析用户网络浏览行为的基础上,从用户的专业知识经验出发设计了用以控制、引导网络蜘蛛行为的专家知识库,利用模糊规则推算法,在进行网页下载的同时对网页中的URL主题相关度进行预测的同时对相应的资源进行模糊规则分类.文章并以基础教育资源搜集为例对该算法进行了实现,通过对先后两个版本的系统性能的分析和比较,结果表明,使用模糊规则推理算法,进行URL相关度预测可以有效提高主题资源搜集的速度,采用二次分类的办法可以进一步提高资源分类的准确度,从而提高主题资源搜索系统的整体性能.  相似文献   

7.
搜索引擎Yahoo的分类体系及性能评价   总被引:4,自引:0,他引:4  
Yah00最关键也是最成功之处就在于它为搜索引擎,尤其是主题指南的搜索引擎的设计和开发树立了"模板"。我们应借鉴其先进的搜索引擎经验,进一步完善网络信息资源尤其是中文信息资源的组织和管理。目前很多的搜索引擎都是将人工编制的等级式主题目录和计算机检索软件提供的关键词等检索手段结合起来,完成网络信息资源的组织任务。Yah。。就是这种等级式主题指南类搜索引擎的典型代表。Yahoo的援力,就在于它的可测览式等级主题索引。按照主题建立分类索引,提供全面的分类体系结构,并结合高质量的检索软件,Yahoo成功地建立起了一套独特…  相似文献   

8.
Web页面中文文本主题的自动提取研究   总被引:14,自引:1,他引:13  
韩客松  王永成  滕伟 《情报学报》2001,20(2):217-223
Internet上的内容日益增多 ,搜索引擎返回的结果往往冗长。本文首先讨论Web页面文本与一般文本的四个不同点 ,然后介绍一种以统计方法为主、以匹配校验为辅的Web页面中文文本主题自动提取方法 ,它能帮助用户在最短时间内了解当前页面的主题。实验显示 ,所提取的前15个字串 ,反映主题的平均正确率在 85%以上 ,而处理时间仅为几十到几百毫秒。  相似文献   

9.
分类法与主题法在网络信息资源组织与揭示中的应用   总被引:16,自引:0,他引:16  
本文主要从分类法与主题法组织与揭示传统文献的优势出发,论述了分类与主题仍然适合组织与揭示丰富多彩的网络信息资源以及分类与主题在组织与揭示网络信息资源中的特点及作用。最后提出了分类主题整体化的问题。  相似文献   

10.
网络时代《中国分类主题词表》的发展与应用   总被引:4,自引:1,他引:3  
论述《中国分类主题词表》电子版的研制概况和设计思想,指出其电子版不仅可应用于文献信息资源的网络标引,实现分类主题一体化标引和检索,而且可作为文献信息资源网络检索的电子工具。此外,《中国分类主题词表》电子版在概念关系处理与自然语言处理方面有了新的进展;其远程网络管理系统的开发将是实现联机动态修订维护的基础。  相似文献   

11.
The objective of this study was to evaluate the HealthInsite topic query technique, which uses a dynamic database search to assign resources to a topic. It is an alternative to the explicit classification technique, which relies on the classification of each resource using a predefined classification scheme. We performed a recall-precision analysis on all topics within the broad topic area of Child Health. Recall and precision errors were checked to determine which part of the information retrieval process was at fault. We then compared the topic query technique with the explicit classification technique. The results show errors or problems at every stage of the information retrieval process. This has initiated a review of all the tools used in the process, from indexing guidelines to the search engine. While many errors could be corrected, there were still features of the explicit classification technique that could not be achieved by the topic query technique. In conclusion, the topic query technique has the advantage of flexibility, but close co-operation between the different information retrieval specialists is needed to get the best results. The HealthInsite topic navigation structure should be regarded as an organized set of predefined searches rather than a full classified listing.  相似文献   

12.
王效岳  白如江 《情报学报》2006,25(4):475-480
结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法。首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类。这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点。试验结果表明,与朴素贝叶斯、SVM、KNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本。  相似文献   

13.
基于OA期刊的高校图书馆资源建设与学科服务探索   总被引:1,自引:0,他引:1  
OA期刊资源是一种重要的学术资源,是高校图书馆馆藏资源的有机组成部分,在高校图书馆学科服务中发挥着重要的作用。目前我国高校图书馆在OA期刊资源利用中存在大量的问题。因此,认识和了解OA期刊资源,并对其进行组织和揭示,提高图书馆和用户对OA期刊资源的利用效率,是高校图书馆资源建设和学科服务发展面临的重要课题。  相似文献   

14.
图书馆数字资源评价指标体系研究   总被引:3,自引:0,他引:3  
数字资源已经成为图书馆资源的重要组成部分,对于数字资源的引进如何选择,目前还没有一个比较满意的评价体系,本文试图通过对数字资源评价指标分类及其指标值的量化,对数字资源评价方法进行探讨。  相似文献   

15.
论高校图书馆馆藏资源建设的质量保障   总被引:1,自引:0,他引:1  
在馆藏文献资源快速增长的时期,如何确保馆藏资源建设的质量是高校图书馆面临的重要课题。文章就馆藏资源的采访、购置及编目的质量保障进行了探讨。  相似文献   

16.
网络信息资源组织中传统分类法的应用   总被引:4,自引:0,他引:4  
论文分析了传统分类法在网络化环境下应用的现状、优势、适应性,并对如何改进现有的分类法以适应网络信息资源的组织和整合,提高网络信息资源的利用率提出了一些建议。  相似文献   

17.
东莞图书馆数字资源的整合建设与便捷服务   总被引:1,自引:0,他引:1  
信息社会和数字出版不断发展,数字阅读日益流行,数字资源成为公共图书馆的重要资源,如何更好地建设数字资源并开展服务成为公共图书馆面临的新课题。文章论述了东莞图书馆数字资源整合建设的内容、原则和具体措施,随之结合东莞图书馆的实践分析了一些具体的便捷服务举措,并提出了几点问题及思考。  相似文献   

18.
XTM的主题相关度的量化机制研究   总被引:1,自引:2,他引:1  
主题图XTM作为一种用于描述信息资源知识结构的工具,在信息和知识资源的整合领域有着广泛的应用前景。然而,在XTM技术框架中只定义了主题之间的关联,并没有给出相应的相关度评价方法,而且关联只局限在彼此有直接关联的主题之间,并没有定义间接关联。因此有必要为主题图引入相关度的评价,进而更清晰地理解主题图的语义结构。针对这一问题,本文在对XTM中主题关联语义结构的分析的基础上,通过划分主题关联种类,从XTM抽取出其树形的语义层次结构。在此树形结构的基础上,引入语义距离的概念进行对主题图的二级关联扩展和关联间语义相关度的计算。并在在相关算例的验证过程中,得到了较好的计算结果。  相似文献   

19.
运用模块化设计的思想和方法,依据数字资源分类标准,重新构建图书馆数字资源内容体系,形成电子图书、电子期刊、二次文献和其他4个资源模块,采用传统的资源整合方式独立整合模块内部资源,按照模块化设计规则将各个模块组合成为数字资源整合系统。并探讨制定数字资源模块化设计规则,遵行设计规则分解和组合资源模块、整合模块内部资源等内容。
  相似文献   

20.
为保护知识产权,图书馆的数字资源的访问都是受到严格限制的,随着读者对资源访问需求的增加,如何合理解决用户远程访问的问题已成为一个研究热点。通过对SSLvpN技术的介绍及SSL协议与IPsec协议的对比分析,肯定了SSLvPN的远程资源访问模 式是一种安全有效的解决办法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号