首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 905 毫秒
1.
基于《中图法》的多层自动分类影响因素分析   总被引:2,自引:1,他引:1  
系统总结基于<中图法>知识库的多层自动分类项目的研究经验,分析训练数据、特征词选择、分类算法、类目体系和评估方法等因素对多层自动分类的影响.围绕<中图法>,对自动分类的适应性、稀有类别的处理、知识库更新、明显正确或错误数据的标注、标准数据集的制定等进行探讨.  相似文献   

2.
基于中文科技图书的图书分类专家系统设计   总被引:6,自引:0,他引:6  
本文在研究了计算机自动进行图书分类问题的基础上, 设计了一个实用的科技图书分类专家系统。该系统将图书分类专家的经验, 用关系知识表达, 构成关系知识库。这种把规则系统与数据管理系统集成起来的方法, 不但能管理较大的规则库并自动地共享, 而且很容易处理动态数据, 使系统有较高的运行效率。  相似文献   

3.
基于语料和基于标引经验的自动分类模式比较   总被引:1,自引:0,他引:1  
以传统文献分类体系为框架,构建知识库或分类器来实现信息的自动分类是信息加工自动化的一个发展方向。这种自动分类系统一般有两种模式:基于训练语料和基于人工标引经验。我实验室分别在这两种模式的基础上设计开发了两个不同的自动分类系统。本文将详细介绍这两个自动分类系统的结构、设计及其构建,然后分别从原理、知识库构建、分类算法等方面对这两者进行比较分析。  相似文献   

4.
蔡巍  王永成  尹中航  李伟 《情报学报》2004,23(4):399-403
本文着重研究了自动分类知识库中因为样本兼类而引起的存在于概念类频中的噪声 ,提出了借助于统计特性来修正概念类频的算法。在进行理论分析的基础上 ,本文讨论了算法的实现步骤 ,并通过对新闻语料的分类实验 ,检验了降噪效果。实验显示 ,本方法可以减少兼类概念在知识库中的冗余次数 ,提高自动分类系统的性能指标  相似文献   

5.
深入分析联合虚拟参考咨询系统(CVRS)分布式两级架构模式和咨询问题的处理流程,提出表单问题智能解答、自动应答机器人、知识库自动查重、实时咨询问题自动转表单咨询问题、从知识库批量提取FAQ问题和知识库自动分类等6项CVRS智能优化解决方案,并设计出以中文分词技术为核心,实现知识库全文检索和自动分类、实时交流记录和知识库内容文本摘要的技术路线。
  相似文献   

6.
基于知识库的网页自动标引和自动分类系统的设计   总被引:15,自引:0,他引:15  
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。  相似文献   

7.
自助式咨询知识库的组织设计   总被引:1,自引:1,他引:0  
以无人值守启发式咨询知识库为例,基于用户问题需求,宏观上将用户自助式咨询系统知识库分成四部分:咨询问题分类、已知条件分类、信息资源类型、检索技巧类型。微观上通过列举咨询问题组织设计样例,提出自助式咨询知识库问题分类、问题组织及设计中应遵循的几个原则。系统设计时,通过页链分析与检查,确保知识库动态更新时,不会因为页面删除而产生悬空页。  相似文献   

8.
本文依据中国知网、《中图法》、《中国分类主题词表》等知识库,通过对领域词语的概念化处理、建立推理规则、过滤掉阈值较低的词语等手段,形成领域词语本体知识库;然后,根据待分类题名的语义逻辑关系,结合基于距离的语义相似度的计算规则,形成一种应用于领域词语本体的题名自动分类方法,该方法在一定程度上弥补了文献题名特征不足的缺点,且提高了准确率和召回率。  相似文献   

9.
主要介绍在机构知识库系统中集成开放知识组织引擎OpenKOS相关功能,利用OpenKOS的开放服务接口对机构知识库中知识产出进行主题标引和提供基于规范主题词的分面浏览,并实现对检索结果进行DDC聚类浏览的服务功能。系统投入应用后初步达到结合传统知识组织方式,对数字资源实现自动标引与自动分类的目标。  相似文献   

10.
近五年来自动标引研究在关键词抽取、标引系统设计、自动分类标引、网络信息自动标引、数字图像标引、音频信息标引、视频信息标引、自动标引结果评价等方面取得很大进展,但尚存弱点与不足之处,还不能达到人工标引的效果。今后的研究将朝着探索更优越的语言分析技术、更高端的多媒体信息自动标引方法、高效的知识库智能自学习机制、多种标引方法或模型的互补的集成学习等方向发展。  相似文献   

11.
使用基于《中图法》知识库的中文信息自动标引和自动分类系统,对中文图书进行自动标引与自动分类的实验,以测试该系统对图书的适用性。实验通过对中文图书进行计算机自动标引与自动分类、人工打分测评、测试结果统计分析,得出中文图书的各标引源主题表达能力依次为:书名、内容提要、两级目次、参考文献、一级目次,在此基础上对标引源进行加权设计,权值设为5:3:2:2。实验证明该系统用于中文图书的自动标引与自动分类是可行的。表6。参考文献9。  相似文献   

12.
顾颖  何琳 《图书情报工作》2012,(19):109-113
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。  相似文献   

13.
本文旨在为国内外分类法拥有者快速实现现有分类法的Web版、Web Service术语服务、Linked Data化和自动分类等网络共享服务提供参考和支持。以《中国图书馆分类法》第四版为例,采用CNKOS对分类法进行语义化描述,使用Lucene全文检索引擎、Ext Js插件、Axis SOAP引擎和URL Rewrite等关键技术实现了分类法共享服务(CLSS)原型系统。经验证明所有功能模块运行和调用都符合预期效果。实践证明该套解决方案可投入使用,而且其他分类法类型的中文知识组织系统均可依此方法快速完成相应的部署。但是,对于部分复杂的自动分类需求,如要获得更为准确的分类号还需更深入的研究或人工辅助。图5。表4。参考文献21。  相似文献   

14.
用于中文信息自动分类的《中图法》知识库的构建   总被引:4,自引:0,他引:4  
中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干,组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。构建《中图法》知识库面临着一些难题:异构数据的整合;原始数据中分类号与主题词或词串之间一对多、多对多关系的筛选;标引词串与知识库中的词串的相符性比较等。图2。参考文献8。  相似文献   

15.
杨敏  谷俊 《图书情报工作》2012,56(9):114-119
将文本自动分类技术应用于图书书目的自动分类中,利用ICTCLAS分词系统对书名和摘要信息进行中文分词,为标题和摘要的特征词赋予不同的权重。在构建基于文本特征矩阵的基础上,结合SVM算法对实验语料进行学习和测试。为了验证TFIDF权重对分类结果的影响,还对词频特征矩阵、TFIDF特征矩阵和混合特征矩阵进行测试和对比。实验证明,基于混合特征矩阵的SVM算法具有良好的分类效果。据此,构建基于SVM的书目自动分类系统。  相似文献   

16.
将自动文本分类引入竞争情报系统,并结合民航客服业的实际应用场景展开研究。在对文本分类的理论基础进行研究与分析的基础上,设计一种自动分类策略,其核心是针对传统机器学习方法依赖历史数据的局限,优化特征选择和学习样本获取方法。选用SVM算法,详细描述分类词表构建、分类规则提取、分类模型训练等过程,最终取得较为理想的实际效果。  相似文献   

17.
数字信息资源的自动分类和主题识别--OCLC"蝎子计划"研究   总被引:2,自引:0,他引:2  
“蝎子计划(Scorpion Project)”是美国 OCLC 利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了 Scorpion 对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨 Scorpion 对中文信息自动分类和主题识别的借鉴意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号