首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于《金融档案分类表》的自动分类算法研究   总被引:8,自引:1,他引:7  
本文介绍基于《中国档案分类法金融档案分类表》(以下简称《金融档案分类表》)的中文文本自动分类算法。提出了类别词概念,介绍了类别词库和分类规则词库建造法以及自动分类的三维加权算法等内容。经过对真实金融档案文本测试,自动分类正确率可达81%以上。  相似文献   

2.
分类是档案检索中的一个重要途径.运用分类方式检索档案,首先要制订出分类目录,然后根据分类目录进行分类标识,并在分类检索实践中积累经验,才能做到熟练应用,使之成为一种快捷高效的档案检索方法.  相似文献   

3.
基于词典约简及多分类算法的文本分类系统的设计与开发   总被引:3,自引:1,他引:2  
文本自动分类是目前机器学习、自然语言处理和信息资源检索领域的研究热点之一.本文在对自动分类的实现技术问题进行探讨的基础上,尝试对自动分类的几个环节提出改进措施.具体包括:采用约简法进行抽词词典的构造,采用投票法进行文本特征的选择,采用层次法进行逐层次的分类,采用统计与规则相结合的方法进行分类器的构造等.通过在不同语料库上与传统分类方法的对比测试表明,上述改进措施能够有效提高自动分类的性能,基于这些改进措施所开发的自动分类系统具有大规模文本自动分类的可行性.本文详细讨论了相关改进措施的原理、实现算法、流程及存在的问题.  相似文献   

4.
基于《中图法》的多层自动分类影响因素分析   总被引:2,自引:1,他引:1  
系统总结基于<中图法>知识库的多层自动分类项目的研究经验,分析训练数据、特征词选择、分类算法、类目体系和评估方法等因素对多层自动分类的影响.围绕<中图法>,对自动分类的适应性、稀有类别的处理、知识库更新、明显正确或错误数据的标注、标准数据集的制定等进行探讨.  相似文献   

5.
文献自动分类就是实现书本分类法的机读化,利用计算机对文献进行分类标引.本文分别从分类标引人员和用户检索等不同的角度分析了自动分类系统建设过程中应考虑的事项.  相似文献   

6.
潘涛 《浙江档案》2004,(10):21-21,30
要实现全国民国档案检索体系的标准化、规范化,首先必须著录标引统一、规范.民国档案分类标引自动转换系统研究就是要解决<民国档案分类表>版本的差异给各档案馆民国档案分类标引带来的不一致性问题.  相似文献   

7.
分类法主题法一体化自动标引系统的基本原理和方法   总被引:7,自引:0,他引:7  
本文阐述基于文献题名的自动标引系统的原理和方法,该系统是分类法主题法一体化的。文中说明了依据文献题名对文献进行分类和主题标引的可行性、从题名中自动轴词、以体系分类法为基础的自动分类用分类词表、自动分类规则及以分面分类法为基础的文献自动分类、自由体系自动分类、半自动抽词、检索系统的分类法主题法一体化检索功能保证检索系统质量的关键因素等问题。  相似文献   

8.
虚拟图书馆中网页的自动分类研究   总被引:1,自引:0,他引:1  
概括了国内外对电子文本及Web网页进行自动分类的研究和试验,论述了虚拟图书馆中对网页进行自动分类与一般搜索引擎中对网页进行自动分类的区别,提出了一种用于虚拟图书馆中对网页进行自动分类的方法,并描述了按照此方法建立的“图书馆学情报学”虚拟图书馆的自动分类系统,对分类结果进行了分析。  相似文献   

9.
基于本体进行自动分类的元搜索引擎的设计与实现   总被引:1,自引:0,他引:1  
研究基于本体对元搜索引擎查询结果进行自动分类的方法,依据事先构建的药学本体,实现基于本体对元搜索引擎的网页结果进行自动分类的实验系统,形成层次清晰、逻辑合理的分类显示结果界面。最后对实验系统的准确度进行评价,网页分类基本取得预期的效果。  相似文献   

10.
档案分类就是根据档案的性质、内容、特点和相互之间联系划分成一定的类别,形成一个具有并列(横向)的关系和具有一定从属(纵向)的关系的不同等级层次系统.在《陕西省邮电企业档案分类、编号实施细则》中规定了邮电企业档案分类原则,分类方法和一、二级类目设置.经过本单位近几年的贯彻实施,我认为邮电企业档案分类方法存在着一定的弊端,给档案管理工作带来一定的影响,主要表现在:  相似文献   

11.
论语料库技术在自动分类研究中的应用   总被引:1,自引:0,他引:1  
本文分析了我国自动分类研究所采用的技术及其不足,介绍了语料库技术的相关内容,在此基础上,作者认为以语料库作为自动分类系统的技术支撑,对于提高自动分类系统的性能具有明显的优势,最后,给出了基于语料库技术的自动分类系统的原理图.  相似文献   

12.
Web自动文本分类技术研究综述   总被引:1,自引:0,他引:1  
Web自动文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.本文首先分析了国内外Web自动文本分类方法的研究现状,接着对新近出现的多分类器融合的方法、基于群的分类方法、基于RBF网络的文本分类模型、基于模糊-粗糙集的文本分类模型、潜在语义分类模型等新方法,以及K-近邻算法和支持向量机的新发展等进行了深入探讨;并对Web自动文本分类过程中的几个关键技术:文本预处理、文本表示、特征降维、训练方法和分类算法等进行了分析;最后总结了当前Web自动文本分类技术存在的问题及其发展趋势.  相似文献   

13.
基建档案分类是基建档案整理工作的重要组成部分,分类,是合理组织保管单位,系统排列和科学编目的基础,是及时准确提供利用的重要条件,一个建设项目的档案虽然比较完整齐全,保管单位质量也大体符合要求,但是,如果由于分类不[科学,排列无规律可循,不能反映档案材料之间的有机联系,那么,它就不能达到有效利用的目的。我们说档案管理比较科学,除了看案卷本身及其相 的编目等质量较好外,在相当程度上尚需看分类是否便于保管和提供利用。因此,基建档案如何做到科学分类,是值得探讨和实践的一个不可忽视问题。  相似文献   

14.
在中、西方档案学领域,分类都是一个重要的工具,但是二者的建立及应用却有很大不同.为了尽可能获得对二者的整体性了解,本文从分类对象、分类目的、分类方法,以及分类效果等方面对中国档案分类与西方文件分类进行了比较分析,并从比较中得到一些启示.  相似文献   

15.
分类评价是当前科学评价的热点和难点.本文从评价实践出发,分析了评价数据的特征,论证了利用题录信息进行分类的可行性.结合评价要求和已有分类体系,提出<学科分类与代码>是中国科学评价领域的最佳分类体系.在梳理常规分类方法的基础上,归纳出这些方法适合于分类评价的方面,而且对这些方面进行进一步的改造和融合,提出和构建了科学评价论文分类系统,其特点是"二次分类"和"自动生成训练集".一次分类由期刊分类器和类号转换器完成,在将全部论文分到大类的同时可以将部分论文分到小类,分到小类的作为该大类的训练集.二次分类由SVM和投票机制组成,有效提高了系统的召回率.实验证明本系统能胜任科学评价中的论文分类任务.  相似文献   

16.
目前很多学校已经将档案管理纳入学校管理工作的议事日程.山西省颁布了院校档案分类的标准,但是由于中小学校的教育目标、教材内容、培养对象、学校管理、学校规模等诸项工作与大中专院校不尽相同,在档案分类上,中小学校搬用院校的分类标准有点不适应,采纳机关分类方法更为不妥.因此,对中小学校档案分类进行研究探讨是十分必要的.  相似文献   

17.
李伟  王永成  蔡巍  尹中航 《情报学报》2003,22(3):302-305
迅速而准确地更新自动分类系统的知识库是自动分类系统能投入使用的重要条件。本文在考察人类学习过程的基础上 ,提出一种能够在人的参与下 ,更新完善机器自动分类知识库的学习方法。通过实验 ,证实了该方法可以准确迅速地更新分类知识库 ,从而提高自动分类系统的分出率和分准率。  相似文献   

18.
多范畴信息系统的自动分类方法研究   总被引:1,自引:0,他引:1  
为解决传统自动分类方法中的多范畴信息处理能力弱的问题,本文提出了一种基于多范畴属性约简和复合相似度计算的多范畴信息自动分类方法,该方法首先在分类中引入决策属性,然后计算各范畴的决策类和广义决策类,获得多范畴分类属性的约简集族,并依此集族分别计算多范畴信息系统分类对象的复合相似度,依据复合相似度的计算结果对分类对象进行排序和标引,实现自动分类。此方法有效地解决了多范畴不完备信息系统的自动分类问题,通过与Google自建系统的对比分析可知建立在此方法基础之上的多范畴信息分类系统在查全率和查准率方面明显优于传统的自动分类系统。  相似文献   

19.
基于查询结果的Web数据库自动分类研究   总被引:2,自引:0,他引:2  
郭少友 《情报学报》2006,25(4):481-487
本文提出了基于查询结果的Web数据库自动分类方法,该方法以雅虎分类目录体系中的类目词为查询词对数据库进行查询,并根据查询结果对Web数据库进行分类。本文通过原型系统检验了该方法的分类效果。  相似文献   

20.
本文对比主题词自动标引分析了档案分类自动标引的主要难点问题 ,着重讨论了解决档案分类计算机自动标引程序设计中的档案分类词组动态拆分先组匹配、档案分类单元概念共性复分链接和隐性并列多主题概念自动分类标引这3项编程技术的基本设计思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号