首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
基于《金融档案分类表》的自动分类算法研究   总被引:8,自引:1,他引:7  
本文介绍基于《中国档案分类法金融档案分类表》(以下简称《金融档案分类表》)的中文文本自动分类算法。提出了类别词概念,介绍了类别词库和分类规则词库建造法以及自动分类的三维加权算法等内容。经过对真实金融档案文本测试,自动分类正确率可达81%以上。  相似文献   

2.
[目的/意义] 在人文计算兴起这一背景下,针对先秦诸子典籍进行自动分类的探究,以更加深入和精准地从古代典籍中挖掘出相应的知识。[方法/过程] 基于《论语》《老子》《管子》《庄子》《孙子》《韩非子》《孟子》《荀子》和《墨子》9种先秦诸子典籍构成的训练和测试语料,采用支持向量机技术,提取TF-IDF、信息增益、卡方统计和互信息为特征,完成针对先秦诸子典籍的自动分类实验。[结果/结论] 基于先秦诸子典籍得到的自动分类模型调和平均值能达到99.21%,效果较好,具有较强的推广和应用价值。  相似文献   

3.
数字信息资源的自动分类和主题识别--OCLC"蝎子计划"研究   总被引:2,自引:0,他引:2  
“蝎子计划(Scorpion Project)”是美国 OCLC 利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了 Scorpion 对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨 Scorpion 对中文信息自动分类和主题识别的借鉴意义。  相似文献   

4.
“蝎子计划(Scorpion Project)”是美国OCLC利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了Scorpion对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨Scorpion对中文信息自动分类和主题识别的借鉴意义。  相似文献   

5.
将人工智能研究领域中的文本自动分类技术应用于信息资源管理领域是当前的研究重点之一,而目前信息资源管理领域具有体系结构严格、类目数量巨大、类目层次众多等特点。本文充分考虑这些特点,针对《中国图书馆图书分类法》分类体系下文本自动分类研究的现状,从研究目的、类目体系、资源类型等方面,参考国外相关研究的成果和方法予以分析和评价;结合国外相关研究的最新成果,提出我国在《中国图书馆图书分类法》分类体系下应用文本自动分类技术时应注意的问题及今后的研究方向。  相似文献   

6.
《中文新闻信息分类》标准经过历时一年8个月的研制及反复检测论证,在2005年9月2日专家评审会上,标准审查委员会一致通过对《中文新闻信息分类》国家标准(送审稿)的审查,建议标准起草组尽快形成报批稿,上报国家标准化管理委员会作为推荐性国家标准发布实施。作为我国第一部即将上报的新闻信息分类标准,《中文新闻信息分类》标准的研制工作取得了初步的成果,但能否在业界真正实现应用,达到整合全球中文新闻信息的目的,最为关键的是下一步技术支撑的构建。因此,只有建立自动标引系统,实现自动分类,《中文新闻信息分类》标准的现实价值才能真正体现。本文提出了实现自动标引的整体构想,希望为《中文新闻信息分类》标准下一步的研究与实际应用有所贡献。  相似文献   

7.
基于《中图法》的中文文献自动分类   总被引:7,自引:2,他引:5  
本文通过对现有中文自动分词算法的分析,提出了适于中文文献自动分类的自动分词算法。该算法通过建立机读词表,以《中图法》作为分类标准,对中文文献实现了自动分类。通过对财政金融类文献的测试,其准确率可达79%。  相似文献   

8.
为了提高海量新闻信息分类的效率,本文探索研究基于Transformer(转换器)模型和《中文新闻信息分类与代码》标准的自动分类标引,包括自动归类、聚类、检索标志的智能抽取,以及人工标引和自动标引的互相结合。Transformer模型训练数据特征效率更高,适应能力更强。基于标准的自动分类表更灵活,更高效,自动标引具有广泛的应用前景。  相似文献   

9.
图书自动分类专家系统技术实现初探   总被引:3,自引:0,他引:3  
介绍把人工智能的专家系统引入到图书分类中来进行尝试的产物《图书自动分类专家系统》,以及该系统的技术实现。  相似文献   

10.
使用基于《中图法》知识库的中文信息自动标引和自动分类系统,对中文图书进行自动标引与自动分类的实验,以测试该系统对图书的适用性。实验通过对中文图书进行计算机自动标引与自动分类、人工打分测评、测试结果统计分析,得出中文图书的各标引源主题表达能力依次为:书名、内容提要、两级目次、参考文献、一级目次,在此基础上对标引源进行加权设计,权值设为5:3:2:2。实验证明该系统用于中文图书的自动标引与自动分类是可行的。表6。参考文献9。  相似文献   

11.
论文分析了目前各大图书馆对以“文化思潮”为主要内容的图书进行分类时所存在的问题以及《中图法》在这方面的不足,并总结了这类图书的分类方法。  相似文献   

12.
文章指出目前软件类图书分类存在的问题并分析其原因,并列举一些分类实例,解析《中图法》(第五版)软件类相关类目注释及其在正确标引软件类图书中的作用.  相似文献   

13.
多类多标签汉语文本自动分类的研究   总被引:9,自引:0,他引:9  
本文提出了一种高效的汉语文本分类方法 ,并在实验中收到了良好的效果。由于汉语文本的特殊性 ,在训练前对训练文本进行自动分词和降维预处理。许多文本往往可能归到多个类 ,分类算法采用改进的Boosting算法。实验表明 ,在多类多标签的汉语文本特征提取和文档分类中 ,该算法收敛快、准确性高、综合效果较好  相似文献   

14.
论述了《中图法》第四版TE类的修汀及使用要点,就该类的分类标引规则和方法以及应注意的问题进行阐述,并举例加以说明。  相似文献   

15.
徐美莲 《图书馆建设》2006,(4):61-62,93
本文列举了《中图法》(第4版)法律第二分类体系分类法中存在的一些问题,并提出了具体改进措施和建议。  相似文献   

16.
《中图法》类分外国文献诸问题   总被引:3,自引:0,他引:3  
《中图法》类分外国文献诸问题●张列军ABSTRACTProblemsofdiferentiatingideasandconcepts,prob-lemsofscientificnatureandproblemsofcontainablequality...  相似文献   

17.
李冰辉 《图书馆建设》2012,(1):43-46,49
随着项目管理应用的逐渐广泛,项目管理类图书层出不穷,这使项目管理类图书在分编整理时存在一些问题,如将项目管理类图书分入"F224.5费用效益分析(成本-效益分析)"、《中国分类主题词表》(第2版)与项目有关的主题词列词不恰当、《中国图书馆分类法》(第5版)新增类目"TU712.1项目管理"的同位类隶属关系混乱。针对上述问题,图书分类人员应了解项目管理类图书的所属类型,将其分入恰当的类目。  相似文献   

18.
文章概述蒙医药学及蒙医药文献状况,《中图法》对蒙医药学文献归类的局限所在;依据《中图法》和蒙医药学科分类体系形成的蒙医药学类目和详细类目,设置蒙医药学类目和详细类目的思路和方法;探讨蒙医药学类目设置的科学性、特殊性和发展性等。  相似文献   

19.
民国时期学界在探索图书分类过程中,普遍在杜威十进制分类法的基础上结合中文古籍的特点,或增补加入新的类目,或采用其体系进行全新的改变。在各大图书馆具体操作时所使用的分类法五花八门,大致可分为中西文文献分开处置和统一处置两种不同的方法。民国时期图书分类探索均以杜威法为蓝本,是学界得以广泛交流的基础。民国时期图书分类探索看似成果甚多,但实际上新旧书籍如何处置的问题没有得到圆满的解决。造成这种局面的原因从表面上看是因为学界中人各自为政的状况一直没有改变,导致制定出一部全国统一的分类法的目标也一直没有实现,但深层次的原因则是学界对图书分类的基础理论忽略的必然结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号