首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
分类法主题法一体化自动标引系统的基本原理和方法   总被引:7,自引:0,他引:7  
本文阐述基于文献题名的自动标引系统的原理和方法,该系统是分类法主题法一体化的。文中说明了依据文献题名对文献进行分类和主题标引的可行性、从题名中自动轴词、以体系分类法为基础的自动分类用分类词表、自动分类规则及以分面分类法为基础的文献自动分类、自由体系自动分类、半自动抽词、检索系统的分类法主题法一体化检索功能保证检索系统质量的关键因素等问题。  相似文献   

2.
针对国内外著名数据库受控标引的标引方式、标引字段的现状和发展趋势进行深入分析,指出目前虽然受控标引以机器辅助标引为主,但自动标引也有成功案例。标引字段除标引文献主题内容外已扩至对文献中的图表、重要数值、化学分子式等进行标引,并采用与分类标引、非受控语言标引相结合的多维度标引模式。最后,基于目前国内外受控标引发展水平的差异,提出国内应从三个方面予以改进。  相似文献   

3.
为了解决中文学术期刊电子化过程中出现的自动分类问题,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间,并考虑到人工标引在分类中的关键作用,得到综合了特征词IF和IDF权重的分类准则。通过适当训练建立分类库,计算待分类样本与已知分类的相似性,判别各分类。实验表明,该分类算法可以获得85%以上的分类识别率。  相似文献   

4.
本文对比主题词自动标引分析了档案分类自动标引的主要难点问题 ,着重讨论了解决档案分类计算机自动标引程序设计中的档案分类词组动态拆分先组匹配、档案分类单元概念共性复分链接和隐性并列多主题概念自动分类标引这3项编程技术的基本设计思路。  相似文献   

5.
文章在对自动标引技术的原理、方法及划分、国内外研究发展现状和自动标引技术的优势简单介绍的基础上,提出了基于《中国分类主题词表》的文本自动标引系统的设计方案并对文本数据自动标引系统的流程及标引工作自动化处理过程进行了详细阐述.  相似文献   

6.
再探文献的自动标引   总被引:1,自引:0,他引:1  
从文献自动标引检索语言的选择,建立文献自动标引系统的基本路径及关键词的选词措施等三个方面,探讨了文献实施微机自动标引的基本方略。  相似文献   

7.
基于集成学习的自动标引方法研究   总被引:1,自引:0,他引:1  
目前大多数自动标引方法不能有效利用文本中包含的多个特征.而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取.同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量.为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引.实验结果表明基于集成学习方法的自动标引能提高标引结果的查准率和召回率.另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果.  相似文献   

8.
由《中图法》编委会和北京丹诚软件有限责任公司共同开发研制的《中图法》(第四版 )电子版 ,将于 2 0 0 1年 4月由北京图书馆出版社正式出版。它的出版标志着《中图法》已步入文献信息分类电子化时代。它既适用于传统文献的分类标引 ,快速查找类目 ,又适用于电子信息的有序组织 ,为实现机助标引和智能自动标引奠定了基础 ;它既适用于传统图书馆的文献资料的处理 ,又适应于虚拟图书馆、网络信息平台等信息分类组织的需要 ;它既适用于文献信息脱机标引 ,又适用于文献信息联机网络标引。《中图法》电子版主要包括两大部分 :类目检索部分和类目…  相似文献   

9.
潘涛 《浙江档案》2004,(10):21-21,30
要实现全国民国档案检索体系的标准化、规范化,首先必须著录标引统一、规范.民国档案分类标引自动转换系统研究就是要解决<民国档案分类表>版本的差异给各档案馆民国档案分类标引带来的不一致性问题.  相似文献   

10.
使用基于《中图法》知识库的中文信息自动标引和自动分类系统,对中文图书进行自动标引与自动分类的实验,以测试该系统对图书的适用性。实验通过对中文图书进行计算机自动标引与自动分类、人工打分测评、测试结果统计分析,得出中文图书的各标引源主题表达能力依次为:书名、内容提要、两级目次、参考文献、一级目次,在此基础上对标引源进行加权设计,权值设为5:3:2:2。实验证明该系统用于中文图书的自动标引与自动分类是可行的。表6。参考文献9。  相似文献   

11.
为了提高海量新闻信息分类的效率,本文探索研究基于Transformer(转换器)模型和《中文新闻信息分类与代码》标准的自动分类标引,包括自动归类、聚类、检索标志的智能抽取,以及人工标引和自动标引的互相结合。Transformer模型训练数据特征效率更高,适应能力更强。基于标准的自动分类表更灵活,更高效,自动标引具有广泛的应用前景。  相似文献   

12.
从地方文献统一分类标引角度,浅析了几种没有完全按照《中图法》分类标引地方文献的做法,分析了应用《中图法》第5版分类标引地方文献的方法和改进之处。  相似文献   

13.
中文农业科技文献自动标引系统SDIC/CASDAIS   总被引:1,自引:0,他引:1  
本文介绍了一个中文农业文献自动标引系统SDIC/CASDAIS,它集自动主题标引与自动分类标引于一体,采用主题词表、预匹配词表和停用词表相结合的词典法方案,匹配中采取正向增字跳字最长匹配的算法,末二字回溯,制订大量规则以降低错标。该系统可完成主题标引和分类标引,能处理农业文献中常见的缩略语和科技术语不规范现象,具备动态构词功能。SDIC/CASDAIS系统采用特征词析取方法处理不包含在词表中的品种、物质名称和地名等关键词,其自由词判定规则还可以判别标题的部分自由词,通过词频统计可作为更新词表的依据。SDIC/CASDAIS系统的标引速度为3000条标题/小时,平均标引深度略大于4,主题标引精度98%,分类标引基本吻合率80%。  相似文献   

14.
近年来,英语在高校教学中显现出越来越重要的地位,与此同时,高校图书馆专业英语类文献的馆藏也随之增多,可是,由于此类文献的分类标引和主题标引没有统一标准,导致了标引的混乱.本文把专业英语文献大致分为读物类、教材类、词典类三种,然后,对三类专业英语文献的分类标引和主题标引做逐一的阐述和分析.  相似文献   

15.
自动标引研究的回顾与展望*   总被引:3,自引:0,他引:3  
对自动标引的研究进行总结与回顾。对标引对象进行界定;分析自动标引研究的3个阶段,并列出50年研究历程中的代表性方法;详细描述自动标引研究路线图、并对抽词标引与赋词标引方法进行详细分类;最后指出自动标引中存在的问题,并对今后的自动标引研究和应用方向进行展望。  相似文献   

16.
国家图书馆中文图书自由词标引规则   总被引:1,自引:1,他引:0  
自由词标引是对以<中国分类主题词表>为依据的主题标引的补充.一篇文献必须先用正式主题词作较泛指的组配标引、上位词标引、靠词标引,再用自由词作较专指的标引,即作双重标引.  相似文献   

17.
自动标引“匹配标引法”原理袁庆华现已开发出来的自动标引系统,大都是应用“抽词标引法”原理,从文献题名中抽出部件词,按词性组配成主题词完成文献主题标引的。由总后档案馆和后勤科研所应用“匹配标引法”原理研制的《档案主题自动标引系统》,避开了词性分析和部件...  相似文献   

18.
网络环境信息标引的测评与比较研究   总被引:1,自引:1,他引:0  
网络环境下,文献信息具有数量多、增长快、新词层出不穷等特点。标引是对信息资源进行组织的有效手段和重要环节,标引的质量和效率直接影响信息组织的质量和速度。对受控标引、自由标引和自动标引三种标引方式进行了相符度、专指度、标引深度及通用词数的测试对比.得出自由标引优于受控标引,自动标引优于自由标引及受控标引的结论。  相似文献   

19.
文献题名自动抽词--分类标引系统   总被引:7,自引:2,他引:5  
本文对“文献题名自动抽词-分类标引系统”作了概述,并给出了全部程序。这是一种比较简易实用的自然语言检索法。  相似文献   

20.
充分发挥机读目录分类标引的特殊功能   总被引:6,自引:0,他引:6  
通过对文献的手编分类标引与机编分类标引比较分析,论述了机编标引优于手编标引的特殊功能。并从多重列类等方面提出了如何利用机编功能对文献实行深度标引、多维检索的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号