首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 718 毫秒
1.
自动标引研究的回顾与展望*   总被引:3,自引:0,他引:3  
对自动标引的研究进行总结与回顾。对标引对象进行界定;分析自动标引研究的3个阶段,并列出50年研究历程中的代表性方法;详细描述自动标引研究路线图、并对抽词标引与赋词标引方法进行详细分类;最后指出自动标引中存在的问题,并对今后的自动标引研究和应用方向进行展望。  相似文献   

2.
文章介绍了利用汉语科技词系统的词表及词间关系对中文专利文献进行主题标引的研究进展,根据专利文献的特点设计了相应的标引策略和流程,并进行实验及结果分析,证明了本标引方案的有效性,最后对标引结果在专利检索中的应用特色进行了介绍。  相似文献   

3.
本文介绍了用.数据库管理系统FOXBASE编写的自动标引系统,其中主要介绍的基本思想、实现过程及其特点。文中着重介绍了词标引、主题标引、赋词标引和抽调标引的方法,和在Compaq386机上建立的试验系统。  相似文献   

4.
动态构词标引研究   总被引:1,自引:0,他引:1  
在以词典匹配为基础的中文自动赋词标引中,存在如何实现专有名词的增词标引问题。本文结合笔者对档案文献自动标引的研制实践,提出了针对性的解决方法———动态构词标引。文章重点讨论了构词标引的类型与实现,并给出了相应的算法与规则  相似文献   

5.
文献题名自动抽词--分类标引系统   总被引:7,自引:2,他引:5  
本文对“文献题名自动抽词-分类标引系统”作了概述,并给出了全部程序。这是一种比较简易实用的自然语言检索法。  相似文献   

6.
中文期刊文献通用词标引分析   总被引:1,自引:0,他引:1  
通用因素是文献主题的构成因素之一,对主体因素起细分作用。通用词是指那些在专业领域没有独立检索意义的泛指词。在中文期刊文献标引的过程中,通用词的使用对其标引结果产生着重要的影响。文章讨论了通用词标引的一般规则,并以《中国期刊网》中的文献为例,进行抽样统计和实例分析,归纳了通用词标引的错误现象及其原因,并对期刊文献的通用词标引提出了几点改进意见。  相似文献   

7.
查贵庭  侯汉清 《情报学报》2002,21(3):273-277
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。  相似文献   

8.
基于EMM中文抽词算法的XMARC主题信息挖掘   总被引:4,自引:0,他引:4  
王兰成 《情报学报》2005,24(1):82-86
本文在分词词典上采用区间最大词长,改进正向减字最大匹配法为“词首 长词匹配 短词推进”自动标引方法,从而有效地减少领域的分词歧义性和缩短标引时间。最后将该研究付诸于XMARC主题信息的挖掘与检索的实现,并证明其在时间和质量综合性能上的优越性。  相似文献   

9.
针对中文自动标引过程中经常会产生诸多歧义词,导致检出的信息不切题或漏检这一问题,在论述自动标引中歧义词消除方法的相关研究基础上,提出一种将穷举法和消歧规则相结合的歧义词消除方法。测试结果表明,这是一种行之有效的消除歧义词的方法。  相似文献   

10.
文章在对自动标引技术的原理、方法及划分、国内外研究发展现状和自动标引技术的优势简单介绍的基础上,提出了基于《中国分类主题词表》的文本自动标引系统的设计方案并对文本数据自动标引系统的流程及标引工作自动化处理过程进行了详细阐述.  相似文献   

11.
为缓解海量文献关键词标引的巨大压力,文章构建了用于海量文献关键词标引的计算机辅助加工系统,对标引数据预处理规范、自动标引核心工作区和人工标引校对平台进行了具体阐述。文章采用数据测试方法确定了自动标引软件,在单一软件不能满足标引要求后探索了多种机标结果后处理方式提升机标质量,最终由人工标引校对平台保证海量文献关键词标引质量的同时,将机标出现的问题和改进意见反馈给软件设计和词表维护,保证了计算机辅助加工系统的持续改进。  相似文献   

12.
网络环境信息标引的测评与比较研究   总被引:1,自引:1,他引:0  
网络环境下,文献信息具有数量多、增长快、新词层出不穷等特点。标引是对信息资源进行组织的有效手段和重要环节,标引的质量和效率直接影响信息组织的质量和速度。对受控标引、自由标引和自动标引三种标引方式进行了相符度、专指度、标引深度及通用词数的测试对比.得出自由标引优于受控标引,自动标引优于自由标引及受控标引的结论。  相似文献   

13.
自动标引通用评价模型研究   总被引:1,自引:0,他引:1  
目前大多文档都不具有关键词,但手工标引关键词费时费力且主观性较强,因此关键词自动标引是一项值得研究的技术,由此引发的标引结果有效评价问题也成为一个亟需解决的问题.然而,评估关键词自动标引的性能并非一件容易的事情.针对常规自动标引评价方法存在的评价结果不能完全反映真实的标引结果以及评价成本高的情况,本文提出一种通用的自动标引评价模型.该模型可以有效地利用外部资源,在有参照情况下与无参照情况下,分别对标引结果进行评价.实验结果表明,自动标引通用评价模型能增加标引评价的可靠性,并且降低标引评价的成本.  相似文献   

14.
论自动标引的实际应用   总被引:2,自引:0,他引:2  
探讨电子环境下自动标引的特点、标引观念的转变以及影响自动标引的因素等问题。  相似文献   

15.
使用基于《中图法》知识库的中文信息自动标引和自动分类系统,对中文图书进行自动标引与自动分类的实验,以测试该系统对图书的适用性。实验通过对中文图书进行计算机自动标引与自动分类、人工打分测评、测试结果统计分析,得出中文图书的各标引源主题表达能力依次为:书名、内容提要、两级目次、参考文献、一级目次,在此基础上对标引源进行加权设计,权值设为5:3:2:2。实验证明该系统用于中文图书的自动标引与自动分类是可行的。表6。参考文献9。  相似文献   

16.
标引人员的智慧与文献标引的质量密切相关。提高标引人员的素养很重要。标引人员需要在标引实践中磨练。自动标引研究已有半个世纪,其标引质量至今未能超过人工标引而取代人工标引,究其原因在于计算机不具备优秀标引人员的智慧,不适应近乎艺术创造的标引作业。可以揣测,没有标引人员介入的、高度自动化的文献标引处理的实现,至少还要等待一个相当长的时间。人工标引研究的成果将有助于自动标引研究中一些难题的解决。不可轻视人工标引的研究。  相似文献   

17.
讨论计算机辅助标引文献加工系统中自然语言词表系统的建立过程。基于海量文献人工标引,运用计量分析法对多年来积累的人工标引词从词频、词长、词类型、词共现等多方面进行分析,重点阐述运用字面相似度计算词间关系来建立适用于机标和后控词表的自然语言词表的过程。  相似文献   

18.
统计分析法自动标引的改进研究   总被引:2,自引:0,他引:2  
统计分析法自动标引是自动标引的一种重要方法。本文从标引词应反映文献主题内容这一原则出发,对统计分析法自动标引从标引源的确定、权值的设计、词频的调整及检索后控词表的设计与维护等方面提出了一些改进设想。通过这些方法使标引词更好地反映文献主题的同时提高检索效率。  相似文献   

19.
针对海量英文文献信息自动化处理问题,构建了一个基于英文超级科技词表的文献主题概念自动标引系统,采用词典与规则方法相结合的术语提取机制,实现了英文文献术语提取、规范概念映射以及优选概念标引等功能,取得了较好的标引效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号