首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
目前,越来越多的辩技期刊对论文标引主题词或关键词,主题词取自于词表,是经过规范化处理的词,表达同一主题的词在任何情况下都具有完全一致的字面形式。关键词是自然语言,直接从文章中抽取,同一主题慨念的词可呈现多种字面形式。显然,只有主题词才具有真正的检索意义。国家有关部门规定关键词应尽量从主题词表中选用。因此,论文标引应以主题词为基准。  相似文献   

2.
现有的主题标引方法一般只能抽取文本中出现的词汇,无法从几万或数十万主题词中选择语义关联强且未出现的词汇;基于机器学习的多标签分类算法则需要每一个标签下有训练数据,限制了它们在主题标引上的应用。面向大规模主题词在海量文献上的标引需求,提出一个基于分布式词向量的混合型自动标引方法,利用大规模语料训练的词向量生成同维度的主题词表示向量和文本表示向量,实现主题词与文本语义相似度的计算。基于大规模语料构建主题词与普通词的映射表,使文本向量只和少量的语义强相关主题词向量比较,大大减少了计算量,提高了标引效率。开发的自动标引工具对近亿篇文献进行了主题标引,达到了较高的速度。与结巴关键词的实验对比结果显示,本文方法抽取的主题词与作者关键词重合度较低,且在去除结巴关键词中的非主题词后,取得了比结巴关键词更高的标引准确率;与人工标引的实验对比结果显示,随着人工标引词数量的增加,本文方法的效果、结果与人工标引结果的一致性在不断增加。  相似文献   

3.
通过对CALLS联合目录“中文书目分类—主题整理项目”中的U大类交通运输类的整理,发现CALIS数据库中存在着主题词标引次序混乱、同一主题的标引不一致、总论复分添加不统一、文献类型主题词局限及标引不可重复、增词原则不严谨和名称主题规范不标准,分类主题标引没有一体化等问题,要一一得以妥善解决,必须严格按照分类主题标引的细则、组配标引模式来进行标引,并建立主题规范记录库,以提高书目数据库的标引质量。  相似文献   

4.
主题标引的原理和方法(一)张琪玉(空军政治学院)必须说明,主题标引可分为标题词标引、叙词标引、单元词标引、关键词标引、自由标引等多种,本文仅限于叙词标引。叙词通常称为主题词,故也可称为主题词标引。所谓主题标引,是指用语词标识(即标题词、叙词、单元词、...  相似文献   

5.
随着计算机硬件设备的改进和软件技术的提高,采用关键词法设计和建立的计算机档案主题检索系统也越来越多。为了提高档案关键词检索系统的整体效能,标引时,无论是人工标引还是机器自动标引,是抽词标引还是赋词标引,检索时,无论是题名关键词检索,还是全文检索,是截...  相似文献   

6.
关键词标引中常见问题与分析   总被引:3,自引:0,他引:3  
关键词标引是一个专业性很强的技巧性工作,如果标引不科学、不规范,就不利于检索系统采用,等于没有标引。当前,我国科技期刊论文关键词标引存在的问题主要有:1主题概念转换不恰当关键词是由叙词(正式主题词)和自由词组成的,但在标引过程中应尽量将主题分析时提炼...  相似文献   

7.
关键词标引的若干问题探讨   总被引:15,自引:1,他引:14  
丁春 《编辑学报》2004,16(2):105-106
分析关键词标引中存在的若干问题,探讨关键词与文献主题、标题词、专业术语、主题词、自由词的关系,提出提高关键词标引质量的对策.  相似文献   

8.
档案主题标引具有规范性强、组配性好、专指性准等优点,同时对标引质量也要求较高。只有标引的每个主题词都是正式主题词,都是和主题概念相对应的、并能准确反映档案主题概念的主题词,才能最大限度地实现档案检索时的查全率和查准率。然而,在具体实践中,往往容易产生误差,影响标引质量。 一、标引度掌握不准 国家行业标准《档案主题标引规则》中将档案主题标引深度规定为“赋予一个标引对象主题词数量的多少。”在实际工作中,由于各人理解和判断的角度不同,对同一份档案标引的主题词数量有多有少,我们通常称之为标引过深和标引过浅。 1、标…  相似文献   

9.
用主题词和关键词双重标引文献主题初探   总被引:4,自引:0,他引:4  
提出通过用主题词和关键词双重标引文献主题,并建立关键词与主题词间参照关系的设想,使数据库中文献按主题词规范管理,用户以自然语言检索  相似文献   

10.
尽管自然语言的关键词标引和规范语言的主题词标引都被用于揭示和查询同一主题的档案,但它们实现的方式却不相同。所以没有严格的限制条件而随意判定哪一个更好,是不现实的。谁个优,谁个劣完全取决于系统需求的平衡。对这个“平衡”议论较多的一种说法是“背着抱着一样沉”。持这种观点的人认为:自然语言关键词是标引速度快、输入端工作量小,成本低,但检……  相似文献   

11.
基于知识库的网页自动标引和自动分类系统的设计   总被引:15,自引:0,他引:15  
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。  相似文献   

12.
档案主题词标引之我见   总被引:1,自引:0,他引:1  
主题词是在标引和检索中用以表达档案主题内容的规范化的词或词组。自上世纪80年代中期开始档案著录标引工作以来,主题词标引始终是各档案馆档案著录标引工作的瓶颈(因为当时大量的著录标引工作还集中在进馆档案上)。随着公文格式的规范化,主题词在公文形成阶段就已经标引完毕,减轻了档案馆的工作压  相似文献   

13.
主题标引的原理和方法(二)张琪玉(空军政治学院)2.4标引选词规则(l)标引用词必须是词表中的正式主题词,并且书写形式应与词表中的书面形式完全一致。不得用非正式主题词标引;(2)标引选词应遵守下列优彻页序:①最切合文献主题的专指词;②可组配表达的词;...  相似文献   

14.
由国家档案局批准发布于1999年12月1日起实施的中华人民共和国行业标准《档案著录规则》规定,档案主题标引可用主题词,也可以用关键词。关键词并非规范词,档案著录时,可用关键词标引其主题,《档案著录规则》还是档案著录标准吗?还能建立全国统一的档案检索体系吗?这些问题是必须搞清楚的。[第一段]  相似文献   

15.
自动标引“匹配标引法”原理袁庆华现已开发出来的自动标引系统,大都是应用“抽词标引法”原理,从文献题名中抽出部件词,按词性组配成主题词完成文献主题标引的。由总后档案馆和后勤科研所应用“匹配标引法”原理研制的《档案主题自动标引系统》,避开了词性分析和部件...  相似文献   

16.
姚杰 《图书馆学刊》1996,18(2):36-39
文献主题标引中的主题分析姚杰(辽宁省图书馆)一、文献内容分析与主题的提取主题标5;是赋予文献检索标识——主题词的过程。主题词是揭示和描述文献主题内容的词或词组。正确的标引应是给予的主题词必须符合文献的实际内容,而且这些内容对于某项决策或检索课题具有一...  相似文献   

17.
主题词表的动态管理   总被引:2,自引:0,他引:2  
一、主题词的活动性 主题法检索是档案检索的主要方法之一。由于计算机的引入,主题检索便成为档案部门较为快捷、方便的检索手段,在档案利用工作中发挥着越来越重要的作用。 主题检索的数学基础是集合运算。视每份文件所标引的全部主题词为词的集合Ⅰ,其中每一主题词都是Ⅰ的一个元素,检索提问也是词的集合,记为R。  相似文献   

18.
一、标引的定义目前,国内外图书情报界对“标引”一词还没有一个一致公认的科学定义。但都认为标引是指文献处理工作中的一个过程,即:标引是指对文献资料进行分析、找出主题并参照主题词表或分类表等标引工具,选出代表该主题的主题词或分类号的过程。笔者认为.这一过程应包括下列五个步骤及内容:  相似文献   

19.
马莉  王宾 《青年记者》2006,(14):64-65
所谓主题标引,就是将献主题的自然语言形态,转换成主题语言形态的一种标引:即转换成叙词,或标题词、单元词、关键词形态的一种标引。因此,主题标引是一种直接对献主题采用某种词语标识的标引。  相似文献   

20.
文献关键词是指从文献中提炼出来的能表达文献主题内容的词或词组。它既能反映文献的重要信息,又起着检索作用,是文献的主题精华。但目前一些作者对关键词标引的认识和在标引准确性方面存在一些问题,文献中无关键词或所提关键词既不规范,也不符合要求,不能反映文献的主题思想。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号