共查询到19条相似文献,搜索用时 671 毫秒
1.
期刊论文必须标有关键词,关键词属未经规范的自然语言,利用关键词索引对查全率和查准率产生影响。为了提高关键词索引质量,采用自然语言与人工语言结合的后控制词表来提高期刊论文关键词标引质量。 相似文献
2.
3.
4.
文章根据期刊论文自身的特点和应用需求,分析期刊论文元素标引的意义,设计期刊论文元素标引规范的制定流程,并深入分析和研究标引规范的内容结构、元素构成及互操作框架,在此基础上提出了期刊论文的核心元数据、文档结构、深度内容三个方面的标引元素,同时指出了下一阶段研究工作的主要方向。 相似文献
5.
[目的/意义] 从用户角度出发,研究基于用户自然标注的TF-IDF辅助标引算法。[方法/过程] 首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF-IDF算法构建用户标注词表、形成标引知识库,然后通过IK Analyzer分词软件对待标引的科技项目数据进行切词和停用词处理,进而使用TF-IDF算法和位置加权算法提取科技项目数据的特征词,最终实现对科技项目数据进行关键词和分类的同步标引。[结果/结论] 实验结果表明,机标关键词与人标关键词的相似比在60%以上的科技项目数据占总数的68.1%,机标分类号与人标分类号前三位一致的占总数的83.9%,结果表明基于用户自然标注数据并采用TF-IDF算法在关键词和分类标引方面是可行的。 相似文献
6.
经济期刊论文的分类标引 总被引:2,自引:0,他引:2
对经济期刊论文进行分类标引。其根据是《中国图书馆分类法》(第4版)。经济期刊论文分类标引要在充分认识其特殊性的基础之上。坚持充分标引、归类恰切、标引适度三个原则。标引工作应按分析主题、判断类别、标引类号三个步骤进行。在处理交替类目、类号组配和交叉学科等问题上。要坚持全部标引、多重式反映。提供尽可能多的检索途径.充分揭示文献蕴含的全部主题。 相似文献
7.
谈谈自建库关键词标引规则 总被引:2,自引:0,他引:2
关键词标引属于自由标引,参照国际标准和国家标准,制定本单位的关键词标引规则十分重要.论述了关键词标引中的主题分析、标引方式与标引深度、关键词的选取原则诸问题. 相似文献
8.
19 自由标引中标引副标题概念词的问题
1 本文用词说明
本文所用“自由标引”一词是指不依据词表的人工标引,属于自然语言标引的范畴。期刊论文的在版标引一般都是自由标引。自由词补充标引是受控标引与自由标引的结合,不包括在本文讨论的范围内。 相似文献
9.
学术论文的关键词标引 总被引:6,自引:0,他引:6
杨一琼 《大学图书情报学刊》2004,22(1):63-64
关键词有许多优点 ,标引关键词是学术期刊对论文作者的基本要求 ,但关键词的标引还存在不少问题。文章就关键词的特征、选取、标引步骤等内容进行了分析和探讨 ,以期对关键词有进一步的了解 ,希望关键词的标引能渐趋合理。 相似文献
10.
科技论文关键词标引方法的误导必须纠正 总被引:21,自引:4,他引:17
讨论期刊界对关键词标引方法的某些误导、关键词的概念和含义、关键词与叙词的不同之处.提出:为了适应学科和专业的发展,计算机和网络技术的应用,减轻标引人员的负担,论文关键词的标引应摒弃"叙词标引规则",采用自由标引方法. 相似文献
11.
12.
自动标引通用评价模型研究 总被引:1,自引:0,他引:1
目前大多文档都不具有关键词,但手工标引关键词费时费力且主观性较强,因此关键词自动标引是一项值得研究的技术,由此引发的标引结果有效评价问题也成为一个亟需解决的问题.然而,评估关键词自动标引的性能并非一件容易的事情.针对常规自动标引评价方法存在的评价结果不能完全反映真实的标引结果以及评价成本高的情况,本文提出一种通用的自动标引评价模型.该模型可以有效地利用外部资源,在有参照情况下与无参照情况下,分别对标引结果进行评价.实验结果表明,自动标引通用评价模型能增加标引评价的可靠性,并且降低标引评价的成本. 相似文献
13.
关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。 相似文献
14.
《图书情报工作》论文关键词及分类号的统计分析 总被引:2,自引:0,他引:2
运用文献计量学方法,统计2001-2003年《图书情报工作》论文关键词及分类号,并对其数量、内容、标引质量等进行研究分析。结果显示,该刊关键词和分类号的标引质量较高,但还有不足之处。希望广大论文作者和编辑人员共同努力,进一步提高科技论文的标引质量。 相似文献
15.
基于作者中文图书主题标引的工作实践,重点阐述了中文图书主题标引工作中的主题词的查找、在版编目数据的利用以及标引工具书的使用。同时,就标引人员如何提高中文图书主题标引质量谈了自己的看法。 相似文献
16.
组配标引是在词表中选择两个及两个以上有形式逻辑关系的词,按照特定规则组成的一组标引词串,用以满足文献多层次、多途径检索的需要。概念组配是文献标引的关键环节。根据参与组配的主题词之间的逻辑关系,概念组配可分为交叉组配、限定组配和联结组配3种基本类型。在实际组配标引工作中,编目员应避免因对新词表不熟悉造成检索词语构成混乱,避免因主题概念转换错误造成粗标、漏标和错标,避免因未遵循专指性标引规则造成切题不当,减少组配标引失误。 相似文献
17.
杨贺杨奕虹乔晓东李宁朱礼军 《现代图书情报技术》2010,26(6):17-24
讨论计算机辅助标引文献加工系统中自然语言词表系统的建立过程。基于海量文献人工标引,运用计量分析法对多年来积累的人工标引词从词频、词长、词类型、词共现等多方面进行分析,重点阐述运用字面相似度计算词间关系来建立适用于机标和后控词表的自然语言词表的过程。 相似文献
18.
19.
文书类档案的主题标引研究 总被引:4,自引:0,他引:4
本文介绍一种基于全文的主题词自动标引方法。该方法将切分关键词和标引主题词融为一体,合理地构造了词典。本文还给出一个确定标引主题词的加权函数,讨论了一些相关的技术问题 相似文献