首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 234 毫秒
1.
讨论计算机辅助标引文献加工系统中自然语言词表系统的建立过程。基于海量文献人工标引,运用计量分析法对多年来积累的人工标引词从词频、词长、词类型、词共现等多方面进行分析,重点阐述运用字面相似度计算词间关系来建立适用于机标和后控词表的自然语言词表的过程。  相似文献   

2.
关于中医临床文献自动主题标引系统的研究   总被引:2,自引:0,他引:2  
中医临床文献自动主题标引系统针对中医药文献的特点,结合手工标引和自动标引的长处,在自动标引的基础上,再由人工利用计算机辅助对机器自动标引的结果进行干预,从而在真正意义上将计算机的快速、准确和人脑的智慧结合起来,大大缩短了建设数据库的中间过程,提高了文献标引的质量和效率。  相似文献   

3.
文献信息计算机全文全自动标引方法   总被引:3,自引:0,他引:3  
为了满足越来越细化的文献信息服务的要求 ,必然会最终实现全文全自动标引和主题词检索加关键词全文检索的文献信息处理方法。文章在已研制成功的“计算机辅助标引系统”的基础上 ,提出了全文全自动标引的切词方法、匹配算法、加权校对算法 ,以及为配合切词和算法的要求应该设立的一系列数据库 ,并论述了它们的含义、功能和建库方法 ,提出了一种全新的文献信息全文全自动标引的实施方法。  相似文献   

4.
介绍了文献自动标引的几种方法,重点阐述了机辅标引法和电子科技情报研究所开发的电子科技文献机辅标引系统的构成原理与特点。  相似文献   

5.
[目的/意义] 从用户角度出发,研究基于用户自然标注的TF-IDF辅助标引算法。[方法/过程] 首先以核心期刊论文中作者标注的关键词和分类号为源数据,通过对关键词词频进行统计,使用TF-IDF算法构建用户标注词表、形成标引知识库,然后通过IK Analyzer分词软件对待标引的科技项目数据进行切词和停用词处理,进而使用TF-IDF算法和位置加权算法提取科技项目数据的特征词,最终实现对科技项目数据进行关键词和分类的同步标引。[结果/结论] 实验结果表明,机标关键词与人标关键词的相似比在60%以上的科技项目数据占总数的68.1%,机标分类号与人标分类号前三位一致的占总数的83.9%,结果表明基于用户自然标注数据并采用TF-IDF算法在关键词和分类标引方面是可行的。  相似文献   

6.
再探文献的自动标引   总被引:1,自引:0,他引:1  
从文献自动标引检索语言的选择,建立文献自动标引系统的基本路径及关键词的选词措施等三个方面,探讨了文献实施微机自动标引的基本方略。  相似文献   

7.
本文报道了一个基于微机Windows 环境的微机辅助文献标引系统, 用以解决文献前处理速度慢与文献数据库时间要求强之间的时差矛盾。介绍了系统的界面设计与设计思想, 辅助标引的机读叙词表和词典, 以及相关的文件组织和数据结构等。研究了系统界面与标引员之间的关系, 以求设计出最佳的人机界面促进文献标引的速度和质量。讨论了辅助标引用机读叙词表的各个学科词库合并与词表参照系统的应用等问题。  相似文献   

8.
标引人员的智慧与文献标引的质量密切相关。提高标引人员的素养很重要。标引人员需要在标引实践中磨练。自动标引研究已有半个世纪,其标引质量至今未能超过人工标引而取代人工标引,究其原因在于计算机不具备优秀标引人员的智慧,不适应近乎艺术创造的标引作业。可以揣测,没有标引人员介入的、高度自动化的文献标引处理的实现,至少还要等待一个相当长的时间。人工标引研究的成果将有助于自动标引研究中一些难题的解决。不可轻视人工标引的研究。  相似文献   

9.
关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。  相似文献   

10.
关键词标引的若干问题探讨   总被引:15,自引:1,他引:14  
丁春 《编辑学报》2004,16(2):105-106
分析关键词标引中存在的若干问题,探讨关键词与文献主题、标题词、专业术语、主题词、自由词的关系,提出提高关键词标引质量的对策.  相似文献   

11.
自动标引通用评价模型研究   总被引:1,自引:0,他引:1  
目前大多文档都不具有关键词,但手工标引关键词费时费力且主观性较强,因此关键词自动标引是一项值得研究的技术,由此引发的标引结果有效评价问题也成为一个亟需解决的问题.然而,评估关键词自动标引的性能并非一件容易的事情.针对常规自动标引评价方法存在的评价结果不能完全反映真实的标引结果以及评价成本高的情况,本文提出一种通用的自动标引评价模型.该模型可以有效地利用外部资源,在有参照情况下与无参照情况下,分别对标引结果进行评价.实验结果表明,自动标引通用评价模型能增加标引评价的可靠性,并且降低标引评价的成本.  相似文献   

12.
近五年来自动标引研究在关键词抽取、标引系统设计、自动分类标引、网络信息自动标引、数字图像标引、音频信息标引、视频信息标引、自动标引结果评价等方面取得很大进展,但尚存弱点与不足之处,还不能达到人工标引的效果。今后的研究将朝着探索更优越的语言分析技术、更高端的多媒体信息自动标引方法、高效的知识库智能自学习机制、多种标引方法或模型的互补的集成学习等方向发展。  相似文献   

13.
研究构建了具有位置信息控制的特义禁用词语义环境,进而运用于中文文献元数据CXMARC文本的自动标引和主题信息的数据挖掘,其中研究设计的预处理特义中文禁用字词切分算法SWF,能有效地减少领域的分词歧义性和缩短标引时间,从而改进了传统最大匹配MM算法的自动标引质量和效率。  相似文献   

14.
生物学文献自动标引系统的理论和实践   总被引:4,自引:0,他引:4  
韩客松  王永成  王刚 《情报学报》2000,19(3):259-264
在统计分析生物学中文文献的一些特点和手工标引的经验的基础上 ,本文介绍了以文献标题和摘要为标引源的自动标引方法。文章着重介绍了折半匹配的抽词和基于非线性加权体系的标引词抽取的理论和实践。  相似文献   

15.
用于中文信息自动分类的《中图法》知识库的构建   总被引:4,自引:0,他引:4  
中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干,组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。构建《中图法》知识库面临着一些难题:异构数据的整合;原始数据中分类号与主题词或词串之间一对多、多对多关系的筛选;标引词串与知识库中的词串的相符性比较等。图2。参考文献8。  相似文献   

16.
基于作者中文图书主题标引的工作实践,重点阐述了中文图书主题标引工作中的主题词的查找、在版编目数据的利用以及标引工具书的使用。同时,就标引人员如何提高中文图书主题标引质量谈了自己的看法。  相似文献   

17.
针对海量英文文献信息自动化处理问题,构建了一个基于英文超级科技词表的文献主题概念自动标引系统,采用词典与规则方法相结合的术语提取机制,实现了英文文献术语提取、规范概念映射以及优选概念标引等功能,取得了较好的标引效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号