首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
动态构词标引研究   总被引:1,自引:0,他引:1  
在以词典匹配为基础的中文自动赋词标引中,存在如何实现专有名词的增词标引问题。本文结合笔者对档案文献自动标引的研制实践,提出了针对性的解决方法———动态构词标引。文章重点讨论了构词标引的类型与实现,并给出了相应的算法与规则  相似文献   

2.
研究构建了具有位置信息控制的特义禁用词语义环境,进而运用于中文文献元数据CXMARC文本的自动标引和主题信息的数据挖掘,其中研究设计的预处理特义中文禁用字词切分算法SWF,能有效地减少领域的分词歧义性和缩短标引时间,从而改进了传统最大匹配MM算法的自动标引质量和效率。  相似文献   

3.
<正> 存贮和检索载体如果使用计算机检索,其中有一部分使用控制词标引,那么至少还有一部分索引词完全可能从文献中抽取。假如这一点完全可能,则用作抽词的标引材料源也完全可能全部成为机器存贮记录。如果记录容量很大,例如全文记录,那么还可以视需要至少在某些索引词记录中附加出现频率或其他信息,以便增加检索的灵活性。抽词索引的客观选择方法(词典或禁用词表)完全可能应用于机器存贮形式,而人工选  相似文献   

4.
本文介绍了主题词应用的概念要领、基本常识,明确了主题词标引的性质、特钲、方法和步骤,指出了正确使用主题词,标引规范词,对实现军用公文以及各类文献信息资源共享的作用。  相似文献   

5.
全文数据库建库原理与应用技术   总被引:23,自引:2,他引:21  
王兰成  蒋丹  刘庆辉 《情报学报》1999,18(4):321-328
全文数据库是处理文献信息中知识与数据的有力工具,近年来得到迅猛发展。本文首先详细分析了全文数据库的特点,提出了建立全文数据库的各种数据结构,系统介绍全文数据库的开发步骤。然后论述全文数据库的标引和检索技术,提出一些新的处理技术。最后就全文数据库实际应用中的一些问题,提供了解决方案。  相似文献   

6.
本文提出了用机器辅助受控联机标引的方案,采用了由受控词与部分关键词构成的混合型系统词库的动态生成技术。在汉字分词技术与智能型全自动标引尚未成熟的情况下,实为一种提高标引工作效率、加快自建库速度的实用的好方法。  相似文献   

7.
中文文本关键词自动抽取方法研究   总被引:6,自引:1,他引:5  
随着信息技术的发展,中文电子文本信息资源正以惊人的速度急剧增长.文本自动处理技术,通过自动组织海量文献信息资源,能够为用户提供简易有效的信息检索服务.关键词自动抽取是文本自动处理的基础和核心.汉语的特殊性加剧了中文文本关键词自动抽取的难度.本文提出了一种基于N-gram权重计算和关键词筛选算法的中文文本关键词自动抽取方法.该方法不依赖特定的数据集和中文分词技术,可以有效地抽取出任意单篇文本的关键词,而且通过参数调整,应用系统可以灵活地控制标引深度和标引专指度.实验表明,该方法简单、快速、断词错误率低,标引性能明显优于基于中文分词和TF/IDF的方法,可以满足大规模文本的在线处理要求.  相似文献   

8.
中文期刊文献通用词标引分析   总被引:1,自引:0,他引:1  
通用因素是文献主题的构成因素之一,对主体因素起细分作用。通用词是指那些在专业领域没有独立检索意义的泛指词。在中文期刊文献标引的过程中,通用词的使用对其标引结果产生着重要的影响。文章讨论了通用词标引的一般规则,并以《中国期刊网》中的文献为例,进行抽样统计和实例分析,归纳了通用词标引的错误现象及其原因,并对期刊文献的通用词标引提出了几点改进意见。  相似文献   

9.
现有的主题标引方法一般只能抽取文本中出现的词汇,无法从几万或数十万主题词中选择语义关联强且未出现的词汇;基于机器学习的多标签分类算法则需要每一个标签下有训练数据,限制了它们在主题标引上的应用。面向大规模主题词在海量文献上的标引需求,提出一个基于分布式词向量的混合型自动标引方法,利用大规模语料训练的词向量生成同维度的主题词表示向量和文本表示向量,实现主题词与文本语义相似度的计算。基于大规模语料构建主题词与普通词的映射表,使文本向量只和少量的语义强相关主题词向量比较,大大减少了计算量,提高了标引效率。开发的自动标引工具对近亿篇文献进行了主题标引,达到了较高的速度。与结巴关键词的实验对比结果显示,本文方法抽取的主题词与作者关键词重合度较低,且在去除结巴关键词中的非主题词后,取得了比结巴关键词更高的标引准确率;与人工标引的实验对比结果显示,随着人工标引词数量的增加,本文方法的效果、结果与人工标引结果的一致性在不断增加。  相似文献   

10.
关键词自动标引是一种识别有意义且具有代表性片段或词汇的自动化技术。关键词自动标引可以为自动摘要、自动分类、自动聚类、机器翻译等应用提供辅助作用。本文利用基于知网的词语语义相关度算法对词汇链的构建算法进行了改进,并结合词频和词的位置等统计信息,进行关键词的自动标引。实验证明,该方法可以有效的进行关键词的自动标引。  相似文献   

11.
FRBR采用实体一关系分析方法建立的概念模型描绘了文献信息资源及其书目控制过程的宏观图像,具有简单、综观、实用的优点。为了完整地揭示文献信息资源实体一关系图中被掩盖的其他有意义的属性和关系,提供便于计算机处理的领域本体,有必要将FRBR的E—R模型改造成面向对象模型。论文介绍了面向对象的CIDOCCRM模型以及FRBR与CRM的对映关系。  相似文献   

12.
���绷���µĶ��������ҵ�����   总被引:3,自引:2,他引:1  
以中国科学院院网环境下的书目文献信息系统的为模型,简要地讨论了网络环境下多馆联合作业与服务系统的环境需求、作业重大及其功能特色,并且介绍了中国科学院中关村地区书目文献信息系统的网络平台、计算机系统平台和数据平台。  相似文献   

13.
简单介绍了书目情报理论争文献信息理论的历史渊源和发展历程,多视角分析了书目情报理论和文献信息理论的价值与反价值,最后提出了书目情报理论和文献信息理论未来发展的几点构思.  相似文献   

14.
本文介绍了书目情报理论和文献信息理论的历史渊源和发展历程,多视角分析了书目情报理论和文献信息理论的价值与反价值,提出了书目情报理论和文献信息理论未来发展的几点构思。  相似文献   

15.
基于帕累托原则的高校图书馆文献信息资源配置   总被引:1,自引:0,他引:1  
黄艳芬 《图书馆论坛》2007,27(2):114-116
阐述了帕累托原则的含义,总结了高校图书馆文献信息资源配置的现状,提出了基于帕累托原则的高校图书馆藏书建设原则、文献信息资源共建共享、文献信息资源配置的经济观念等方面的建议。  相似文献   

16.
New technology has acted and will act more still on scienctific and technical documentary in-formation in the fields of documentary information carriers,communication modes,means towork,basic function,etc.Neither should we be frightened nor feel depressed.First priorityshould be given to the clear understanding of the current situation and making every effort to doour work well.  相似文献   

17.
潘玉田 《图书情报工作》1997,41(3):28-29,54
从方法论角度论述了对文献信息的科学认识,分析了文献信息科学概念的产生、形成及其学科建设的积极意义。  相似文献   

18.
The objects of studies in information sourse,information users and the use of information arequite different.The paper studies the connotation and the theoretical basis of the substitutivephenomenon of documentary information.Also it protrays theories and methods for the substitu-tive use of documentary information.  相似文献   

19.
在探讨文献信息含义和本质的基础上,对文献信息与文献、信息、知识、情报的关系进行了初步分析,提出了新的看法。  相似文献   

20.
书目情报系统适应社会发展的未来展望   总被引:1,自引:0,他引:1  
书目情报系统适应社会发展的未来展望柯平Abstract:Thebibliographicalinformationsystemkeepsonchangingwithsocialdevelopmentsinwhichitwillplayamoreand...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号