共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
3.
谈谈文献主题标引中常见的问题及其对策 总被引:1,自引:0,他引:1
文章首先分析了图书馆在文献主题标引工作中存在的问题.认为滥用CIP数据标引,不规范选取自由词进行标引,以自取词进行标引,不使用文内关键词标引,以及错误的主题分析等标引现象是标引工作出现误差的主要原因.文章随后给出了解决这些问题的办法. 相似文献
4.
5.
6.
句法分析标引方法研究 总被引:5,自引:1,他引:4
1句法分析标引法原理 句法分析标引是指通过分析句子中每个词的语法作用和词之间的语法关系来选择具有标引意义的词或短语.句法分析标引法一般要借助于一定的解析规则或语法词典,需要较多的人工干预.一般来讲,句法分析包括浅层句法分析和深层句法分析两种.浅层句法分析只限于把句子解析成较小的单元,而不揭示这些单元之间的句法关系;深层句法分析则着眼于充分分析整个句子的语法特点,从而最大限度地揭示句子所反映的主题内容.下面3种标引方法都以深层句法分析为基础. 相似文献
7.
8.
针对目前科技论文中关键词标引存在的通用词过多、词性不当、主题词漏选、关键词排列顺序不当、标引深度不合适等一系列问题,提出了关键词正确标引的方法. 相似文献
9.
学术论文关键词的概念及标引方法辨析 总被引:2,自引:0,他引:2
回顾了学术论文关键词标引的研究成果,指出了存在的问题:关键词概念模糊,标引方法不一致。依据我国相关标准,对学术论文关键词的概念及其标引方法进行了辨析,认为,关键词既不完全是人工语言,也不完全是自然语言,它是从报告、论文中抽取,并经过规范化处理,能反映全文主题内容的单词或术语,学术论文关键词标引步骤应为:文献审读、文献主题分析并抽词、规范化处理、标引结果审校等。并探讨了关键词与标题词、自由词及主题词的关系,以及关键词标引与主题词标引的区别,以加深对关键词概念及其标引方法的理解。 相似文献
10.
中文期刊文献关键词标引的分析和改进 总被引:8,自引:0,他引:8
期刊文献关键词标引,对于揭示文献主题和文献信息检索有着重要作用。本文以《中国期刊网》上的《中国期刊全文数据库》中的文献为例,与《全国报刊索引数据库》进行标引质量的比较,从标引词来源、标引深度、先组度、标引一致性、通用词使用情况等方面做了抽样统计分析,并对期刊关键词标引提出了改进意见。 相似文献
11.
通过信息资源的多维度标引实现信息内容表示的标准化,解决现有互联网基于URL带来的信息共享模式困境。本文结合已有的自动标引算法,对其中的关键技术抽词算法和加权算法提出了一些改进,并通过实验对其进行验证。 相似文献
12.
一个基于本体论全文自动标引方案 总被引:5,自引:1,他引:5
本文为支持数字图书馆全文检索精度的提高,提出了一个基于本体论全文自动标引方案。该方案利用本体论的方法,强调词与词之间的内在概念联系,着重解决传统的人工标引不能全面概括全文,而且词与词之间缺乏概念性的连接,很难反映文件主题的全面内容及由于多义词、同义词等的原因造成漏检或检索结果返回信息太多,失去检索意义,达不到理想效果的问题。并为数字图书馆在进行主题标引时实现自动化操作。 相似文献
13.
因特网经济学未登录词计算机辅助挖掘试验 总被引:2,自引:0,他引:2
近年来随着社会经济科技和因特网的迅速发展,文献中不断涌现出大量未登录词。未登录词的存在严重影响了汉语自动分词与自动标引的准确率和速率。本文对1000篇经济类网页的关键部位———题名、摘要、关键词、首段进行未登录词挖掘试验,侧重对未登录词挖掘步骤设计和处理方法的讨论。 相似文献
14.
[目的/意义]资源数字化时代文献服务向知识服务方向转变,高质量的文献自动标引是文献知识服务能力提升的基础和关键,针对目前英文科技文献自动标引准确率不高的问题,提出了基于语义感知的概念遴选优化方法。[方法/过程]基于知识组织系统的自动主题标引,采用自然语言处理中的神经网络词向量技术,对概念和英文文献内容语义进行表示并进行语义感知与评估,实现概念标引结果在语义层面的遴选。该方法采用基于知识组织系统与自然语言处理技术相结合的方法,弥补了在语义层面上的不足,从而进一步降低不相关概念的影响,提高概念标引结果的准确率。[结果/结论]实验结果表明,该方法具有较好的语义感知性能,在概念遴选上有效降低了不相关概念,大大提高了标引结果的文献相关性,为科技文献资源知识化服务建设和相关研究提供有价值的参考和支持。 相似文献
15.
全文检索系统新模式的探讨 总被引:7,自引:0,他引:7
针对全文检索的现状,提出一种新的模式:将单汉字无标引全文检索系统和全文后控检索系统的优点结合起来,既绕开了词切分问题,又有效地提高了系统的查全率,并用实例加以说明。 相似文献
16.
【目的/意义】如何识别文本中的知识片段进行标引,使检索系统能检索文本知识内容是提高用户信息利 用效率的关键。【方法/过程】在文献调查的基础上,文章基于本体概念模型和Word2Vec词向量模型阐述了文本片 段语义标引的流程框架,并对本体语义扩展、神经网络模型训练、文本片段标引、文本片段权重获取四个部分的关 键环节及技术做了详细说明。最后通过实验验证了该流程框架。【结果/结论】实验结果显示该方法在文本知识片 段识别上是有效的,知识识别的准确率达到80%,能够实现对文本知识内容进行标引。该方法为自动化实现基于知 识的文本信息组织提供了有益的参考。 相似文献
17.
梁静 《内蒙古科技与经济》2008,(2)
文章依据CALLS联合目录提出的文献标引宗旨和方式,针对中文文献书目数据主题标引中的选词、增词、组配以及主标题的确定、单主题和多主题文献的标引进行了探讨,并结合实例加以分析. 相似文献
18.
19.
网络信息检索系统中信息自动标引方法的设计与实现 总被引:1,自引:0,他引:1
比较了目前主要使用的标引方法,根据网络信息的特点,提出了关键词标引和全文标引相结合的混合标引方法,并给出了具体实现方法,描绘了自动标引的流程图。最后给出了信息标引处理后数据检索方法。 相似文献
20.
梁静 《内蒙古科技与经济》2008,(2):115-118
文章依据CALLS联合目录提出的文献标引宗旨和方式,针对中文文献书目数据主题标引中的选词、增词、组配以及主标题的确定、单主题和多主题文献的标引进行了探讨,并结合实例加以分析。 相似文献