共查询到20条相似文献,搜索用时 31 毫秒
1.
引文主题与源文献主题具有相关性.基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法.具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词.本文还对此法的可行性进行了测试,并提出了改进方法. 相似文献
2.
引文搜索引擎CiteSeer^x设计原理及检索 总被引:1,自引:0,他引:1
详述了基于自动引文标引的新一代引文搜索引擎CiteSeer^x的设计原理及其检索、统计功能。认为该系统具有多元化的文献标引思想,能够更新更快地揭示科学文献及其后继影响,多角度促进学术文献的传播与反馈,具有开放环境下引文标引与检索的许多新特征,目前是传统引文数据库的必要补充,也必将对传统引文数据库的发展起到借鉴作用。 相似文献
3.
统计分析法自动标引的改进研究 总被引:2,自引:0,他引:2
许剑颖 《现代图书情报技术》2004,20(2):92-95
统计分析法自动标引是自动标引的一种重要方法。本文从标引词应反映文献主题内容这一原则出发,对统计分析法自动标引从标引源的确定、权值的设计、词频的调整及检索后控词表的设计与维护等方面提出了一些改进设想。通过这些方法使标引词更好地反映文献主题的同时提高检索效率。 相似文献
4.
书目数据库与引文数据库标引质量的测评 总被引:1,自引:0,他引:1
对《中文社会科学引文索引》、《全国报刊索引数据库》和《中文科技期刊数据库》三个数据库收录文献的范围、标引深度、先组度、标引一致性、标引准确性等方面进行定性定量的比较,并针对各库的不足提出改进建议。 相似文献
5.
书后主题索引的自动编制初探 总被引:1,自引:0,他引:1
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的书后主题索引自动编制方案,即将图书章节细化后利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N—gram方法的书后主题索引的自动编制方法是可行的。 相似文献
6.
中文全文标引的主题词标引和主题概念标引方法1 总被引:20,自引:3,他引:17
中文全文标引正在越来越受到重视。本文主要研究了三个方面的问题,首先是全文主题词标引的加权问题,综合考虑了五个方面的因素;其次是介绍了一种用层次概念词典改进主题词标引质量的新方法;最后又提出了用三种不同的方法产生主题概念进行全文标引的的主题概念标引。受限范围内的实验结果显示本文的方法有一定的理论和实用价值。 相似文献
7.
8.
中文期刊文献通用词标引分析 总被引:1,自引:0,他引:1
通用因素是文献主题的构成因素之一,对主体因素起细分作用。通用词是指那些在专业领域没有独立检索意义的泛指词。在中文期刊文献标引的过程中,通用词的使用对其标引结果产生着重要的影响。文章讨论了通用词标引的一般规则,并以《中国期刊网》中的文献为例,进行抽样统计和实例分析,归纳了通用词标引的错误现象及其原因,并对期刊文献的通用词标引提出了几点改进意见。 相似文献
9.
影响文献主题标引质量因素浅析 总被引:2,自引:0,他引:2
影响文献主题标引质量因素浅析李楠(辽宁省图书馆)文献主题标引是一项比较复杂的工作,由于各种因素使得标引出现许多误差,影响了标引的质量。一、主题分析错误对标引质量的影响主题分析,是指根据主题标引和检索的需要,对文献内容特征进行分析、提炼主题概念的过程。... 相似文献
10.
图书内容主题索引的自动编制实验 总被引:1,自引:1,他引:0
针对现有索引软件一般只能进行字面标引而不能实现概念标引的不足,提出了一个基于概念标引的图书内容主题索引自动编制方案,即将图书章节细化后,利用基于单篇文献的自动标引系统进行图书主题标引。通过三种标引系统对实验语料的标引结果统计来选择标引系统;其次通过对篇章结构分析,提出基于标题符号的标引源自动识别方案,同时给各标引源设定权重,提出主题词标引流程;最后还探讨了标引单元确定以及索引地址设计。实验表明,基于N-gram方法的图书内容主题索引的自动编制方法是可行的。 相似文献
11.
文献主题和文献标引用主题 总被引:1,自引:0,他引:1
针对“文献主题”理解上的分歧,提出了“文献标引用主题”的概念,并具体阐述了“文献标引用主题”与“文献主题”的区别,及“文献标引用主题”的形成原则和标引功能。 相似文献
12.
论分类标引的规范问题 总被引:7,自引:1,他引:6
文章通过调查网络环境下的文献分类标引,发现就是同一文献也存在五花八门标引结果的严峻现象,这样不仅降低了分类法规范性功能,也不利于文献资源共享。本文从文献资源共建共享高度,提出按照分类号的排架与检索两种固有功能规范分类标引,进而强调不应动摇对图书馆文献组织管理这一基础性工作的重视。 相似文献
13.
三、新主题文献的分类标引方法在确定新主题文献如何归类之后,就要考虑将它们的主题概念转化成符号语言了。基于新主题的复杂性和多样性,以及文献量的高速增长,在标引 相似文献
14.
文献的数字化与网络化给引文分析带来许多新的影响。本文论述了计算机引文分析的意义,分析了数字化环境下引证行为的变化,概述了计算机引文分析的一些新的发展趋势。主要包括:电子期刊的引文链接,基于网络的引文数据库新功能,网络引文数据的自动标引,数据仓库与引文数据库,基于XML的引文索引,引文数据的挖掘分析,可视化技术在引文分析中的运用等。 相似文献
15.
统计分析法自动标引的改进 总被引:12,自引:2,他引:10
情报检索的目的是为用户服务,因而标引词的提取应以其与文献主题内容相关程度为标准。文章基于原有的统计分析标引法,对其权值设计予以重新考虑,并与文献词频统计相结合,使分词与标引相统一,标引词更好地反映文献主题概念,提高检索效率。 相似文献
16.
文献主题因素的常见标引误差分析 总被引:1,自引:0,他引:1
文献主题概念表达的误差一般都出现在对各主题因素的标引中,结果是造成文献主题的误检和漏检。本文从大量书目数据中选择了一些比较典型的标引问题实例,分析和提出了预防或减少此类标引问题的建议和设想。 相似文献
17.
18.
[目的/意义] 概率主题模型算法在不断得到改进与扩展,本文对国内外已有的利用引文构建的主题模型进行研究,分析和对比不同模型的生成过程与算法,并探讨利用引文构建的主题模型在科技文本分析中的应用与可扩展的研究方向。[方法/过程] 通过Web of Science数据库和CNKI数据库获取国内外利用引文构建主题模型的相关文献,经人工判读后筛选出具有代表性的文献,对这些文献中利用引文构建的主题模型,从建模思想、生成过程、参数估计与推断算法等方面进行对比与分析。[结果/结论] 目前国内外利用引文构建的主题模型主要包括研究主题与引文分布的主题模型、研究被引与施引主题间关系的主题模型,以及基于引用内容的引用主题模型;主题模型中引入引文信息后,能够获得更完整的主题内容和特定主题下的重要文献,并可识别施引文献和被引文献之间主题间的关系及影响;已有的模型多集中在概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)和潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型基础上进行扩展。未来可扩展研究引入引用内容的主题模型、模型的性能优化和评价方法、模型的应用研究等。 相似文献
19.
关于文献关键词标引问题 总被引:1,自引:0,他引:1
对文献关键词标引问题进行了论述.指出了科技文献关键词标引中的一些误区,提出了文献作者和科技期刊编辑人员在标引关键词时的规则和注意事项.同时,还指出了关键词标引对文献存储和检索的重要作用.介绍了关键词和主题词的关系. 相似文献
20.
网络环境下,文献信息具有数量多、增长快、文献信息中的新词层出不穷等特点。标引是对信息资源进行组织的有效手段和重要环节,标引的质量和效率直接影响信息组织的质量和速度。为了比较受控标引、自由标引和自动标引三种标引方式的标引性能,本文从定量的角度对三种标引方式的相符度、专指度、标引深度及通用词数进行了测试对比,并分析了它们的综合性能。最后,分析讨论了网络环境下文本信息标引方式的选择和发展趋势。表5。图1。参考文献9。 相似文献