共查询到20条相似文献,搜索用时 562 毫秒
1.
本文系国家自然科学基金项目:“科学信息离散分布的机理与模型研究”的第五部分( 知识单元离散分布的图形模拟) 。文章以主题词或关键词表征知识单元,运用Logistic 函数模拟关键词或主题词的分布图像,包括词总数、个数和核心词,得到关键词或主题词总数、个数和核心词的离散分布方程,并用K—S检验对模型进行了检验 相似文献
2.
本文系国家自然科学基金项目:“科学信息离散分布的机理与模型研究”的第四部分。文章以布拉德福定律为参照系,以主题词或关键词表证知识单元考察了科学信息的离散分布特征,即分别以载文量、主题词或关键词总数和核心词数为分区标准,研究科学信息在不同分区标准下的分布特征。结果发现,科学信息从文献单元到内容单元其离散程度越来越高。 相似文献
3.
本文系国家自然科学基金项目 :“科学信息离散分布的机理与模型研究”的第六部分。文章以主题词或关键词表征知识单元 ,研究了三个具有代表性的数据库中四组数据关键词或主题词的词频分布规律 ,运用MATLAB软件拟合出了这四组数据的齐夫分布公式 ,并用X2 方法对其进行了检验 ,发现它们遵循齐夫定律。 相似文献
4.
5.
6.
本文系国家自然科学基金项目:“科学信息离散分布的机理与模型研究”的最后一部分(比较与总结)。文章运用Logistic模型来拟合文献单元的离散分布规律,发现远比莱姆库勒函数精确,并分析了本项研究所揭示的文献单元与知识单元相同的分布规律的意义。 相似文献
7.
本文系国家自然科学基金项目“科学信息离散分布的机理与模型研究”的最后一部分(比较与总结)。文章运用Logistic模型来拟合文献单元的离散分布规律,发现远比莱姆库勒函数精确,并分析了本项研究所揭示的文献单元与知识单元相同的分布规律的意义。 相似文献
8.
本文对400篇《电子学报》论文中作者标出的关键词及作者提出的创新点词在正文中的句群分布做了统计分析.结果显示关键词0句群分布的概率为31.5%,关键词大于等于0.3的句群分布概率为40.5%,关键词与创新点词用词一致的概率为19.2%;创新点词具有引导特征词和适中的句群分布,由此提出增设创新点词标引的建议.试验表明,该方法不仅专指度高,且有利于创新点的知识单元发现. 相似文献
9.
主题标引的原理和方法(一)张琪玉(空军政治学院)必须说明,主题标引可分为标题词标引、叙词标引、单元词标引、关键词标引、自由标引等多种,本文仅限于叙词标引。叙词通常称为主题词,故也可称为主题词标引。所谓主题标引,是指用语词标识(即标题词、叙词、单元词、... 相似文献
10.
非相关文献知识发现是Swanson教授提出的一种情报学方法,用于挖掘隐藏在文献之间的隐秘联系.其知识发现过程包括两部分开放式知识发现过程和闭合式知识发现过程.开发式知识发现过程是形成假设的过程,可表示为A→B→C;闭合式过程是检验假设的过程,可表示为A→B←C.本文以Medline为数据源,以Mesh字段中的主题词为内容分析单元,进行开放式知识发现的实践.文章共分两部分第一部分模拟Swanson的雷诺氏病和鱼油、偏头痛和镁缺乏的知识发现的例子,分别以雷诺病(raynaud disease)和偏头痛(migraine)为来源主题词(source subject),寻找目标词鱼油和镁缺乏;第二部分是以2型糖尿病(diabetes mellitus,type 2)为来源主题词,进行主题词分析法的医学实践.研究表明,主题词作为内容分析单元在技术上容易实现,是可行的知识挖掘方法.在实践中还需要探索更好的主题词统计量,进行更精确的类别限定,进一步完善该方法在科研领域的应用. 相似文献
11.
主题词分析法进行非相关文献知识发现的探索(Ⅰ)——模拟Swanson的知识发现过程 总被引:3,自引:0,他引:3
非相关文献知识发现是Swanson教授提出的一种情报学方法,用于挖掘隐藏在文献之间的隐秘联系.其知识发现过程包括两部分开放式知识发现过程和闭合式知识发现过程.开发式知识发现过程是形成假设的过程,可表示为A→B→C;闭合式过程是检验假设的过程,可表示为A→B←C.本文以Medline为数据源,以Mesh字段中的主题词为内容分析单元,进行开放式知识发现的实践.文章共分两部分第一部分模拟Swanson的雷诺病和鱼油、偏头痛和镁缺乏的知识发现的例子,分别以雷诺病(raynaud disease)和偏头痛(migraine)为来源主题词(source subject),寻找目标词鱼油和镁缺乏;第二部分是以2型糖尿病(diabetes mellitus,type 2)为来源主题词,进行主题词分析法的医学实践.研究表明,主题词作为内容分析单元在技术上容易实现,是可行的知识挖掘方法.在实践中还需要探索更好的主题词统计量,进行更精确的类别限定,进一步完善该方法在科研领域的应用. 相似文献
12.
目前,越来越多的辩技期刊对论文标引主题词或关键词,主题词取自于词表,是经过规范化处理的词,表达同一主题的词在任何情况下都具有完全一致的字面形式。关键词是自然语言,直接从文章中抽取,同一主题慨念的词可呈现多种字面形式。显然,只有主题词才具有真正的检索意义。国家有关部门规定关键词应尽量从主题词表中选用。因此,论文标引应以主题词为基准。 相似文献
13.
14.
利用知识可视化软件(CiteSpace Ⅱ),对Web of Science(SCI-E,SSCI)中1975-2010 年收录的2863 篇引
文分析论文进行研究。分别分析引文研究文献的时间分布、地区分布、机构分布、期刊分布、学科分布以及学科代表人
物与其经典作品,从而直观地揭示引文分析研究发展的现状,并通过对关键词出现的频率和共现情况,确定引文分析研
究热点,基于主题词变动趋势描绘引文分析的研究前沿。 相似文献
15.
利用知识可视化软件(CiteSpaceⅡ),对Web of Science( SCI-E,SSCI)中1975-2010年收录的2863篇引文分析论文进行研究.分别分析引文研究文献的时间分布、地区分布、机构分布、期刊分布、学科分布以及学科代表人物与其经典作品,从而直观地揭示引文分析研究发展的现状,并通过对关键词出现的频率和共现情况,确定引文分析研究热点,基于主题词变动趋势描绘引文分析的研究前沿. 相似文献
16.
[目的/意义]从主题时序视角出发,以中国图书馆学会年会主题和年会论文集题录为研究样本,进行相关主题词的分布和演化分析,梳理中国图书馆界近十年来理论与实践发展脉络。[方法/过程]获取2007-2017年间中国图书馆学会年会的相关主题词,从中选择高频词,利用Excel构造主题词共词矩阵,利用Ucinet和SPSS工具进行主题词静态分布分析,结合"流行研究热点权值(PRHW)"指标对主题词进行动态演化分析。通过词频、中心性、聚类对比分析相关主题词的静态分布特征;通过词频时序和共词时序分析主题词的动态演化特征,并采用PRHW指标进行识别和演绎;从7个类团中抽取两个典型主题词构筑全主题词的共词时序网络。[结果/结论]相关主题词的静态分布特征表现为:年会主题词和论文集主题词高频词一致性较好,论文主题词更微观具体;二者都不具备显著的中心性;聚类结果根据相近原则归并出7个具体类团。主题词的动态演化特征表现为:分长期关注、早期关注、近来关注上升和近来关注下降四类,相关主题的微观演化特征得到了精细化呈现。 相似文献
17.
18.
现有的主题标引方法一般只能抽取文本中出现的词汇,无法从几万或数十万主题词中选择语义关联强且未出现的词汇;基于机器学习的多标签分类算法则需要每一个标签下有训练数据,限制了它们在主题标引上的应用。面向大规模主题词在海量文献上的标引需求,提出一个基于分布式词向量的混合型自动标引方法,利用大规模语料训练的词向量生成同维度的主题词表示向量和文本表示向量,实现主题词与文本语义相似度的计算。基于大规模语料构建主题词与普通词的映射表,使文本向量只和少量的语义强相关主题词向量比较,大大减少了计算量,提高了标引效率。开发的自动标引工具对近亿篇文献进行了主题标引,达到了较高的速度。与结巴关键词的实验对比结果显示,本文方法抽取的主题词与作者关键词重合度较低,且在去除结巴关键词中的非主题词后,取得了比结巴关键词更高的标引准确率;与人工标引的实验对比结果显示,随着人工标引词数量的增加,本文方法的效果、结果与人工标引结果的一致性在不断增加。 相似文献
19.
本文运用莱姆库勒函数拟合取自BIOSIS、INSPEC和COMPENDEX中的4组数据,并用柯尔莫洛夫斯米尔诺夫检验(KS检验)进行验证,结果发现取自BIOSIS的两组数据通过了KS检验,而另两组数据未通过。但图像仍然符合布氏分布曲线。 相似文献
20.
本文系国家自然科学基金项目:“科学信息离散分布的机理与模型研究”的第二部分。文章运用布氏区域法对采自BIOSIS、INSPEC、COMPENDEX数据库的4组原始数据进行分析,验证了布拉德福定律在现代科学技术环境下的适用性和精确性。结果发现布拉德福定律对于本项目的数据很不精确。 相似文献