首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 140 毫秒
1.
[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。  相似文献   

2.
论文以CNKI中文数据库中与循证图书馆相关的文献记录为数据源,对其年度分布、载文期刊分布、作者及其单位分布等方面进行系统分析,并通过关键词词频统计和共词分析,对国内循证图书馆的研究热点和主题进行概述.  相似文献   

3.
基于关键词和摘要相关度的文献聚类研究   总被引:1,自引:0,他引:1  
现有的文献聚类方法都是通过文献关键词来进行的.本文在研究大量文献聚类方法的基础上,提出了一种通过文献关键词和摘要进行加权的新的文献聚类算法.首先,改进了传统相似度计算的方法,设计出基于关键词和摘要词加权的相似度公式,使文献相似度计算更加精确.其次,基于"文献距离越大,聚为一类的概率越小"的思想,提出了一种"最大距离聚类法",并给出了算法的详细步骤.最后,实现算法并进行了大量的实验仿真.通过改进相似度计算公式,调整关键词和摘要词的权重,提高了聚类的质量.结果表明,本文提出的文献聚类算法是一种行之有效的方法.  相似文献   

4.
本文系国家自然科学基金项目:"科学信息离散分布的机理与模型研究,,的第五部分(知识单元离散分布的图形模拟).文章以主题词或关键词表征知识单元,运用L昭istic函数模拟关键词或主题词的分布图像,包括词总数、个数和核心词,得到关键词或主题词总数、个数和核心词的离散分布方程,并用K-S检验对模型进行了检验.  相似文献   

5.
论文以CNKI中文数据库中与循证图书馆相关的文献记录为数据源,对其年度分布、载文期刊分布、作者及其单位分布等方面进行系统分析,并通过关键词词频统计和共词分析,对国内循证图书馆的研究热点和主题进行概述。  相似文献   

6.
为了跟踪我国信息搜寻行为研究的现状与进展,本文以中国学术期刊数据库为文献源,对国内2002~2011年有关信息搜寻行为的研究论文进行定量分析.文章采用文献计量方法以及社会网络分析方法,借助Excel、UCINET等工具,从文献的年度分布、作者分布、机构分布、期刊分布、合著率分布、关键词词频以及共词分布等方面,总结出近十年来我国信息搜寻行为研究领域的总体状况以及研究热点.  相似文献   

7.
重要句群是指最能表达文献主题的若干句子的集合,客观性强、生成效率高,可在利用自动文摘成果的基础上基于重要句群进行检索.在对句子进行预处理、文献语词权重计算以及句子权重计算后生成重要句群.利用基于向量模型的方法以及构建检索式和检索提问分别对基于文摘、重要句群和全文的检索性能进行对比分析.实验结果表明,基于重要句群的检索性能总体优于作者文摘,但是低于全文,可以将重要句群作为后台数据或搜索引擎的摘要等.句子级别的文本处理对提升文本检索效果的作用不大,而把文本处理提升至上下文的语义级别是可能的有效方法.  相似文献   

8.
文章以CNKI数据库中收录的主题为"文书学"的文献为基础,采用文献计量学的方法,从年代分布、期刊分布、学科分布、作者分布以及研究主题等方面进行统计分析,并对文书学研究主题利用Ucinet的Netdraw方法进行高频关键词共现网络分析,利用SPSS19.0进行共词分析,揭示我国文书学领域的研究现状,分析我国文书学当前发展中存在的一些不足,相应提出了一些建议。  相似文献   

9.
张坤  李晶  王文韬  谢阳群 《图书馆》2017,(12):66-71
文章以中国知网数据库中分享经济相关的文献作为分析样本,对相关文献的年分布、期刊分布、高产作者合作情况和研究主题进行了梳理与分析,然后运用共词分析法和社会网络分析法统计绘制了高频关键词的可视化图谱,并对高频关键词进行了聚类分析,进而得出我国分享经济的五大研究热点主题,旨在为未来研究者研究分享经济相关问题时提供参考。  相似文献   

10.
本文系国家自然科学基金项目:“科学信息离散分布的机理与模型研究”的第五部分( 知识单元离散分布的图形模拟) 。文章以主题词或关键词表征知识单元,运用Logistic 函数模拟关键词或主题词的分布图像,包括词总数、个数和核心词,得到关键词或主题词总数、个数和核心词的离散分布方程,并用K—S检验对模型进行了检验  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号