共查询到10条相似文献,搜索用时 15 毫秒
1.
基于百度指数搜索引擎关键词搜索频度分析,以大数据为关键词,从社会公众和媒体关注两个角度出发,对搜索指数、媒体指数、新闻头条等模块进行统计分析,得出我国大数据及其相关事物的社会关注度和趋势,最后就存在的问题和建议进行阐述。 相似文献
2.
百度指数是大数据时代分析我国公众网络行为的重要数据来源。文章以“档案”作为主要关键词,以“档案管理”“档案查询”作为辅助关键词,以百度指数作为数据来源,分析关键词的搜索指数、相关检索词、媒体指数、新闻头条、人群特征,了解公众对档案网络信息的关注度和需求。 相似文献
3.
随着大数据时代的到来,数字化知识服务平台成为了学术发展的基础设施,数字化出版服务的建设,与关键词有着密不可分的关联.作为搜索文章的重要因素,期刊关键词的应用对于文章的利用率和被引率有着不可或缺的重要作用.就当前的研究来看,关键词的研究并不多见,关键词的选取、检索与规范也存在着一定的学术空白,本文着重论述大数据视域下期刊... 相似文献
4.
本文从研究主题、学术交流、知识基础、期刊四个角度对Morris的研究专业概念进行了操作化定义,并以此提出了研究专业特征的相关假设.统计检验结果表明,作者关键词耦合分析结果中作者类簇具有研究专业的特征,进而证明了基于作者关键词耦合的研究专业识别方法的有效性.尽管本文的研究结论相对保守,但其稳健性还是较高的.由于研究数据样本所限,本文研究结论的普适性仍有局限.在未来研究中本文将通过其他领域的实证研究,进一步对基于作者关键词耦合的研究专业识别方法进行实证与完善. 相似文献
5.
6.
本文系国家自然科学基金项目 :“科学信息离散分布的机理与模型研究”的第六部分。文章以主题词或关键词表征知识单元 ,研究了三个具有代表性的数据库中四组数据关键词或主题词的词频分布规律 ,运用MATLAB软件拟合出了这四组数据的齐夫分布公式 ,并用X2 方法对其进行了检验 ,发现它们遵循齐夫定律。 相似文献
7.
基于聚类分析的学科交叉研究 总被引:1,自引:0,他引:1
聚类分析是数据挖掘中的一项重要技术,通过聚类可以发现隐藏在海量数据背后的知识.本文提出了一种通过文献数据聚类分析来研究学科交叉的方法.首先提出了一种基于摘要词与关键词加权的相似度模型,使得文献之间的相似度更加精确.利用FCM 算法对2005年CSSCI文献数据库中图书情报学的文献数据进行聚类,通过建立学科原子特征词的学科交叉表统计出图书馆学、情报学和文献学三个学科的研究热点及交叉点,以及图书情报学新的学科增长点,并对分析结果进行了检验,结果表明本文所提出的方法是科学的、切实可行的. 相似文献
8.
9.
10.
适用于隐含主题抽取的K最近邻关键词自动抽取 总被引:1,自引:0,他引:1
众所周知,K最近邻方法作为机器学习领域的一个经典的方法,在很多领域都有出色的表现.本文利用K最近邻方法的思想,提出了一种基于K最近邻的关键词自动抽取方法.现有的关键词抽取技术仅仅是对正文词汇的抽取,不能抽取隐含主题.隐含主题的抽取是关键词自动抽取技术的难点,但是该方法可以有效抽取隐含主题.该方法首先对数据进行预处理,使用向量空间模型将文本表述为数学化语言;然后,以人工标注关键词的文献数据作为训练集,使用K最近邻方法构建新文献的关键词候选集;最后,根据关键词本身的特点对候选关键词做了有效的后处理.实验表明,该方法不仅可以提高关键词抽取的准确率和召回率,还可以有效抽取文章的隐含主题. 相似文献