共查询到20条相似文献,搜索用时 281 毫秒
1.
随着科研人员需要处理的文献集规模的日益庞大,以LDA 为代表的主题模型能够从语义层面挖掘大规模文献集中隐含的主题,因此,LDA 主题模型的应用越来越广泛。LDA 模型仅仅关注文献集的内容,而忽略了文献其他重要的外部信息,AToT 模型在LDA 主题模型的基础上引入了文献作者和文献发表时间两个属性,使AToT 模型不仅可以挖掘文献中隐含的信息,还可以分析文献作者的研究兴趣及文献主题随时间的变化。AToT 模型对文献集建模的结果是以概率矩阵的形式呈现,不能直观、全面、清晰的呈现挖掘出来的信息,特别是对数据挖掘不熟悉的科研人员,因此,本文开发了一个基于AToT 模型的可视化系统,该可视化系统清晰、美观地展现了AToT 模型中文献、主题、作者、时间、词项间的关系。如文档中的主题分布、主题的词项分布、作者的研究兴趣分布、主题的相似主题和主题的演化趋势等。 相似文献
2.
以引文数据库Web of Science以及Scopus为文献源,采用文献计量学的方法,针对2004年至今的以Google Scholar为研究主题的文献,从文献量及年代分布、文献类型及语种、作者、期刊、文献被引和主题等方面进行分析,揭示Google Scholar的研究现状。 相似文献
3.
[目的/意义]传统的文献主题提取方法主要是通过关键词、摘要、全文等提取文献的主题内容,使得主题内容不全面或存在"噪音",而从文献内容语义出发,结合引用内容提取文献的主题,能够更加准确地提取出多文档的主题内容。[方法/过程]提出一种面向多文档的基于语义和引用加权的科技文献主题提取算法,利用文献的引用内容和关键词构建Labeled-LDA主题模型,形成文档-主题概率向量,再根据K-means聚类方法聚类文档,提取每类文档集的主题内容。[结果/结论]以PubMed生物医学数据库中的数据作为实验数据,测试该方法的可靠性,结果证明该方法能够准确、全面地提取出多文档的主题内容。 相似文献
4.
针对2005-2010年在期刊和报纸上发表的有关“农民工与图书馆”的文献,从文献来源数据库分布、年代分布、刊物类型分布、文献作者的地区分布、文献作者的机构分布、文献的基金论文分布、高频被引论文分布和文献的主题分布进行了统计分析,揭示了这一主题研究的现状。 相似文献
5.
通过专家咨询确定卫生体制改革研究文献的分析主题、检索策略、检索用词及文献筛选原则,利用数据库和网站搜集文献,应用Noteexpress、Endnote两种文献管理软件以及Excel软件进行文献查重,从文献发布年代、主题分布、期刊、作者、国家和地区等方面进行文献计量分析,为我国医药卫生体制改革提供知识服务和循证决策支持. 相似文献
6.
茶文化主题分馆是主题图书馆的一种,主题馆藏体系建设与资源组织管理是主题图书馆开展各项服务的基础,从便于读者利用的角度出发,本文对茶文化主题图书馆的文献排架布局和《中图法》类目划分作了尝试探讨,并进一步分析了主题图书馆资源组织模式,包括主题图书馆文献管理规范、配置要求、排架规范及物流规范。 相似文献
7.
对国外图像检索文献的定量分析 总被引:2,自引:0,他引:2
利用SCI数据库检索到1997年后有关图像检索主题的文献,并对检索结果从文献量、著者、期刊、主题、以及引文等角度作了大量的定量分析。 相似文献
8.
基于文献计量的“图书馆文献计量”研究综述 总被引:4,自引:0,他引:4
运用文献计量学的方法,基于CNKI提供的数据,对近年来“图书馆文献计量”的研究论文从年代、期刊、著者、主题四方面的情况进行了统计分析,并对其主题分布进行了综述。 相似文献
9.
利用文献统计方法,对近8年来关于微软公司知识管理研究的文献数量、年代和主题情况进行了统计.通过对文献主题内容的分析,从基础研究、技术研究以及应用研究等方面对现有的研究成果进行了综述,并对未来研究做了展望. 相似文献
10.
11.
近五年图书馆知识服务研究文献定量分析 总被引:12,自引:0,他引:12
取《中国期刊网》与《中文维普科技全文数据库》作为检索工具,以2000-2004年5年间所发表的关于“图书馆知识服务研究”的194篇文献为分析数据,采用文献定量分析方法进行统计,从时间分布、空间分布、著者分布、内容分布和引文分布5个角度来分析我国图书馆知识服务研究的状况。 相似文献
12.
13.
引文分析法是图书馆学、情报学的专门研究方法。利用文献计量学(Bibliometries)的引文分析法(citation analysis method),对《津图学刊》1998-2001年所刊载论文的引文量、引文语种、引文类型、引文年代、引文期刊、引文著者等诸多方面进行了统计与分析,以期为本刊作者合理利用文献提供依据。 相似文献
14.
15.
从医学期刊编辑工作的实践出发,结合实例循证分析,提出提高医学期刊文稿质量的若干可行对策:找准审稿专家,编辑切实做到对每期每篇文稿负责,坚持不对"急就章""救死扶伤",而护送优质、新颖的稿件走"急诊". 相似文献
16.
近五年信息检索论文分析研究 总被引:3,自引:0,他引:3
以“信息检索”和“情报检索”为关键字,借助中国期刊网,对1999年到2003年图书情报学核心期刊中关于信息检索(情报检索)的论文进行统计分析,得出近五年我国图书情报领域中关于信息检索(情报检索)论文的数量、相关作者、主要发文单位、主要内容与 “核心”期刊,并在此基础上分析信息检索(情报检索)的发展情况。 相似文献
17.
选取中国科技论文与引文数据库中2003—2012年的论文及引文数据,以综合大学学报类和医学综合类期刊的首篇文章为例,从单篇论文评价的角度探讨首篇文章(同行评议质量较高)与同期的总体论文、高h指数论文、高被引论文之间的关系。结果发现:相比同期的其他论文,期刊的首篇文章具有更高的影响力,论文的h指数均值及篇均被引都高于前者;期刊的首篇论文中,38%同时为当期论文中的h指数最高论文,10%为当期论文中的被引频次最高论文,定量评价的高质量论文与同行评议的高品质论文——首篇文章,具有较好的重合度。值得注意的是,这种重合度随着时间的推移在不断增长。 相似文献
18.
我国数字图书馆学领域著者队伍研究 总被引:1,自引:0,他引:1
以我国2005—2009年五年间CNKI《中国期刊全文数据库》和《中国引文数据库》收录的数字图书馆学领域的文献为研究对象,利用文献计量与统计学的有关方法,从著者的发文数、引文数及合作情况等角度,对近五年来国内数字图书馆学领域的著者队伍进行了分析,以期了解和掌握我国数字图书馆研究现状,为进一步的研究和发展提供参考。 相似文献
19.
细粒度语义共词分析方法研究 总被引:2,自引:0,他引:2
针对共词分析方法存在的共现词对的"同量不同质"问题、共词分析结果解释的"不一致"问题等,提出一种细粒度语义共词分析方法。该方法一方面对词对共现统计单元进行碎片化处理,由"文献单元"变为"知识单元"(RDF三元组),达到细粒度的目的;另一方面对共词分析方法进行语义化处理,将共现词对的语义信息融入到共词分析过程之中。最后,借助该方法进行实证研究,并在一定程度上验证该方法的科学性和有效性。 相似文献
20.
通过调查2000—2004年间我国国内关于情报分析方面的论文,对近5年的情报分析研究进行归纳和概括,总结出情报分析研究的成绩和今后应注意的问题,并针对这些问题对我国未来情报分析研究提出了一些建议。 相似文献