首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 656 毫秒
1.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

2.
曾文  徐红姣  李颖  王莉军  赵婧 《情报工程》2016,2(3):037-042
文本相似度的计算方法以采用TF-IDF的方法对文本建模成词频向量空间模型(VSM)为主,本文结合科技期刊文献和专利文献特点,对TF-IDF的计算方法进行了改进,将词频的统计改进为科技术语的频率统计,提出了一种针对科技文献相似度的计算方法,该方法首先应用自然语言处理技术对科技文献进行预处理,采用科技术语的自动抽取方法进行科技文献术语的自动抽取,结合该文提出的术语权重计算公式构建向量空间模型,来计算科技期刊文献和专利文献之间的相似度。并利用真实有效的科学期刊和文献数据进行实验测试,实验结果表明文中提出的方法优于传统的TF-IDF计算方法。  相似文献   

3.
识别不同学科间共有的研究内容是学科交叉知识发现的一种研究思路。学科间具有相似语义的研究内容,能够更好地体现学科之间知识的融合、交流现象。针对从科技文献数据中获取语义相似学科交叉研究主题的问题,本文提出了一种基于无监督对比学习的科技文献及关键词语义相似关系表示学习方法,构建了一种语义相似学科交叉主题识别模型。该模型将Spearman相关系数作为评价学科交叉主题的指标,解决了现有研究缺少学科交叉研究数据集的问题。研究结果表明,本文模型较好地获取了科技文献及其关键词之间的语义相似关系,能够较好地反映两个学科之间的交叉态势。  相似文献   

4.
掌握融合出版领域前沿技术的应用现状与趋势,为融合出版领域的技术应用提供参考。选择2006—2022年融合出版领域的专利、新闻、公众号、学术论文数据,采用joiNLP算法提取关键短语,利用BERTopic模型进行主题提取,并基于all-MiniLM-L6-v2模型将主题向量化作为余弦相似度计算的依据,以分析2006—2022年融合出版技术主题与应用主题的强度演化与内容演化趋势,最终构建演化主路径。以多源数据为研究对象,揭示融合出版领域热点技术可归纳为区块链、人工智能、虚拟现实、增强现实,并指出未来融合出版将在元宇宙世界具有更广泛的应用空间。使用主题模型从文本语义层面提取技术主题,结果具有高准确性和强可解释性,对探究技术的演化规律与趋势具有创新意义。  相似文献   

5.
期刊论文与专利文献之间的有效链接有利于提高它们的利用率、加强基础研究与应用研究的联系和实现知识增值,但当前两者缺乏有效的关联和共享渠道。文章分析了期刊论文与专利文献之间的异构特性,提出了建立两者链接关系的研究框架,通过CLC与IPC的类目映射、创新主题提取和基于叙词表的语义相似度计算来解决异构科技文献链接中存在的问题。本文研究目的是探讨异构资源整合的技术路径,为期刊论文与专利文献有效链接的建立提供研究思路。  相似文献   

6.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

7.
[目的/意义]科学技术的发展带动科技文献数量持续增长,探索不同数据源维度下的领域知识演化特征,有助于从数据层面对领域知识发展建立全景化视角。[方法/过程]以美国石墨烯领域的期刊论文、会议论文、基金项目、技术专利为数据源,采用BERTopic主题建模的方法提取领域主题,对不同数据源维度下的领域知识演化进行跟踪,对比不同数据源维度下的知识演化分析效果。[结果/结论]研究发现,基于单一数据源的主题提取结果及其呈现的知识演化脉络各有侧重;基于融合数据源的领域主题呈现领域全景且有助于发现潜在的知识演化模式。  相似文献   

8.
[目的/意义] 在科学研究中,从不同来源的科技文献中识别挖掘科研热点对于开展科研工作具有指导意义。旨在通过本研究提出的模型方法,快速准确地识别蕴含在多源文本中的热点主题,为科研创新提供支撑服务。[方法/过程] 提出一种基于LDA2vec模型的多源文本下科研热点识别的方法并针对科研热点识别构建模型,该方法融合LDA主题模型对隐含语义挖掘的优势和Word2Vec词向量模型对于上下文关系把握的优势。以机器学习领域的科技文献为例,利用模型困惑度和主题一致性两个指标对LDA2vec的在本领域应用的可行性和有效性进行验证,并与LDA的主题提取效果进行对比。[结果/结论] 实验结果表明,提出的方法在面对多源数据情况下,进行科研热点识别挖掘是可行的,且在一定程度上有效果的提升,对利用单一数据源进行主题分析的不足进行补充,对多数据源融合的实践应用进行丰富。  相似文献   

9.
王芳  李薇  杨错 《图书馆学刊》2013,35(1):127-130
以中国知网(CNKI)的相关数据库作为数据来源,采用文献计量学方法,从文献年代分布、作者分布、文献期刊来源、基金项目资助情况和关键词统计等几个方面,对学科馆员与学科服务发展研究的246篇文献进行统计.结合关键词频次和相关文献的内容,对研究主题进行分析,为学科馆员与学科服务研究进一步发展提供参考.  相似文献   

10.
近年作为计算机科学和人文学科交叉领域的数字人文研究范围扩大、内涵延伸,成为多个学科领域的研究热点。在学科交叉融合背景下,文章梳理国内外数字人文研究现状与进展,探究数字人文在我国作为交叉学科门类下一级学科的可能性与潜力;并以融合的多源异构文献题录数据为基础,结合文献计量学、关键词聚类、社会网络分析等研究方法,兼顾独立学科判定标准的科学性与交叉领域的特殊性,从学科基础建设情况、社会需求与应用、学科范畴与二级学科、学科共同体与成长性4个维度进行分析。文章认为数字人文具有发展成为一级交叉学科的潜力,但存在理论基础有待拓展、基础设施建设水平较低、人才培养机制尚不健全等问题。  相似文献   

11.
Genre is considered to be an important element in scholarly communication and in the practice of scientific disciplines. However, scientometric studies have typically focused on a single genre, the journal article. The goal of this study is to understand the role that handbooks play in knowledge creation and diffusion and their relationship with the genre of journal articles, particularly in highly interdisciplinary and emergent social science and humanities disciplines. To shed light on these questions we focused on handbooks and journal articles published over the last four decades belonging to the research area of science and technology studies (STS), broadly defined. To get a detailed picture we used the full-text of five handbooks (500,000 words) and a well-defined set of 11,700 STS articles. We confirmed the methodological split of STS into qualitative and quantitative (scientometric) approaches. Even when the two traditions explore similar topics (e.g., science and gender) they approach them from different starting points. The change in cognitive foci in both handbooks and articles partially reflects the changing trends in STS research, often driven by technology. Using text similarity measures we found that, in the case of STS, handbooks play no special role in either focusing the research efforts or marking their decline. In general, they do not represent the summaries of research directions that have emerged since the previous edition of the handbook.  相似文献   

12.
袁鹤  王晴 《编辑学报》2021,33(6):705-708
阐明撰写编辑学论文对科技期刊编辑自身成长、编辑团队建设和期刊影响力提升的重要作用。结合四川大学华西口腔医学院编辑部撰写发表编辑学论文的实践,认为撰写编辑学论文可以从办刊工作经验、出版热门话题、新兴技术应用、编辑工作实践、期刊发展状况、不同学科专业、突发公共事件等方面进行选题,以供编辑同人参考。  相似文献   

13.
[目的/意义]从主题视角对环境科学领域的零被引论文进行分析,对比零被引论文与高被引论文在文章内容、外在指标方面的不同,揭示零被引论文存在的原因。[方法/过程]首先,对来自Web of Science数据库的国内环境科学领域的260篇高被引论文、907篇零被引论文的摘要进行PLDA主题识别,然后通过主题相似度计算发现主题间的关联,以主题热度作为内部指标,发文时间、发文期刊作为外部评价指标,最后,把论文主题内容与外部指标结合进行零被引与高被引论文之间的相同主题、不同主题对比分析。[结果/结论]在研究主题相同情况下,期刊的影响因子大小是影响零被引论文的主要因素;在主题不同的情况下,论文研究的主题内容是导致零被引论文的主要原因。  相似文献   

14.
准确地研究和测度科学知识之间的逻辑关系和结构体系,是进行科学政策研究和科研项目资助布局等科研管理活动的重要基础。学术期刊作为科学知识传播和交流的重要平台,是探测科学知识结构的一种有效载体,但是不同的学术期刊分类体系对科学知识结构的测度结构会产生直接而广泛的影响。文章从学术期刊分群的角度出发,考虑期刊在共被引过程中的距离因素,通过采用深度学习算法,来进行期刊的相似度计算与分群问题研究,在此基础上进行科学知识结构测度方法研究,并以中国人文社会科学期刊引文数据库为实验对象进行了实证研究。从实证结果来看,我国人文社会科学学科知识结构存在较为明显的结构划分,不同学科类别或不同研究领域的期刊都被分到了相应的群组,表明从期刊使用的角度来看,我国人文社会科学知识结构边界是相对较为清晰的。在此基础上重点对法学期刊的两个群组的科学研究主题进行了挖掘,从关键词的共现网络中可以明显看出,两个期刊群体内的研究主题虽有一定的交叉,但是两者在具体研究内容上也存在着显著区别。  相似文献   

15.
��[Purpose/significance] In scientific research, identifying mining scientific research hotspots from different sources of scientific literature is of guiding significance for carrying out the next scientific research work. It aims to quickly and accurately identify hot topics contained in multi-source texts through the model method proposed in this study, and provide support services for scientific research innovation.[Method/process] This paper proposed a method based on LDA2vec model for multi-source text research hotspot identification and built a model for scientific research hotspot identification. This method combined the advantages of LDA topic model on implicit semantic mining and the context of Word2Vec word vector model. Taking the scientific literature in the field of machine learning as an example, the model extraction degree (perplexity) and topic coherence (topic coherence) were used to compare the topic extraction effects of LDA2vec and LDA in the context of multi-source text.[Result/conclusion] After experiments, the results show that the method proposed in this paper is feasible and can be improved to some extent in the face of multi-source data. The method can relatively quickly and accurately identify the hot content in the multi-data source text, make up for the shortcoming of the single analysis data source for subject detection, and enrich the practical application of the multi-data source fusion theory system.  相似文献   

16.
1995-1999年国内外同类期刊论文中图表数量的比较   总被引:2,自引:1,他引:1  
欧阳骅 《编辑学报》2001,13(3):145-146
比较并分析了1995-1999年出版国内外5种同类学术期刊论文中的统计图和统计表的数量。结果表明,国内学术期刊的论文中统计图太少,统计表过多。提示这些学术期刊论文的科学含量较少,可利用的资料不多,与国外同类学术期刊相比,差距较大。  相似文献   

17.
[目的/意义]作为科学学预测的重要组成部分,学科主题热度预测旨在揭示学术前沿和发展趋势,辅助学者发现前沿选题,支持科研管理机构科学立项。[研究设计/方法]提出基于期刊影响因子的学科主题热度计算指标(TP-JIF),构建基于LSTM神经网络的学科主题热度预测模型(TPP-LSTM),并以LIS领域数据为例,通过时间切片的形式抽取、计算学科主题的热度序列,检验不同长度时间序列下模型的各项误差。[结论/发现]相对于RBF-SVM、Linear-SVM、KNN、Naive Bayesian等模型,TPP-LSTM预测模型可有效表征学科主题热度时间序列的特性,当时间序列长度为4年时预测效果相对较好。[创新/价值]提出的基于期刊影响因子的学科主题热度计算指标,能够有效刻画不同学术刊物对学科影响的差异,规避了单纯依据频率计算热度的弊端;构建的学科主题热度预测模型,有效表征了学科主题的时间序列变化规律,减小了各项预测误差,预测效果较好。  相似文献   

18.
胡前进 《编辑学报》2022,(6):673-676, 681
为了提升“智汇杰瑞”新媒体平台的传播影响力,本文采用内容和数据驱动模式,将多源信息与虚拟专题的理念相结合,首先构建科技学术期刊新媒体知识服务平台;其次重点聚焦虚拟专题在新媒体知识服务平台的策划与传播实践;最后对虚拟专题在科技学术期刊新媒体知识服务平台中的实践成效进行总结,并对新媒体融合环境下,虚拟专题如何发挥优势更好地为科技期刊服务进行了探讨。  相似文献   

19.
Many health sciences librarians as well as other professionals attend conferences on a regular basis. This study sought to link an innovative peer review process of presented research papers to long-term conference outcomes in the peer-reviewed professional journal literature. An evidence-based conference included a proof-of-concept study to gauge the long-term outcomes from research papers presented during the program. Real-time peer review recommendations from the conference were linked to final versions of articles published in the peer-reviewed literature. The real-time peer review feedback served as the basis for further mentoring to guide prospective authors toward publishing their research results. These efforts resulted in the publication of two of the four research papers in the peer-viewed literature. A third presented paper appeared in a blog because the authors wanted to disseminate their findings more quickly than through the journal literature. The presenters of the fourth paper never published their study. Real-time peer review from this study can be adapted to other professional conferences that include presented research papers.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号