首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
[目的/意义]梳理算法构建论文层次学科分类体系相关研究,归纳总结现有研究尤其是应用研究中存在的问题和不足,为相关理论研究和实践应用提供参考与借鉴。[方法/过程]首先,界定算法构建论文层次学科分类体系的概念和内涵,从3个阶段梳理其发展历程。其次,根据构建流程从构建数据关系、聚类方法和描述学科领域几个步骤整理相关研究。最后,梳理学科分类体系特点,以及在构建领域数据集、描述学科结构和学科标准化等方面的应用,指出目前各项研究中存在的问题和不足及未来可能的发展方向。[结果/结论]算法构建论文层次学科分类体系及其应用目前仍然是科学计量学的前沿问题。随着分类数据可获取性提高,论文层次学科分类体系的接受度和使用范围正在不断扩大。但依然存在以下主要问题,值得进一步研究:(1)由于缺少广泛认可的大范围的金标准数据,目前算法构建的论文层次分类体系的准确性还存有争论,相似度算法的优劣还未有统一结论;(2)以计算得到的关键词给聚类结果进行命名是目前的主要方式,但可读性较差,不利于使用者快速了解各类别内容;(3)在应用中与其他分类体系的比较研究还较少,没有充分揭示论文层次分类体系的特性。未来可在构建领域数据集、描...  相似文献   

2.
[目的/意义]金融科技包括的技术主题及范围边界并不清晰,使得“IPC分类号+关键词”的传统专利检索和分类方法效果不佳,需要针对跨领域专利数据的分类及识别流程进行研究。[方法/过程]构建了一套结合文本挖掘、层次聚类、置信学习和自然语言处理等技术的方法流程,能够直接从专利说明书中获取分类体系并形成相应分类模型。[结果/结论 ]提出一种构建跨领域专利分类体系及自动识别方法的流程框架,形成了较为全面、客观的金融科技专利技术分类体系,以及较为准确高效的分类模型,并对国内金融科技专利的发展情况进行了分析。[创新/局限]未来可基于Bert等大规模预训练模型的Prompt Tuning方法,进一步降低人工参与成本并提升效率。  相似文献   

3.
[目的/意义]作为科技创新的重要手段,技术融合预测对于改进技术研发的策略选择具有重要参考和借鉴意义,文章提出一种专利共类与深度学习模型结合的技术融合预测方法,以提高预测结果的准确性和可靠性。[方法/过程]以燃料电池技术为例,首先采用关联规则挖掘算法识别专利数据中具有强关联的IPC频繁项集,计算技术相对相似度,基于AP聚类算法进行技术聚类;然后运用生成式拓扑映射算法识别其中技术融合点,构建训练数据集和测试数据集。最后基于深度学习模型进行学习训练,预测燃料电池技术未来可能出现的技术融合。[结果/结论]这种方法在准确率和召回率上表现优异,可以快速、客观地识别技术融合,为技术创新的智能决策和预测提供支持和帮助。  相似文献   

4.
[目的/意义]围绕图书功用分类问题,提出开展图书功用自动化分类研究,并融合预训练和深度学习方法进行实现方案设计,为图书功用属性揭示和信息组织提供参考。[方法/过程]文章基于功用视角进行图书分类体系调研与数据验证,构建图书功用分类体系框架。在此基础上,融合BERT预训练模型和BiLSTM模型构建图书功用分类模型,并基于大规模数据集进行实验验证。[结果/结论]实验结果显示,模型的准确率达到0.89以上,召回率达到0.87以上,总体效果相对较好,能够较为准确地实现图书功用特征的提取。  相似文献   

5.
[研究目的]为提高人工分类效率,降低因分类人员主观知识结构和客观环境因素影响导致的分类错误率,本研究构建了基于层次分类器的专利文本分类模型。[研究方法]随机抽取A、D、E、H4个部中的4000条中文发明专利,以其名称和摘要数据为实验对象,通过文本预处理及文本特征表示后,基于KNN、支持向量机、Rocchio和朴素贝叶斯4种机器学习模型,分别探索IPC部、大类、小类和大组层次上的最佳分类模型及其组合。[研究结论]实验结果显示,层次结构可有效改善平面分类模型的性能,层次组合模型比层次单一模型拥有更高的分类准确率,各层次的最优分类模型分别是:支持向量机(部)、Rocchio+支持向量机(大类)、Rocchio+朴素贝叶斯+支持向量机(小类)、KNN+朴素贝叶斯+支持向量机+支持向量机(大组)。  相似文献   

6.
[目的]引入基于论文层次的学科分类体系,挖掘其在期刊学科布局分析中的潜力.[方法]采用典型案例对比分析的方式,对论文层次分类体系在期刊布局相关研究中的优势进行例证.[结果]在期刊学科分布分析中,论文层次分类体系可有效揭示综合性期刊和专业综合期刊的明显学科分布差异和侧重.在学科演化分析中,论文层次分类体系可以及时反映期刊...  相似文献   

7.
王凯 《现代情报》2021,41(1):39-49
[目的/意义] 构建基于用户兴趣标签的网络社团识别模型(Fuzzy Interests and User Hybrid Model,FIUHM),揭示用户兴趣与社团形式概念间的模糊层级关系,实现多粒度属性与社团拓扑结构的层次聚类。[方法/过程] 通过抽取豆瓣电影社区数据,实现基于用户标签的兴趣强度语义标注,利用用户相似度,获取社区用户间兴趣语义距离;将网络社区的领接矩阵映射为社团形式背景,构建社团模糊概念格,建立社团形式概念及其偏序关系集,完成社团形式概念建模;通过计算社团稳定指数,识别网络社团边界,并聚类最大独立社团,实现兴趣社团的在线检测。[结果/结论] 通过对比实验,验证了FIUHM模型的有效性,实验表明将模糊形式概念分析引入网络社团识别研究,利用模糊概念格的偏序关系建模用户节点间的兴趣相似度,有利于提高社团识别的分辨率。  相似文献   

8.
刘爱琴  安婷 《现代情报》2019,39(8):52-58
[目的/意义]面向非相关文献的知识关联能够促进新知识的产生,为科学研究提供了一种有效的辅助手段。[方法/过程]本文以《中国分类主题词表》为主题词受控词表,首先对文献摘要进行中文分词处理并提取主题词,利用计量分析技术和聚类技术分析文献间特征的相似、相异水平,然后基于该系统为用户检索并利用用TOP-K算法反馈用户精确结果。[结果/结论]设计了面向非相关文献的知识关联检索系统,从更细的粒度层面揭示文献之间的知识关联,为用户提供高质量的服务。  相似文献   

9.
王婧  武帅 《情报探索》2024,(2):1-11
[目的/意义]现有学科研究主题的梳理多为领域专家的定性分析和学科学者的文献梳理,一定程度会由于研究思维的局限性和获取知识的片面性造成学科研究主题误判,为有效避免漏判误判现象的发生,提出识别模型。[方法/过程]首先,运用传统LDA模型分析主题特征词;其次,结合上下文语义信息进行中文分词,形成学科主题词库;最后,结合隐含位置聚类算法发现潜在社区,提高主题识别效果。[结果/结论]提出的方法一定程度上优化了主题挖掘算法在识别短文本主题的效果,消除主观意愿。由计算机自行分类并实现科学研究前沿主题的预测,揭示前沿领域的研究热点,为致力于研究前沿学科的新兴学者提供参考价值。  相似文献   

10.
文奕  陈文杰  张鑫  杨宁  赵爽 《现代情报》2018,38(4):112-117
[目的/意义]专利信息是人类科学技术进步的结晶,随着社会的发展,专利信息将为促进科技创新发挥日益重要的作用。利用聚类技术可以将海量专利信息进行自动分类,在实现信息有序归并管理的同时,有助于用户高效而全面的获取相关技术领域中的集成专利信息,具有重要的现实意义,传统聚类研究方法效率与准确度存在不足。[方法/过程]本文通过对专利信息服务网站(中国科学院知识产权网)访问日志数据的清洗与分析,生成专利信息点击序列,基于深度学习词嵌入模型,设计了PatentFreq2Vec模型,计算得出专利关联信息。[结果/结论]利用PatentFreq2Vec模型分析计算访问日志数据,能够得到关联专利信息,实现专利聚类,且聚类准确度高于传统方法。  相似文献   

11.
[目的/意义]在阅读文献的过程中,研究流程是研究者需要特别关注的一个重要方面,自动识别学术文本中描述研究流程的段落对辅助文献阅读、学习研究设计等有着重要意义。[方法/过程]文章以自然语言处理领域为例,收集代表性会议论文构建数据集。分别基于传统机器学习模型、神经网络分类工具以及预训练语言模型构建分类器识别研究流程段落,然后对不同模型的分类效果进行评估,确定性能最优的模型。为进一步提升研究流程段落识别效果,在最优模型的基础上,基于ChatGPT进行了数据增强。[结果/结论]实验结果表明,在所有分类器中,SciBERT具有最好的研究流程段落识别效果。基于ChatGPT的数据增强可使SciBERT模型的分类性能进一步提高,最终准确率(Acc)和F1值分别达到了0.9414和0.9409。  相似文献   

12.
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。  相似文献   

13.
[目的/意义]本文探讨挖掘技术和应用间的关联关系,便于把握技术的目标应用场景和了解应用需求的可选技术方案,为技术转化提供基础。[方法/过程]首先,建立基于改进GloVe词向量的"技术——应用"发现模型,提出改进词向量的算法;然后,以机器学习技术为例,获取该领域学术论文文摘数据,预处理后建立训练文本集合,再使用改进GloVe模型训练获得词向量;最后,对词向量聚类获得"技术"和"应用"类词汇集,通过共现获得两者之间的关联并分析。[结果/结论]实验结果表明,本文改进GloVe模型后训练的词向量性能获得提升,聚类效果好,最终实现"技术——应用"的关联分析。  相似文献   

14.
[目的]客观分析中美医学期刊英文摘要中模糊限制语的使用情况,增加文章表述的准确性。[方法]使用王兰英自建的语料库,根据学者黎千驹提出的英语医学论文中模糊限制语的分类,对比分析5类模糊限制语在中美医学期刊英文摘要各个语步的使用频率、种类及分布情况。[结果]中美医学期刊英文摘要四语步中模糊限制语的分布趋势大体一致,但在使用类型和出现频率上存在显著差异。能愿范畴的模糊限制语的使用频率最高,它们集中分布在结论部分。美国医学期刊英文摘要中4类模糊限制语的使用频率明显高于中国期刊。[结论]在英文摘要写作中,中国作者应该恰当地使用多种类型的模糊限制语来增强表述的准确性,以便更好地得到读者的认可。  相似文献   

15.
张晓丹 《情报杂志》2021,(1):184-188
[目的/意义]随着互联网数字资源的剧增,如何从海量数据中挖掘出有价值的信息成为数据挖掘领域研究的热点问题。文本大数据分类是这一领域的关键问题之一。随着深度学习的发展,使得基于深度学习的文本大数据分类成为可能。[方法/过程]针对近年来出现的图神经网络文本分类效率低的问题,提出改进的方法。利用文本、句子及关键词构建拓扑关系图和拓扑关系矩阵,利用马尔科夫链采样算法对每一层的节点进行采样,再利用多级降维方法实现特征降维,最后采用归纳式推理的方式实现文本分类。[结果/结论]为了测试该文所提方法的性能,利用常用的公用语料库和自行构建的NSTL科技期刊文献语料库对本文提出的方法进行实验,与当前常用的文本分类模型进行准确率和推理时间的比较。实验结果表明,所提出的方法可在保证文本及文献大数据分类准确率的前提下,有效提高分类的效率。  相似文献   

16.
[目的/意义]当前学科领域主题演化与预测研究文献快速增长,适时开展国内外最新研究的梳理与述评,助力研究的价值提升。[方法/过程]首先,归纳现有研究理论基础,构建研究总体框架图;其次,依据研究的内在知识逻辑,刻画了主题演化与主题预测的方法路径;最后,在剖析研究价值的基础上,提出未来研究建议。[结果/结论]后续研究需加强科学演化模型、演化扩散理论以及科学—技术关联模型的完善与应用,积极使用深度语言模型以及深度学习算法以提升主题预测的准确性,同时在宏观、中观以及微观三个层面丰富研究对象颗粒度,并注重研究的科技情报实效。  相似文献   

17.
科技期刊选订中基于离差最大化的组合评价方法   总被引:3,自引:0,他引:3  
如何科学地选订科技期刊是一个值得深入研究的课题。这是由于各类高校图书馆都面临着科技期刊种类增加、价格上涨、资金短缺等问题。实际上科技期刊选订是一个综合评价问题 ,文献 [1]对此作了些研究 ,它利用了层次分析法 (AHP法 )得出了评价结果。然而层次分析法确定多指标的权系数属于主观赋权法 ,主观赋权法的随意性较大 ,评价结果准确性稍差一些。文献 [2 ]提出的灰色聚类决策法需要确定评价期刊的 4个指标的权系数 ,权系数的计算还是利用了文献 [1]中的层次分析法。在综合评价中 ,目前多目标权系数确定方法除了主观赋权方法 ,还有客…  相似文献   

18.
姜春林  郭琪琴  张光耀 《情报杂志》2022,41(2):198-206,封3
[研究目的]科学合理的人文社科学术著作评价指标体系能够为优秀成果评选、职称评定、项目评审及人才评价等学术评价活动提供理论依据与方法参考。[研究方法]以高等学校科学研究优秀成果奖(人文社会科学)第3届至第7届获著作奖的27个学科的2175本著作为对象,做指标特征分析。综合考虑各项原则,遴选出5个一级、11个二级、28个三级评价指标,并进行学科分类。使用专家调查法、层次分析法、熵权法确定不同学科分类指标权重,完成评价指标体系的构建。以申报第8届高等学校科学研究优秀成果奖(人文社会科学)中的人文类、社科类和综合类的577本著作为实验数据,对指标体系进行了实证验证。[研究结论]哲学、社会学实证结果与实际获奖情况比较一致,管理学则与实际获奖相关性不高。从学科属性、数据源等方面分析了原因,提出应加强书评数据库建设和著作全文本分析的建议。  相似文献   

19.
[目的/意义]学术论文评价是科研评价的基础,是科研管理和评价的刚需。目前基于引文和论文内容视角构建的论文评价模型效果仍有提升的空间。[方法/过程]首先,利用复杂网络分析法,从文献相似性网络的节点属性构建论文重要性评价模型,探讨从文献网络的角度评价论文质量的可行性。其次,选择8个医学相关学科,下载数据形成8个文献数据集,根据论文被Faculty Opinions数据库收录的情况,事先标记为重要论文和普通论文。再次,从论文的主题词、题目摘要和参考文献3种信息源分别构建基于医学主题词表树状结构、Doc2Vec算法和文献耦合的3种文献相似性网络,并对每一种文献相似性网络,利用复杂网络分析方法对网络中的节点进行特征计算,选择具有统计学差异的节点属性指标作为区别两类论文的评价指标。最后,采用4种机器学习算法对数据集中的论文进行二分类学习,构建并评估论文重要性评价模型。[结果/结论]基于文献网络进行论文评价的方法是可行的,3种文献网络构建算法效果差异较小,语义相似性文献网络和文献耦合两种算法略优于基于Doc2Vec的算法。BP神经网络算法在基于文献网络构建的论文重要性评价模型中性能最好。  相似文献   

20.
【目的/意义】对比分析不同学科分类体系下的学科结构,研究学科分类体系对学科结构画像的影响。【方法/过程】以国内42所双一流建设高校为例,对比分析WOS、ESI、SCADC2和CT2四种分类体系下同一年度机构间和同一机构年度间的学科均衡度和学科结构相似度的一致性和差异度。【结果/结论】在学科均衡度方面,不同学科分类体系下的机构学科均衡性具有一定的一致性,其中WOS、ESI和CT2三种分类体系下的一致性较高;根据不同分类体系得到的高校学科均衡性可能存在截然相反的发展趋势。在学科结构相似度方面,四种分类体系虽粒度不同,但基于学科结构相似性得到的高校聚类结果具有较高的一致性,均能较好反映不同类型高校的学科结构特征;但是在反映年度间学科结构变化方面,细粒度的学科分类体系能起到更好的揭示作用。【创新/局限】需要使用更多的指标,在更多的层面进行对比分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号