排序方式: 共有74条查询结果,搜索用时 578 毫秒
41.
基于条件随机场的自动标引模型研究 总被引:3,自引:1,他引:2
条件随机场(Conditional Random Fields,CRF)模型是一种概率图模型.为了有效利用标引对象的特征,并考虑到抽词标引可以转换为序列标注问题,本文提出基于条件随机场的自动抽词标引模型.实验结果表明,该模型在改善抽词标引的性能方面,要优于支持向量机、多元线性回归模型等其他机器学习方法,是到目前为止解决序列标注问题的最好方法.但是,该模型本身还不能解决由于样本中存在同义词和相近词带来的问题,需要进一步对训练集和标引过程中存在的词汇语义情况进行考虑,提高标引的质量. 相似文献
42.
[目的/意义]识别学术论文同行评审意见类型、分析不同被引频次下同行评审意见类型在同行评审报告中的分布情况,有助于加深对同行评议机制的认识,为评估论文学术质量、量化评审专家贡献提供新思路。[方法/过程]首先,将同行评审意见类型划分为正面评价、负面评价、要求/建议(主、次要方面)、问题/疑问、陈述六个类别,经人工标注、获取训练、测试语料后,对比分析传统机器学习模型、深度学习模型在同行评审意见类型自动识别上的效果;其次,将同行评审报告涉及的学术论文进行主题聚类,进而对被引频次进行标准化处理;最后,使用Spearman相关系数、累积分布、K-S检验、负二项回归分析不同被引频次学术论文对应的同行评审报告中同行评审意见类型的分布情况。[结果/结论]SciBert模型识别效果最佳;在基于Spearman的相关性分析中,评审报告中正面评价的分布占比与被引频次具有显著的弱正相关,负面评价的分布占比与被引频次具有显著的弱负相关;通过累计分布发现,多数情况下,当累积概率相同时,高被引分区中正面评价的分布占比大于低被引分区、负面评价的分布占比小于低被引分区,K-S检验能够检测到这种差异;在负二项回归分析中,正面评价分布占比、负面评价分布占比分别对被引频次有显著的正向影响、负向影响。研究结果表明,同行评审报告中正面评价、负面评价的分布情况与其对应论文的被引频次存在相关性,被引频次一定程度上能够反映论文的学术质量。 相似文献
43.
基于集成学习的自动标引方法研究 总被引:1,自引:0,他引:1
目前大多数自动标引方法不能有效利用文本中包含的多个特征.而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取.同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量.为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引.实验结果表明基于集成学习方法的自动标引能提高标引结果的查准率和召回率.另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果. 相似文献
44.
基于主题聚类的学科研究热点及其趋势监测方法 总被引:1,自引:1,他引:0
常规的学科热点及趋势监测方法存在监测成本高、监测信息相对滞后等问题.因此需要寻求较低成本、较快速的方法进行学科热点和趋势的监测,以保证监测系统提供信息的时效性.本文以图书情报档案学科为例,依据学科学术论文全文,从主题角度对学术论文集合进行全面分析,即:采用主题聚类方法,对包括时间信息的学科学术全文进行主题分析与主题聚类,归纳出某一特定学科的研究热点和这些热点的发展趋势.实验结果表明,基于主题聚类的学科热点及其趋势监测方法,其监测结果在很大程度上接近于常规方法的监测结果,但基于主题聚类的监测方法,在监测成本和监测信息时效方面得到改善. 相似文献
45.
认为处于多维社会网络中的用户会表现出多种行为取向和兴趣爱好,单独使用多维网络中的一维很难进行有效的社区发现。为了有效解决以上问题,首先基于用户关系紧密度将社交媒体中有向网转化为无向带权网,并将所有一维社交网络进行集成;然后利用SSN-LDA对社交用户进行隐含社区建模,以根据用户-隐含社区概率分布计算用户相似度;最后使用二分K均值进行用户社区划分。在真实科学网博客上进行试验,结果表明该方法能较好地进行用户社区划分。 相似文献
46.
传统的文献计量学主要基于题录数据展开研究,随着开放获取运动的推进,基于全文数据的文献计量学分析悄然兴起,出现全文引文分析、知识实体抽取、语篇结构功能分析等研究热点。文章从数据基础、研究内容、流程方法3个角度系统阐述全文计量分析的范式和框架。在数据方面,通过回顾分析对象从题录数据到全文数据的变化,展现文献计量学由外在关联到内在本体的演化。在内容方面,选取语词、语句和语篇等不同层面的研究热点,对近年该领域的国内外研究进展和前沿问题进行综述。在方法方面,总结文本分析(包括计算语言学、社会语言学)和计量分析(包括加权分析、序列分析)两类主要的分析范式。 相似文献
47.
48.
对当前信息检索系统存在的问题进行分析,明确智能信息检索迫切需要解决的问题;在对现有的智能信息检索模型比较分析的基础上,提出基于知识空间的智能信息检索模型——知识空间模型,并描述基于知识空间的智能信息检索模型的框架、体系结构及其中若干关键问题。 相似文献
49.
基于CSSCI的期刊知识地图的构建 总被引:1,自引:0,他引:1
系统介绍知识地图的主客体,知识地图的构建原则以及构建流程等相关概念,分析期刊知识地图的构建,并以CSSCI(管理学 2006)数据为基础,构建期刊知识地图的实例。 相似文献
50.