排序方式: 共有9条查询结果,搜索用时 15 毫秒
1
1.
文本分类中粗分类数据噪声修正的网络算法 总被引:1,自引:1,他引:0
在文本分类的实际应用中经常使用粗略分类的数据来训练分类器,但是这种数据中经常会包含类别标记有误的数据,这些数据对文本分类结果的精度会造成不良影响。本文针对这个问题提出了一种噪声修正算法,首先建立文档关联网络,把文档上标记的类别作为在网络上划分的集团结构,并用模块度衡量集团结构的质量,通过优化模块度指标把噪声数据调整到合适的类别中,从而提高数据质量。实验结果表明,本文所提算法能够有效修正粗分类数据中的噪声,且有较高的有效性和鲁棒性。该算法可以用于文本分类训练数据的预处理,或作为辅助技术用于文献库建设等工作。 相似文献
2.
训练数据中的噪声数据对文本分类结果的精度会造成不良影响,本文提出了一种对噪声数据进行修正的快速算法.针对以前的算法,每次迭代只对一个文档进行修正,迭代次数与噪声数据数量相当,算法运行效率较低的问题,本文通过分析调整文档所属类别对评价指标的影响,提出依据模块度变化量判断噪声数据,一次迭代过程中可以对多个文档进行修正处理,从而提高算法效率.实验结果表明,本文所提算法能够更快地修正粗分类数据中的噪声,算法复杂度从以前算法的O(Tnm2)降低为O(Tnm).该算法可以用于对大数据量数据进行处理,实用价值更高. 相似文献
3.
4.
5.
针对作为中文信息处理基础的抽词问题,本文在作者提出的正向串频最大匹配法(MMFS)的基础上,提出了逆向串频最大匹配法(RMMFS)及双向串频最大匹配法(BMMFS)。这两种方法分别采用逆向和双向长串优先与串频统计的思路,并引进规则和支持度指标筛选,不需要词典,不需要事先进行语料库学习,不需要建立字索引,通过串匹配获取中文文本中的汉字共现模式,实时地抽取出包含专业术语及专有名词等未登录词在内的专指语义串、短语和词。实验研究了抽词准确率受规则的影响及随文本大小和词频变化的分布,结果表明BMMFS可以取得更好的抽词效果。 相似文献
6.
知识交流与传播是组织获取知识,提高自身知识存量及知识竞争优势的重要手段之一,越来越受到知识管理者的重视。因此,本文立足于组织内个体之间的知识获取与互传播,考虑个体不同的学习态度将个体分为主动学习和被动学习两类,并将个体知识表示为一个多维知识向量,个体在知识交流过程中相互影响会产生学习态度、行为及知识存量的改变,在此基础上,建立了基于状态更新和知识传播双层规则的元胞自动机知识传播模型,模拟分析了邻域结构及初始主动学习率对组织内个体知识传播行为的影响,并对模型中加入人员移动和专家引进机制的情形进行了模拟研究。研究发现,组织内人员微观层次上的局部交互行为在宏观上表现出自组织的复杂特性;Moore邻域结构更有利于组织内个体间的知识交流与传播;组织平均知识存量的增长速度随着初始主动学习率的提高而加快;人员移动和专家机制的引入能够提高组织内部知识传播的效率和知识存量;此外还发现组织平均知识存量的增长速度与人员的自主学习能力成正相关。 相似文献
7.
科研合作网中节点重要性评价方法及实证研究 总被引:1,自引:0,他引:1
科研人员的学术评价问题可以建模为科研合作网络中节点重要性的测度问题。用学术期刊论文的作者信息构建了作者科研合作网络,在此基础上,通过计算网络中节点的权值来评价作者的学术贡献,通过计算与该节点相连的边的权值来评价作者的科研产出能力,最后通过对节点和边的综合考察来判断节点的重要性。实证分析表明,用所提方法进行节点重要性测度,即对科研人员进行学术评价,结果符合实际情况。 相似文献
8.
针对科研合作网络演化建模的基于Agent实验平台原型 总被引:1,自引:0,他引:1
科研合作网络是近年来复杂网络研究的热点问题之一,但当前关于科研合作网络动态演化问题的研究还很不充分,特别是把网络演化和网络中知识创造与传播问题结合起来的研究还鲜见报道.本文在分析Guimera等人提出的一个基于团队组合的科研合作网络演化模型的基础上,提出一个综合网络演化和网络中知识传播的动态网络建模框架暨元模型.进而,以所提出的元模型为依托,开发了一个计算机仿真实验平台原型,以辅助采用基于Agent建模范式的科研合作网络演化和知识传播研究.通过若干建模试验,初步验证了所提出的元模型和相应的实验平台原型的有效性. 相似文献
9.
针对当前主流语义Web服务匹配方法过分强调服务请求与服务广告的精确匹配从而导致用户在实际中难以获得真正所需要的Web服务、或在服务自动发现与集成任务中计算负荷过大的问题,本文把基于本体的概念语义相关性度量模型引入Web服务匹配,提出一个新的更"轻便"的语义Web服务匹配模型.该模型使用一系列概念组分别描述服务的服务类别、输入、输出、前提、效果等诸方面的语义信息,在此基础上通过基于本体的概念组之间的相关性度量模型分别评价服务请求与服务描述在这些方面的语义匹配度.总体语义匹配度被定义为输入、输出、前提、效果方面的语义匹配度的加权和.基于这一匹配模型,本文进而研究了相应的服务匹配器原型.初步的数据试验表明,本文所提模型能较好地适应用户需求表述的模糊性,从而提高服务匹配的召回率;从计算复杂性看,本文所提模型也优于基于严格逻辑推理的语义Web服务匹配模型. 相似文献
1