首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
以学前综合教育资源分类为例,联合使用规则和Rocchio两种分类方法,利用建立的新闻规则库识别新闻资源并标注,然后采用Rocchio分类器对剩余资源进行分类.实验结果表明:基于规则和Rocchio分类器的综合分类策略能大大提高综合性资源的分类效果.  相似文献   

2.
根据互信息、RBF神经网络和关联规则原理,提出了一种抽取WEB文本分类规则的新方法。先根据互信息选择和各类相关程度大的若干词条,然后采用RBF神经网络方法对选择的特征进行进一步提取,得到维数较小的文本特征向量空间。之后再根据挖掘出的关联规则获取WEB文本分类规则,建立文本分类器,在保证了分类精度的前提下抽取出利于理解的文本分类规则。  相似文献   

3.
探讨一种新的文档分类方法——基于本体的规则分类法。该方法首先根据分类体系建立每个类的本体,然后根据本体和规则对网页的主要标记信息进行分类。实验表明,这种方法比Rocchio分类法查全率略低,但查准率较高。  相似文献   

4.
文本情感分析作为自然语言处理领域的一个重要分支,被广泛运用于舆情分析和内容推荐等领域,近年来成为研究的热点。提出基于语法规则和自注意力机制的GCN情感分析方法。首先,使用Glo Ve预训练模型与Bi LSTM模型提取文本的语义特征,并采用spa Cy工具对文本进行句法依存分析,从而提取文本的语法规则。其次,引入自注意力机制,并依据语义特征与语法规则构建GCN模型。最后,采用全连接层和Softmax分类器进行情感分类。实验结果表明,该方法与相关基线模型相比,在Twitter数据集上的准确率和宏F1值分别得到了提升,具有较好的情感分类性能。  相似文献   

5.
基于带语义差别的模糊Taxonomy的交易数据库关联规则聚类   总被引:1,自引:0,他引:1  
关联规则聚类是大量关联规则的一种有效组织方式,本文针对基于商品分类信息的规则聚类方法存在的不足进行了改进,同时考虑了不同层次间的项目语义差别,以及具有不同隶属度的项目细致语义差别,将商品分类树改进为模糊Taxonomy的有向无环图结构,该结构可以处理一个项目同时属于多个父结点的情况.我们充分考虑了有向无环图的性质,提出了带细致语义差别的模糊Taxonomy结构构建方法和相应的规则距离计算方法,其中,规则距离计算过程中的项集距离计算方法无需计算最佳匹配,因此,具有较小的时间开销.规则距离计算和聚类可视化试验结果表明了该方法的可扩展性和有效性,在规则的聚类计算上取得了较为满意的结果.  相似文献   

6.
张文宇 《情报学报》2008,27(1):30-34
利用信息系统描述数据集合时会出现数据的不相容现象,为了对信息表中的不相容数据进行较为精确的数据约减,本文针对信息系统的不相容特性,提出了利用广义归纳表及粗糙集理论的有效结合对分类规则进行有效提取的策略.为此首先简单介绍了数据挖掘过程中的数据不相容性问题及广义归纳表的基本构成,然后利用基于广义归纳表与粗糙集的规则发现原理,给出了规则强度的表达方式及其各影响参数的描述.并且,进一步描述了RS与GDT结合进行分类规则提取的实现过程,归纳了静态与动态增量式数据库的规则发现算法,并用算例进行了说明.最后给出了应用此方法进行增量式数据挖掘的实际例子.实验结果表明,用此方法挖掘出的规则简练且合理可靠.  相似文献   

7.
基于统计的自动分类是网页层次分类中常用的技术,但其有不足之处,主要表现为当子类之间出现严重的特征交叉现象时,分类精确率将大大下降。而网页层次分类的本质决定了同一大类下的子类存在许多相同的特征。针对这一局限性,结合基于规则的自动分类技术的优点,提出一种基于统计-规则方法的网页层次分类技术。实验表明,基于统计-规则方法的网页层次分类技术能够获得比较理想的分类效果。  相似文献   

8.
针对面向结构特性的科技文献分类问题,通过关联规则的分类方法将科技文献划分为不同的类型:综述型、理论型和应用型。首先对科技文献数据分词等进行预处理;然后通过PredictiveApriori关联算法挖掘关于类别特征项的频繁项集,构造科技文献分类的分类器;接着对分类科技文献进行分类规则匹配,判定所属类别;最后通过实验对分类性能进行评估,并通过对比证明了本方法的有效性。  相似文献   

9.
以中小学简介信息分类为例,在分析该类数据特征项少、权重不均等特点的基础上,采用去噪处理、基于模糊集的同义处理等策略构建类别特征库,并以特征库为依据,使用模糊规则构建分类模型,实现对短文本数据的分类。实验结果表明:对于类别特征项较少、权值分布不均的短文本分类,模糊规则分类优于VSM、Rocchio等分类算法。  相似文献   

10.
文本分类是信息检索与数据挖掘领域的研究热点,近年来得到了广泛的关注和快速的发展.根据免疫否定选择原理,设计了基于掩码分段匹配的否定选择分类器,用于实现文本匹配选择分类,克服传统否定选择分类方法对大样本空间分类效果不好的缺点.给出了适用于免疫优化的分类规则编码及分类信息分的评价标准,避免了传统分类算法缺乏全局优化能力的缺点,提高了对样本的识别能力,同时提高了文本数据分类的精确度,采用统计显著性检验本文方法的有效性及优越性.  相似文献   

11.
本文提出基于粗糙集和SVM的入侵检测算法。首先预处理训练集,再用粗糙集方法对数据集约简,然后采用两个两类SVM分类器实现对DoS和probing两类攻击检测,最后送入C4.5规则库匹配处理,实现对U2R和R2L攻击的检测。  相似文献   

12.
学术论文高质量多标签自动分类是推动学术研究发展的关键程序之一。本研究利用Stacking模型将随机森林、支持向量机、极限树、极端梯度提升和神经网络五个分类器融合为一个异质集成分类器,并利用基于问题转换思想的多二分类模型将该分类器应用于学术论文多标签分类。根据学术论文的特点,依次实现了与之配套的论文特征提取模块、TF IDF加权模块、数据预处理模块,最终构建成一个面向学术论文的多标签分类系统。仿真实验验证了本研究构建的学术论文多标签分类系统在处理学术论文多标签分类问题时,较传统的单模型分类器或同质集成模型分类器在泛化能力、稳定性与准确率方面都有一定程度的提升。图9。参考文献21。  相似文献   

13.
作为一种有效地分类方法,多目标线性规划已经被广泛应用到商业问题中.针对以数学模型表示的分类结果解释性差的问题,本文研究从线形规划分类模型中提取易于理解的分类规则的方法,打开MCLP分类模型的"黑箱".并利用粗糙集理论对MCLP分类模型不能区分的不确定区域进行表示和规则提取,提出了基于粗糙集的MCLP分类模型知识提取方法和算法.实验结果表明,该方法能够从分类结果中提取易于理解的规则并提高了MCLP的分类准确度.  相似文献   

14.
李兆明 《浙江档案》2005,(10):26-26
以简易操作为特点的<归档文件整理规则>(以下简称<规则>),应当有简易的分类方法与之相适应.在<规则>实施之前,笔者就已经采用了简易职能分类方法进行归档文件分类.三年的实践证明,职能简易分类是归档文件整理最适宜的分类方法.  相似文献   

15.
文本分类是文本挖掘的基础和核心。构建一个分类准确而且稳定的文本分类器是文本分类的关键,很多学者提出了不同的文本分类器模型和算法。在现有的分类器评估方法中,关心的只是分类准确率,而对稳定性这个重要的评价标准却没有涉及。本文提出使用开放测试和封闭测试的准确性指标的比值作为衡量文本分类器稳定性的评估标准。通过文献数据验证以及在所建构的贝叶斯分类器实验平台MBNC上进行的检验表明,用这种标准评价文本分类器具有其合理性。  相似文献   

16.
在对目前各种作者重名消解方法进行总结的基础上, 针对中文文献题录数据特征, 将重名消解问题转换为同名作者文献的分类问题, 提出一种基于规则和相似度的重名消解框架模型, 并对其中的分解规则和合并规则进行详细的算法描述, 最后选取3个学科的重名作者数据集进行实验, 实验结果表明该模型能有效提高作者重名消解的准确率.  相似文献   

17.
所谓图像自动分类是指利用图像自动分类器把待分类的图像分配到预定义的图像类的过程。用于图像自动分类的方法有多种。其中K近邻算法是一种基于实例学习的方法,是一种较理想的自动分类器。本文在它的基础上提出了图像自动分类模型,整个图像自动分类过程包括图像预处理、特征表示、机器学习和图像分类4个步骤。表1。图1。参考文献13。  相似文献   

18.
RDA对丛书的分类标引有两大启示,一是最大限度地满足用户需求,二是分类规则应持续不断地修订。因此,为提供准确的学科聚类,图书馆在分类标引执业资格考试类丛书时应根据其各单本的学科专业属性是否一致来决定分类方式,如果不一致选择分散归类,如果一致选择集中归类。  相似文献   

19.
以简易操作为特点的《归档件整理规则》(以下简称《规则》),应当有简易的分类方法与之相适应。笔在实施《规则》之前,就已经产生了运用简易职能分类方法进行归档件分类,使归档件整理更加简便的工作方案,之后经过三年的实践证明,按职能简易分类是归档件整理最适宜的分类方法。  相似文献   

20.
数据挖掘技术在图书馆读者分析中的应用   总被引:6,自引:0,他引:6  
钱强  李英 《图书情报工作》2009,53(12):121-124
使用SOM聚类方法对上海某大学图书馆数据库中的借阅数据进行挖掘分析,对读者进行聚类,用关联规则挖掘方法对某类读者的计算机类图书借阅记录进行挖掘,分析对每一类读者的借阅特征,以找出其借书规则,从而为图书馆管理提出建议。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号