首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 499 毫秒
1.
黄山 《信息系统工程》2012,(12):150-151,155
属性约简是粗糙集理论的核心内容之一。目前,从不同的观点已经提出了一些不完备决策表中粗糙集属性约简算法。但是,这些算法相对于完备决策表还是有待进一步考虑。为此,本文借助于完备决策表中冲突域的概念,设计一种在不完备决策表中的新的属性约简方法。该方法通过计算数据粒化后,冲突域中冲突对象的数目为衡量标准来判断某些属性集是否为属性约简。并且,通过理论证明了基于冲突域所求出的属性约简与基于正区域属性约简的是一致的。最后,通过仿真实验说明该算法是可行的。  相似文献   

2.
杂合VPRS与PNN的知识发现方法   总被引:3,自引:0,他引:3  
菅利荣  刘思峰 《情报学报》2005,24(4):426-432
本文提出一种变精度粗糙集(Variableprecisionroughsets,VPRS)与概率神经网络(ProbabilisticNeuralNetwork,PNN)杂合的方法。变精度粗糙集对噪声数据有一定的相容性,给定置信阈值β,通过变精度粗糙集模型将信息系统中的冗余属性排除,求出一个最小的知识表示,由此可以约简神经网络的输入。由于概率神经网络的分类及泛化能力较强,接下来应用概率神经网络建立的模型进行分类、预测。实验表明,变精度粗糙集与概率神经网络杂合方法的分类及预测精度均较高。该方法可用于从模糊的、冗余的、不完备的且有噪声的大型数据库中发现知识。  相似文献   

3.
结合粗糙集的属性约简和RBF神经网络的分类机理,提出一种新的文本分类混合算法。试验结果表明,与朴素贝叶斯、SVM、kNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本。  相似文献   

4.
基于粗集理论和神经网络结合的数据挖掘新方法   总被引:13,自引:1,他引:12  
李仁璞  王正欧 《情报学报》2002,21(6):674-679
本文提出了一种基于粗集理论和神经网络的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简 ,然后使用神经网络对数据进行学习和预测 ,并同时完成属性的不一致约简 ,最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明 ,该方法快速有效 ,生成规则简单准确 ,具有良好的鲁棒性。  相似文献   

5.
随着计算机的普及与快速发展,如何通过在批量数据中提取有效规则实现机器智能分类与推理,提高知识推理的有效性与准确率,成为当前知识服务领域的难题之一.文章基于本体(Ontology)的知识组织方式和粗糙集(Rough Set)理论的知识获取技术,针对批量数据的规则提取实现知识推理,提出知识推理模型ORSKM.ORSKM模型利用九元组构建领域本体,实现实例数据的语义化描述;从领域本体的属性中提取粗糙集的决策表,由决策表对领域本体关系进行领域知识知识库归约,获取领域知识相关的属性规则;通过粗糙集知识推理算法实现知识获取,最后通过实验对该知识推理模型进行验证.  相似文献   

6.
粗糙集理论中的属性约简问题属于NP难问题,文章以淮北师范大学教育技术学专业读者在2013学年度的图书借阅历史数据为研究对象,采用借阅类目的次数多少作为属性重要度进行启发式选择,利用粗糙集理论中的知识依赖度对类目约简,挖掘出该专业各年级和该专业借阅类目的核心集。经问卷调查证明其规律的正确性,据此结论进行个性化推送服务具有很强的针对性和很高的命中率。  相似文献   

7.
信息系统中一种面向粗糙集的数据挖掘方法   总被引:17,自引:2,他引:15  
程岩  黄梯云 《情报学报》2001,20(1):90-99
数据挖掘技术是信息系统的一个重要研究内容 ,它可以从大量数据中自动发现对决策有帮助的知识。许多数据挖掘技术仅仅适用于精确集 ,不适用于粗糙集 ,而现实中粗糙集是普遍存在的现象 ,因此开发出一种面向粗糙集的数据挖掘技术在信息系统的研究领域具有重要意义。本文结合粗糙集理论提出了一个信息系统的粗糙集模型 ,在此基础上设计出一个属性约简方法及从粗糙集中发现规则的算法 :Apriori_2。  相似文献   

8.
基于模糊属性集的粗糙近似精度数据挖掘策略   总被引:1,自引:0,他引:1  
为了提高信息系统的分类质量,探讨了一种在数据仓库中基于模糊属性集的粗糙逼近近似度量的数据挖掘策略.首先在决策表中给出了模糊属性集的原子概念表示及其对象的描述;再根据原子概念的特征构造了模糊属性集的粗糙上下近似表述;然后利用模糊属性重要性度量的概念,提出了利用逼近精度近似度量的数据挖掘方法进行模糊属性约减;最后应用算例说明如何在决策表中发现分类规则.实验结果表明此方法挖掘出的规则简练且合理可靠.  相似文献   

9.
多范畴信息系统的自动分类方法研究   总被引:1,自引:0,他引:1  
为解决传统自动分类方法中的多范畴信息处理能力弱的问题,本文提出了一种基于多范畴属性约简和复合相似度计算的多范畴信息自动分类方法,该方法首先在分类中引入决策属性,然后计算各范畴的决策类和广义决策类,获得多范畴分类属性的约简集族,并依此集族分别计算多范畴信息系统分类对象的复合相似度,依据复合相似度的计算结果对分类对象进行排序和标引,实现自动分类。此方法有效地解决了多范畴不完备信息系统的自动分类问题,通过与Google自建系统的对比分析可知建立在此方法基础之上的多范畴信息分类系统在查全率和查准率方面明显优于传统的自动分类系统。  相似文献   

10.
一种混合文本分类方法研究   总被引:1,自引:0,他引:1  
文本自动分类是信息检索领域的一个重要研究方向。一些标准的机器学习算法像支持向量机已经成功地运用到了这一领域。不幸的是高维的输入向量严重的影响了分类速度,而支持向量机核函数参数的确定影响到分类的精度。为了提高分类精度和分类速度,本文提出了一种混合分类算法,首先用粗糙集理论对向量进行约简,然后采用基因算法对支持向量机的核函数参数进行优化。实验证明我们提出的算法是有效的。  相似文献   

11.
王兴兰  宋文 《图书情报工作》2014,58(24):106-112
指出大数据时代的到来使自动分类再次受到人们的关注.总结现有的自动分类方法,介绍中国科学院文献情报中心的KOS引擎项目中的集成知识组织体系.在此基础上,改进BP神经网络算法,提出N-IKOS自动分类模型.最后,通过实验检验基于N-IKOS分类的准确性,通过基于BP神经网络的分类实验、基于KOS引擎的分类实验和基于N-IKOS的分类实验比较新模型在自动分类中的优劣.实验结果表明:该研究改进了原有的KOS引擎分类,可为自动分类领域提供新的思路.  相似文献   

12.
运用遥感手段精确监测马铃薯种植面积是稳固马铃薯主粮化政策、维护国家粮食安全的必要保障。本文以 吉林省长春市九台区纪家镇、兴隆镇为研究区,选用landsat8 OLI遥感数据,借助ENVI平台构建了基于BP神经网络的 土地覆盖分类模型,应用于研究区的马铃薯等作物分类研究。以landsat8 OLI7个彩色波段作为输入,不断调节分类参 数,最终确定了最优分类网络结构。结果显示,BP神经网络法马铃薯的分类生产者精度为94.22%。研究表明,BP神经 网络分类方法是一种手段灵活、结果较准确的马铃薯遥感识别方法。  相似文献   

13.
[目的/意义]微博评论情感分类模型可以为相关舆情监管部门正确管控话题事件的发展状况和舆情提供一定的指导作用。[方法/过程]基于字词向量的多尺度卷积神经网络,运用多尺度卷积核改善微博评论中上下文信息有限的条件制约,构建基于字词向量的多尺度卷积神经网络微博评论情感分类模型;通过爬取"微博热搜整改"数据,对模型的可行性和优越性进行验证。[结果/结论]验证结果表明基于字词向量的多尺度卷积神经网络在微博舆情等上下文信息有限的短文本分类任务中表现良好。本文在理论层面为微博舆情情感分类提供了更为准确的情感分类理论模型及分类方法,在实践层面可以更好地指导舆情监管部门对舆情的情感倾向进行更好的引导和监管。  相似文献   

14.
[目的/意义]学术社交网络所提供的问答服务已成为学者们快速获取学术信息、解决学术问题的重要途径,实现基于机器学习的问答质量智能评价和服务优化对学术社交网络中优质内容传播具有重要意义。[方法/过程]以ResearchGate问答服务为研究对象,从结构化特征、内容特征、其他特征以及回答者特征4个维度构建答案质量评价体系,利用机器学习方法和数据增强技术进行答案质量分类预测。[结果/结论]SMOTE算法在处理不平衡样本时具备有效性;支持向量机在单一模型预测中,取得出色的分类效果;组合模型使预测精度得到进一步提升,基于随机森林、支持向量机、BP神经网络构建的组合模型分类性能最佳,以此为基础可通过搭建问答质量智能评价系统实现学术社交网络问答服务优化。  相似文献   

15.
根据互信息、RBF神经网络和关联规则原理,提出了一种抽取WEB文本分类规则的新方法。先根据互信息选择和各类相关程度大的若干词条,然后采用RBF神经网络方法对选择的特征进行进一步提取,得到维数较小的文本特征向量空间。之后再根据挖掘出的关联规则获取WEB文本分类规则,建立文本分类器,在保证了分类精度的前提下抽取出利于理解的文本分类规则。  相似文献   

16.
首先提出一种基于模糊向量空间模型和径向基函数网络的文本自动分类方法,该网络由输入层、隐层和输出层组成 :输入层完成分类样本的输入,隐层提取输入样本所隐含的模式特征,将分类结果在输出层表现出来 ;其次,构造更详细的算法推导及实施方案 ;最后,以中国期刊网全文数据库部分文档数据为例,对该方法的有效性进行验证,结果表明该方法分类效果较好。  相似文献   

17.
Text Categorization (TC) is the automated assignment of text documents to predefined categories based on document contents. TC has been an application for many learning approaches, which prove effective. Nevertheless, TC provides many challenges to machine learning. In this paper, we suggest, for text categorization, the integration of external WordNet lexical information to supplement training data for a semi-supervised clustering algorithm which can learn from both training and test documents to classify new unseen documents. This algorithm is the Semi-Supervised Fuzzy c-Means (ssFCM). Our experiments use Reuters 21578 database and consist of binary classifications for categories selected from the 115 TOPICS classes of the Reuters collection. Using the Vector Space Model, each document is represented by its original feature vector augmented with external feature vector generated using WordNet. We verify experimentally that the integration of WordNet helps ssFCM improve its performance, effectively addresses the classification of documents into categories with few training documents and does not interfere with the use of training data.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号