期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王效岳白如江《情报学报》2006,25(4):475-480

结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法。首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类。这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点。试验结果表明,与朴素贝叶斯、SVM、KNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本。相似文献

2.

不完备决策表冲突域的属性约简算法

黄山《信息系统工程》2012,(12):150-151,155

属性约简是粗糙集理论的核心内容之一。目前,从不同的观点已经提出了一些不完备决策表中粗糙集属性约简算法。但是,这些算法相对于完备决策表还是有待进一步考虑。为此,本文借助于完备决策表中冲突域的概念,设计一种在不完备决策表中的新的属性约简方法。该方法通过计算数据粒化后,冲突域中冲突对象的数目为衡量标准来判断某些属性集是否为属性约简。并且,通过理论证明了基于冲突域所求出的属性约简与基于正区域属性约简的是一致的。最后,通过仿真实验说明该算法是可行的。相似文献

3.

基于粗糙集的多值属性关联规则挖掘

赵建喆王大可李凯《情报学报》2012,31(10)

本文应用粗糙集理论中等价关系的概念,结合知识系统细化和泛化的思想以及Apriori算法中逐层搜索迭代求取频繁项集的思想,对数据挖掘中的多值属性关联规则问题进行研究,提出一种新的多值属性关联规则挖掘算法Mqars.Mqars的主要特点是无需将多值属性转化为布尔型属性,可以尽早地约简非候选的频繁项集,方便快捷地计算出项集支持度,提高多值属性关联规则挖掘效率.论文给出了Mqars算法详细描述、具体实现过程和算法实例及分析.最后设计实验环节对Mqars算法与传统的Maqa算法在时间复杂度和算法效率方面进行比对和分析,分析与比对的实验结果表明了该算法的有效性. 相似文献

4.

基于知识依赖度约简数据挖掘的个性化服务研究

李化明王家云马利华《大学图书情报学刊》2015,33(1):90-94

粗糙集理论中的属性约简问题属于NP难问题,文章以淮北师范大学教育技术学专业读者在2013学年度的图书借阅历史数据为研究对象,采用借阅类目的次数多少作为属性重要度进行启发式选择,利用粗糙集理论中的知识依赖度对类目约简,挖掘出该专业各年级和该专业借阅类目的核心集。经问卷调查证明其规律的正确性,据此结论进行个性化推送服务具有很强的针对性和很高的命中率。相似文献

5.

多范畴信息系统的自动分类方法研究 总被引：1，自引：0，他引：1

卢致杰徐维军《情报学报》2005,24(1):53-58

为解决传统自动分类方法中的多范畴信息处理能力弱的问题,本文提出了一种基于多范畴属性约简和复合相似度计算的多范畴信息自动分类方法,该方法首先在分类中引入决策属性,然后计算各范畴的决策类和广义决策类,获得多范畴分类属性的约简集族,并依此集族分别计算多范畴信息系统分类对象的复合相似度,依据复合相似度的计算结果对分类对象进行排序和标引,实现自动分类。此方法有效地解决了多范畴不完备信息系统的自动分类问题,通过与Google自建系统的对比分析可知建立在此方法基础之上的多范畴信息分类系统在查全率和查准率方面明显优于传统的自动分类系统。相似文献

6.

杂合VPRS与PNN的知识发现方法 总被引：3，自引：0，他引：3

菅利荣刘思峰《情报学报》2005,24(4):426-432

本文提出一种变精度粗糙集(Variableprecisionroughsets,VPRS)与概率神经网络(ProbabilisticNeuralNetwork,PNN)杂合的方法。变精度粗糙集对噪声数据有一定的相容性,给定置信阈值β,通过变精度粗糙集模型将信息系统中的冗余属性排除,求出一个最小的知识表示,由此可以约简神经网络的输入。由于概率神经网络的分类及泛化能力较强,接下来应用概率神经网络建立的模型进行分类、预测。实验表明,变精度粗糙集与概率神经网络杂合方法的分类及预测精度均较高。该方法可用于从模糊的、冗余的、不完备的且有噪声的大型数据库中发现知识。相似文献

7.

粒矩阵知识约简算法在电力变压器故障诊断中的应用

张霞《信息系统工程》2014,(12):133-135

针对电力变压器存在的信息不完备性和复杂性,提出了基于粒计算理论的电力变压器故障诊断方法.本文介绍了粒矩阵约简算法的相关概念,提出了基于粒矩阵的知识约简算法,并将该算法应用于电力变压器的故障诊断中.结果表明该算法可以在系统某些信息缺失的情况下仍能筛选出最简最优的故障诊断规则集,从而提高故障诊断的准确性以及时效性. 相似文献

8.

基于粗集和决策树的Web文本分类规则抽取

王煜王正欧王明春《情报学报》2005,24(6):674-678

本文根据CHI值原理、粗集理论和决策树原理,提出了一种抽取Web文本分类规则的新方法。决策树分类方法具有出色的数据分析效率和容易抽取、易于理解的分类规则等优势,但对于维数达成千上万维的分类问题很难应用。因此本文先根据CHI值选择每个文本类中对分类贡献大的若干词条,然后采用粗集理论方法对选择的特征进行进一步提取,这样得到维数较小的文本特征向量空间,最后再使用决策树进行分类,从而既保证了分类精度又可很容易地抽取出利于理解的文本分类规则。相似文献

9.

信息系统中一种面向粗糙集的数据挖掘方法 总被引：17，自引：2，他引：15

程岩黄梯云《情报学报》2001,20(1):90-99

数据挖掘技术是信息系统的一个重要研究内容 ,它可以从大量数据中自动发现对决策有帮助的知识。许多数据挖掘技术仅仅适用于精确集 ,不适用于粗糙集 ,而现实中粗糙集是普遍存在的现象 ,因此开发出一种面向粗糙集的数据挖掘技术在信息系统的研究领域具有重要意义。本文结合粗糙集理论提出了一个信息系统的粗糙集模型 ,在此基础上设计出一个属性约简方法及从粗糙集中发现规则的算法 :Apriori_2。相似文献

10.

基于粗糙集和RBF神经网络的文本自动分类方法

白如江《现代图书情报技术》2006,1(6):47-51

结合粗糙集的属性约简和RBF神经网络的分类机理，提出一种新的文本分类混合算法。试验结果表明，与朴素贝叶斯、SVM、kNN传统分类方法相比，该方法在保持分类精度的基础上，分类速度有明显提高，体现出较好的稳定性和容错性，尤其适用于特征向量多且难以分类的文本。相似文献

11.

数据挖掘中分类方法综述 总被引：3，自引：0，他引：3

钱晓东《图书情报工作》2007,51(3):68-71

数据挖掘中的核心技术分类算法的内容及其研究现状进行综述。认为分类算法大体可分为传统分类算法和基于软计算的分类法两类，主要包括相似函数、关联规则分类算法、K近邻分类算法、决策树分类算法、贝叶斯分类算法和基于模糊逻辑、遗传算法、粗糙集和神经网络的分类算法。通过论述以上算法优缺点和应用范围，研究者对已有算法的改进有所了解，以便在应用中选择相应的分类算法。相似文献

12.

数据挖掘中一种基于粗糙集理论的属性值离散映射方法 总被引：7，自引：0，他引：7

黄梯云卢涛程岩《情报学报》2002,21(4):391-396

不确定性知识是数据挖掘的一个重要内容 ,而属性值的离散映射是在数据库中发现不确定性知识的一个重要环节。本文首先提出一个不确定性信息系统的粗糙集模型 ,在此基础上进一步提出了划分属性值离散区间的算法。该算法同时适用于字符型属性的数据和数值型属性的数据 ,从而可以广泛地应用于不确定性知识的挖掘。相似文献

13.

基于RBF神经网络和关联规则的Web文本分类规则获取方法

李泽峰王煜《图书情报工作》2006,50(10):90-92

根据互信息、RBF神经网络和关联规则原理,提出了一种抽取WEB文本分类规则的新方法。先根据互信息选择和各类相关程度大的若干词条,然后采用RBF神经网络方法对选择的特征进行进一步提取,得到维数较小的文本特征向量空间。之后再根据挖掘出的关联规则获取WEB文本分类规则,建立文本分类器,在保证了分类精度的前提下抽取出利于理解的文本分类规则。相似文献

14.

科学知识增长过程中系统自组织创生模式研究

万昊谭宗颖朱相丽张超星《图书情报工作》2015,59(24):93-101

[目的/意义]通过微观层面上个体的因果相互作用来阐述信息计量领域宏观幂律分布现象形成的必然性,将其从随机性的统计规律转变成为必然性的动力学规律。[方法/过程]在幂律分布必然性的揭示上,抛弃粗糙的机械还原论视角,而将其放在更加精密的复杂系统的分析框架下。数学论证上以普赖斯引文网络为实例,运用主方程、隐马尔科夫链推导出双参数广义普赖斯定理β函数数学描述并进一步推导出3条数学性质。[结果/结论]将信息计量领域普遍存在的偏态随机性统计规律发展成为确定性的系统动力学规律,即在简单线性累加优势规则而非马太效应规则的约束下,通过最细粒度层级上的因果二元组的多次正向性互动反馈,经由临界涨落和对称性打破,根据严谨的网络动力学数学语言描述出系统的自组织有序性稳态建构。相似文献

15.

识别核心专利的粗糙集理论模型

袁润钱过《图书情报工作》2015,59(2):123-130

[目的/意义]研究应用粗糙集理论分析专利信息的可行性及其方法,建立识别核心专利的粗糙集理论模型。[方法/过程]综述国内外研究核心专利识别的相关文献,确定包含8个指标的核心专利识别指标体系,再用粗糙集理论分析专利信息数据,确定各指标的权重系数,按照计算的核心专利综合指数(CICP)大小将某特定技术领域的专利信息序列分为核心专利、关键专利、重要专利和一般专利。[结果/结论]以通信领域的976件专利数据为分析样本,运用本文核心专利识别模型识别出11件核心专利,其中包含获得中国专利奖的专利,核心专利识别结果在一定程度上表明核心专利识别模型的可行性和科学性;本文核心专利识别模型具有一般性,可应用于分析研究专利价值及其重要性。相似文献