共查询到20条相似文献,搜索用时 171 毫秒
1.
基于粗集理论和神经网络结合的数据挖掘新方法 总被引:13,自引:1,他引:12
本文提出了一种基于粗集理论和神经网络的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简 ,然后使用神经网络对数据进行学习和预测 ,并同时完成属性的不一致约简 ,最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明 ,该方法快速有效 ,生成规则简单准确 ,具有良好的鲁棒性。 相似文献
2.
[目的/意义] 由于网络动态数据在不断影响着企业动态竞争环境的形成和实时情报服务的创新发展,对其进行专业性研究就显得十分有必要。[方法/过程]分析CI视角下网络动态数据的内涵、特征及类型,概述网络动态数据挖掘研究经历的发展阶段,指出网络动态数据挖掘在竞争情报、战略管理及网络监测等领域有着较为广泛的需求及应用前景。最后,对CI视角下网络动态数据挖掘的基本原理、业务流程、系统模型设计及应用进行研究与分析。[结果/结论]研究认为:网络动态数据作为情报价值链的一种上游属性,能为情报研究与竞争情报活动提供竞争环境、竞争对手及竞争策略的动态、实时的数据集,具有动态进化性、突变性、开放性、时序性和实时性等特性。 相似文献
3.
基于贝叶斯网络建模的非常规危机事件网络舆情预警研究 总被引:1,自引:0,他引:1
网络舆情态势作为衡量社情民意的主要指标,在管理实践和学术研究中显得尤为重要。针对网络舆情作用主体复杂多样、作用关系难以预知、作用程度难以计量等特点,将贝叶斯网络建模方法和网络舆情态势评估相结合,同时基于贝叶斯网络三个重要特点--复杂关联关系表示能力、概率不确定表示能力以及因果推理能力,提出基于贝叶斯网络建模的网络舆情态势评估方法。通过对关键指标数据进行仿真和学习,建立网络舆情态势评估模型,从而对网络舆情态势进行有效评估和预测。 相似文献
4.
随着大数据的迅速发展,知识网络在不同语言、不同领域和不同模态等情境下呈现高度多样性和复杂性,如何对齐与整合多源情境下的异构知识网络,成为研究者所面临的严峻挑战。本文在知识网络深度表示学习的基础上,提出一种由知识网络构建、跨语言网络表示学习和统计机器学习三个模块构成的知识网络对齐(knowledge network alignment,KNA)模型。为验证模型的有效性,在中英文双语知识网络数据集上开展实证研究,借助于网络表示学习算法将异构知识网络表征到同一空间,利用已知的对齐链接来训练统计机器学习模型,并通过模型来预测未知的节点对齐链接。KNA模型在跨语言共词网络对齐任务中取得Precision@1值为0.7731,高于基线方法 (0.6806),验证了KNA模型在跨语言知识网络对齐上的有效性。研究结果对于改进知识网络的节点对齐效果,促进多源情境下的异构知识网络融合具有重要意义。 相似文献
5.
“国图公开课”自上线以来,在拓宽国家图书馆社会教育职能中发挥着重要的作用。随着数万名学生加入并在“国图公开课”平台上学习课程,用户与平台之间产生了丰富的用户数据以及学习行为记录。面向“国图公开课”繁复的用户数据资源,利用关联数据挖掘方法和可视化技术可实现关联算法及结果可视化的系统结合,优化学生学习过程模式。建立基于大数据的用户学习行为分析系统,设计无交叉的网格优化映射,实现事件相关性、事件排名、网络社交三类行为要素的可视化。并利用“国图公开课”数据资源中的User 数据集、Session 数据集和Event 数据集进行数据挖掘分析测试,结果表明,该系统实现了对用户学习行为数据的有效关联聚类,获得了良好的可视化效果。图6。表2。参考文献16。 相似文献
6.
基于社交网络的社交关系强度分类研究1) 总被引:1,自引:0,他引:1
本文利用监督学习的方法从社交网络的用户数据中分两个阶段挖掘最佳的社交关系强度分类模型,并进一步探讨不同用户数据对于社交关系强度的区分能力。研究发现,基于贝叶斯网络算法的分类模型在区分强社交关系的过程中被证明最有效,而基于 Logistic 回归算法的分类模型则在区分出临时社交关系的过程中表现最佳。研究还通过属性分析发现互动性因素总体上对社交关系强度的区分能力最为突出,相似性因素中的共同好友数也有很好的区分能力,但时间性因素对于社交关系强度的区分能力没有被发掘出来。 相似文献
7.
[目的/意义] 对Wikidata数据特点、获取方式及其应用进行剖析,旨在带动国内开放数据集的增加,提高国内数据集与国外数据集的关联度。[方法/过程] 采用综合归纳及比较研究的方法,阐述Wikidata 的发展历程,对其数据特点及数据模型进行研究,梳理目前可获取Wikidata数据的5种方式。[结果/结论] Wikidata具有开放、协作、多语言、结构化的特点,其以条目为核心,定义了实体类及属性,提供了多样化数据获取方式,且当前基于Wikidata的应用主要集中在语义检索、多语种查询、知识可视化、知识库构建与虚拟研究环境搭建5个方面。 相似文献
8.
基于模糊属性集的粗糙近似精度数据挖掘策略 总被引:1,自引:0,他引:1
为了提高信息系统的分类质量,探讨了一种在数据仓库中基于模糊属性集的粗糙逼近近似度量的数据挖掘策略.首先在决策表中给出了模糊属性集的原子概念表示及其对象的描述;再根据原子概念的特征构造了模糊属性集的粗糙上下近似表述;然后利用模糊属性重要性度量的概念,提出了利用逼近精度近似度量的数据挖掘方法进行模糊属性约减;最后应用算例说明如何在决策表中发现分类规则.实验结果表明此方法挖掘出的规则简练且合理可靠. 相似文献
9.
文章在分析大数据环境下我国高校科研数据管理发展现状的基础上,基于四螺旋模型构建集科研管理机构、科研团队交互学习、高校知识共享、虚拟网络平台于一体的多层次知识服务风险管控模式,阐述高校知识螺旋、科研管理机构知识螺旋、图书馆知识螺旋和科研用户知识螺旋四个知识服务安全保障螺旋体,提出学科馆员在高校图书馆面向科研数据知识服务风险管理中的责任,促进当前大数据环境下高校知识服务风险管理理论的完善。 相似文献
10.
针对现有的元数据提取方法提取精度不高且适应能力较差的问题,本文提出一种基于度量级融合的论文元数据提取方法.首先,提取论文首部的特征,利用已标注的数据集对HMM、SVM和CRF三种统计学习方法进行训练,生成相应的元数据提取模型;然后,根据贝叶斯判决理论推导出和规则,并利用和规则对三种提取模型产生的后验概率进行融合决策,实现论文元数据的提取;最后,通过设定时间段和文档数阈值,采用基于时间段统计的方法动态更新三种提取模型,以确保模型的有效性.在不同的数据集上对各种提取方法的性能进行了实验对比,结果表明,本文提出的方法不仅提高了元数据提取精度,而且具有较强的适应能力. 相似文献
11.
在现有的实例知识模型表示与检索的基础上,针对现有实例知识检索的不足,就具有多层属性关系的实例知识的检索技术进行研究。将多层属性实例知识表示为一个树状结构的多层属性模型,在检索算法中综合运用数值类属性相似度算法、模糊值属性相似度算法、词语类属性值相似度计算算法等,对算法步骤顺序进行调整优化,使检索效率得到提高。 相似文献
12.
虽然关联数据在国内图书情报领域的认知已普及,但在书目资源上的应用推进仍较缓慢。本文引介联合国粮食及农业组织发布的《书目数据开放关联化指南》(LODE-BD),通过借鉴国外书目资源的关联数据实践经验,以期促进国内信息资源序化理论与实践的融合。本文重点辨析了基于RDF的三对基本概念,解读了M2B概念模型,分析了元数据模式的通用属性组设计,介绍了LODE-BD的决策树选择流程创新做法。最后在分析LODEBD的基础上,提出书目资源开放关联化的5圈层结构,为国内书目资源的开放关联化提供系统化实施参考。 相似文献
13.
14.
15.
16.
17.
基于混合算法的电子商务推荐系统设计研究 总被引:1,自引:0,他引:1
针对目前电子商务推荐系统不能很好地为未注册用户服务的问题,根据未注册用户和注册用户各自特点采用两套不同的数据收集方案,以提高网站的友好性与数据的准确性。在推荐算法方面,由于决策树归纳算法与贝叶斯网络算法各有优劣,故将两种算法结合使用,并引入基于内容的算法思想对商品的各属性进行研究,以提高推荐的准确性。实验证明:上述方法能够很好地为未注册用户服务且基于混合算法的推荐优于基于单种算法的推荐。 相似文献
18.
[目的/意义]准确把握社交网络用户兴趣倾向,对用户进行分类并形成高聚合的用户群,对研究社交网络信息生态以及信息推荐有重大意义。[方法/过程]通过构造基于多维度的用户属性描述层次模型,根据模型数据需求从新浪微博抓取用户样本数据,对相关用户背景信息、用户博文信息以及用户行为信息的多维度属性下二阶变量进行量化,构造用户向量表达式,比较单一维度与多维度下的用户分类效果,进一步给属性赋予不同的权重值进行加权分析,在取得最优聚类效果后进行方差分析,对模型进行改进。[结果/结论]基于多维度属性加权后的用户聚类效果明显高于单一维度及多维度非加权条件下的用户聚类,且用户博文内容维度对于提高用户聚类效果的有效性最大。 相似文献
19.
20.
多范畴信息系统的自动分类方法研究 总被引:1,自引:0,他引:1
为解决传统自动分类方法中的多范畴信息处理能力弱的问题,本文提出了一种基于多范畴属性约简和复合相似度计算的多范畴信息自动分类方法,该方法首先在分类中引入决策属性,然后计算各范畴的决策类和广义决策类,获得多范畴分类属性的约简集族,并依此集族分别计算多范畴信息系统分类对象的复合相似度,依据复合相似度的计算结果对分类对象进行排序和标引,实现自动分类。此方法有效地解决了多范畴不完备信息系统的自动分类问题,通过与Google自建系统的对比分析可知建立在此方法基础之上的多范畴信息分类系统在查全率和查准率方面明显优于传统的自动分类系统。 相似文献