首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义] 通过构建二模复杂网络模型,揭示隐藏在海量文献中的隐性知识。[方法/过程] 通过NetworkX复杂网络工具包,依据任意两个节点的共现关系构建二模复杂网络模型;对网络模型中节点的共现关系进行加权,计算网络的拓扑信息并进行AP聚类,提取节点间的直接关系;采用AUC方法对AA、JC、加权改进的wAA和wJC等4种链路预测算法进行评价,遴选出最合适的预测算法,并对复杂网络的隐性关系进行预测分析。[结果/结论] 以潜在药物靶点挖掘为例进行的实证研究结果表明,wAA链路预测算法为最优的链路预测算法;二模复杂网络模型、指标和方法体系在美国化学文摘社数据库中的药物靶点挖掘中具有一定的有效性。下一步计划在其他数据库中或其他研究领域中进行尝试,以进一步验证该模型的通用性和有效性。  相似文献   

2.
利用web文档的半结构化信息,提出一种基于DOM的web文本分割算法。该算法充分挖掘web网页中控制网页内容结构和显示的HTML标签信息,构建HTML DOM树。首先通过改进传统的平面文本分割方法,使之适用于web文本分割;然后利用DOM树中的节点平滑平面文本分割的结果,初步实验表明该算法能有效提高web文本分割的精确度。  相似文献   

3.
认为在突发事件的舆情传播过程中,网络论坛中影响力大的关键节点左右传播的走势。设计一种完整的网络舆情节点挖掘和分类的技术方法,包括原始数据挖掘、数据结构化、节点影响力测算与识别、关键节点论坛影响力计算、关键节点分类等,涉及GooSeeker、Gephi、LeaderRank等算法和软件,并以“7·23动车事故”为例进行具体分析。通过研究揭示出网络舆情的结构复杂性、无标度性、子社区结构等特征,得到“网络名人型”和“事件关注型”两类关键节点的演化规律,对网络舆情的科学应对具有参考价值。  相似文献   

4.
基于图书借阅网络的各类书籍关系研究   总被引:1,自引:0,他引:1  
[目的/意义] 挖掘图书馆借阅数据,从网络属性、节点重要性和社团模块来研究各学科书籍之间的关系,有助于指导图书资源管理、读者服务和学科建设工作。[方法/过程] 基于复杂网络的理论和方法对图书馆学生借阅数据进行分析,以各类目书籍为节点,构建图书共现网络。在此基础上,对加权网络的网络属性和节点重要性进行探讨,并通过随机游走算法划分书籍社团。[结果/结论] 研究揭示了书籍及学科间的内在联系,同时,也为加权网络的实证研究提供一定的经验材料。  相似文献   

5.
通过对关联规则挖掘中的Apriori算法进行深入的分析与研究,为减少算法中对数据库的大量扫描操作、节省挖掘时间,提出了一种改进的Apriori算法。该算法可以提前判断算法是否应该结束,也使得算法省去了不必要的操作,节省了挖掘时间。最后通过实例分析,证明了其高效性。  相似文献   

6.
已有的频繁模式挖掘算法难以适应像生物信息数据挖掘、图模式挖掘等频繁巨模式挖掘应用.提出一种频繁巨模式挖掘算法,即基于核模式合成的频繁巨模式挖掘算法(Core Pattern Fusion Based Colossal Frequent Pattern Mining Algorithm,CPFCFPA),通过将各较小的核模式进行一步合成,寻求一个对频繁巨模式完整集的蕴含集.引入项集编辑距离概念,提出一种新颖的评价频繁巨模式挖掘结果质量的评测模型.实时数据集实验显示,CPFCFPA具有较好的可扩展性和挖掘性能,且对当前频繁模式挖掘算法难以或不能实现的挖掘任务,其挖掘结果能做到对频繁巨模式完整挖掘集的较好近似.  相似文献   

7.
面向查询扩展的特征词频繁项集挖掘算法   总被引:1,自引:0,他引:1  
为了获取高质量的扩展词,提出一种面向查询扩展的基于文本数据库的特征词频繁项集挖掘算法。该算法采用支持度衡量特征词频繁项集,给出新的剪枝策略,并结合原始查询,挖掘同时含有查询词项和非查询词项的特征词频繁项集,以提高挖掘效率。实验表明,与传统的挖掘算法相比,本算法更有效、更合理。  相似文献   

8.
基于马尔可夫转移矩阵的多步过程挖掘方法   总被引:1,自引:0,他引:1  
李燕 《信息系统工程》2013,(2):37-40,26
针对目前过程挖掘算法对过程日志要求较高,且挖掘结果只能用特定形式化描述模型进行表示,提出一种基于马尔可夫转移矩阵的多步过程挖掘方法。首先基于日志构建马尔可夫转移矩阵,其次定义关系挖掘规则分析过程中的逻辑关系,接着设计过程挖掘算法建立活动间的结构关系,而后给出一种形式化表示算法将挖掘结果表示成有向网络图,最后通过仿真验证方法的可行性。  相似文献   

9.
[目的/意义] 针对复杂网络中的重要节点的识别,设计一种节点中心性算法,在传染病防控、舆情监控、产品营销、人才发现等方面发挥作用。[方法/过程] 同时考虑节点的高影响力邻居的数量及其总体影响,提出HHa节点中心性算法,在真实网络和人工网络上,使用SIR传染病模型模拟信息传播过程,采用单调函数M和肯德尔相关系数作为评价指标验证HHa中心性算法的有效性、准确性以及稳定性。[结果/结论] 实验表明,与7种经典的中心性算法相比,HHa中心性算法得出的排序结果M值为0.999等,排名第2;肯德尔系数为0.845等,高于其他算法0.15左右,排名第1且表现稳定。采用HHa中心性算法识别网络中的重要节点具备可行性。  相似文献   

10.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性.  相似文献   

11.
鉴于无线传感器的网络节点能量受限特性,提出一种新的无线传感器网络分簇算法,也就是响应式分布分簇算法。这种算法的优点就在于只通过拓扑信息就可以立即进行簇头选举,而不像传统的分簇算法要提前预知节点与节点位置之后才可以进行进行簇头选举,另外,还可以根据代价函数对簇头进行划分,被无线传感器网络广泛应用。  相似文献   

12.
肖强  钱晓东 《图书情报工作》2011,55(16):136-139
针对传统关联规则算法中事务扫描的重复性以及最小支持度设定的不确定性,导致关联规则挖掘算法扫描事务数据库运行效率低下的问题,提出一种基于K-means的Web访问用户关联规则挖掘算法,该算法利用K-means算法聚类的效果,将Web访问用户数据集聚类为不同的小数据集,采用不同的最小支持度,分别对Web访问用户聚类小数据集进行关联规则挖掘。分析和实验结果证明,该算法可有效提高传统关联规则挖掘算法的效率,同时也可有效避免传统关联算法中扫描中的重复性。  相似文献   

13.
关联规则挖掘是解决电子商务推荐问题的重要方法之一.针对传统关联规则挖掘算法在解决移动电子商务环境个性化推荐问题时反复扫描数据库,频繁项挖掘效率低,关联规则挖掘准确率低以及规则大量冗余等不足,提出一个基于事务矩阵和用户兴趣度的关联规则挖掘算法(Matrix-and-Interestingness-based Association Rules Mining,MIbARM).该算法仅需扫描一次数据库,并在挖掘过程中不断缩小算法搜索空间以避免生成冗余候选项,同时避免了冗余规则挖掘,从而提高了挖掘效率.最后,在四组人工数据和160种参数组合的数值实验环境下,引入Apriori、CBAR 及BitTableFI算法对MIbARM进行对比验证.结果表明,在不减少有趣规则的前提下,MIbARM不但可有效避免冗余候选项集的产生,而且大幅减少了冗余规则数量,极大提高了算法的搜索效率,同时提升了个性化推荐的质量,更适用于移动电子商务环境下的个性化推荐问题.  相似文献   

14.
针对无线传感器网络中DV-Hop定位算法的不足,提出一种基于迭代协作的优化算法(ICDV-Hop算法)。通过限制跳数来减小距离误差,利用共线度测试约束节点间几何位置关系,选择最优信标三角形组合以提高定位精度。同时将定位误差在设定阈值范围内的已定位节点转化为信标节点,进行迭代协作,从而在控制误差传播的前提下增加定位覆盖。仿真结果表明,ICDV-Hop算法与传统DV-Hop算法相比,定位精度和定位覆盖均有明显改善,定位性能受网络条件影响小,表现出良好的可靠性和鲁棒性,尤其是在信标节点比例较低及网络稀疏的情况下。  相似文献   

15.
数据挖掘技术的改进在图书馆个性化服务中的应用   总被引:8,自引:0,他引:8  
Apriori 算法是关联规则挖掘的一个经典算法,在分析关联规则挖掘算法的基础上,提出利用HASH表技术及减少生成候选集的数量对经典Apriori 算法进行改进,从而提高图书馆数据资源的利用率,加强图书馆个性化服务。  相似文献   

16.
本文将数据挖掘技术与人际网络相结合来实现企业竞争情报的采集.在分析企业人际网络结构及其特征的基础上,提出了企业人际网络的挖掘流程,以及如何识别企业人际网络内的重要节点类,并对节点的重要性进行评分的方法.进而,本文应用企业人际网络的挖掘方法,探讨企业竞争情报的聚类分析、关联分析、概念描述、预测等获取方法.  相似文献   

17.
[目的/意义]为应对微博内向型传导热点生灭速度快、热点特征不明显等问题,研究新型的微博内向型传导热点发现与预测算法。[方法/过程]针对上述问题,基于复杂网络分析方法,构建微博传导热点预测算法,该算法通过复杂网络节点模型扩展生成微博传导节点模型,发现内向型传导节点的传导子网;通过对传导节点序列实施热功率计算,对其信息传导覆盖范围以及未来影响力进行预测,进行传导热点发现及预测。[结果/结论]数据实验表明,该算法较之目前常用的热点预测算法,具有较高的传导热点覆盖率和准确率,且耗时较少,性价比较高。  相似文献   

18.
为提高多关键词查询的效率并减少多关键词查询的开销,提出一种基于语义聚类的多关键词查询算法——MKQBSC。该算法使得语义相似的节点聚为一类,节点加入、退出或节点的语义改变时,聚类将相应改变。查询请求在相邻的语义聚类之间转发,直至到达语义相似的聚类。仿真实验结果表明:与传统的基于对倒排表求交集的多关键词查询算法相比,MKQBSC算法所需的路由跳数和所产生的消息数更少。  相似文献   

19.
运用Hadoop/Map Reduce并行海量图像处理框架进行基于内容的海量图像检索,将海量图像数据分布式存储在众多节点上,运用优化的ACCC算法在各节点上进行基于内容的图像搜索分析算法一体化处理,通过与传统并行计算方法和单节点方法试验对比,演示本方法在存储能力和计算检索效能的优势。  相似文献   

20.
解读对等网环境下的知识检索   总被引:1,自引:1,他引:1  
知识检索是对等网中分布式节点间实现知识共享的关键。根据对知识检索的理解和对客体对象的挖掘深度不同,将对等网的知识检索环境分解为网络拓扑、节点知识和节点用户3个层次,据此分析总结对等网环境下的知识检索现状,并作进一步展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号