首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
李勇男  梅建明 《情报科学》2017,35(9):141-145
【目的/意义】利用数据挖掘技术在海量数据中快速、准确、有效的发现涉恐线索并及时处置是反恐工作的 重要手段之一。【方法/过程】本文研究如何利用频繁模式树对涉恐基础数据进行挖掘,提取涉恐特征的频繁项集。 首先通过对数据库中的涉恐人员信息进行涉恐特征计数排序并建立频繁模式树,然后在树结构中递归遍历发现满 足最小支持度阈值的频繁项集。【结果/结论】文中的方法可以快速发现大量基础数据中的涉恐关联属性,有利于在 系统中自动搜索重点涉恐人员,为反恐预警系统提供决策参考。通过与其他产生关联规则的方法结合使用,还可 以发现暴恐活动中不同因素的因果关系。  相似文献   

2.
李欣 《情报科学》2018,36(4):95-99
【目的/意义】关联数据发现与个性化信息推送是未来智慧图书馆建设的核心内容。大数据环境下,为了提 高图书馆推送信息的精准度,本文把适合个性化信息推送服务的强关联规则挖掘技术引入到高校图书馆智慧化信 息服务中,研究在图书馆集成管理系统的基础上实现图书的智能查询和个性化信息推送。【方法/过程】在具体的研 究中,由于经典关联规则挖掘需要多次扫描数据库,生成大量的冗余关联规则信息,因此需要重新定义领域内强关 联规则和频繁项目集,提出处理海量数据需要的强关联规则算法。【结果/结论】将改进的算法应用到图书借阅和信 息查询数据的分析中,以减少图书频繁项集的产生,避免冗余规则的挖掘和生成,从而实现关联图书信息的高效挖 掘和个性化推送。  相似文献   

3.
李勇男  梅建明  秦广军 《情报科学》2017,35(11):103-107
【目的/意义】近年来,世界各地的暴恐活动呈现出破坏性大、影响范围广、计划性强、手段多样等特点,这也 决定了打击恐怖主义要把反恐预警工作作为重中之重。利用数据挖掘技术进行涉恐情报分析,发现涉恐线索是实 现反恐预警的有效手段之一。数据预处理是使用各种数据挖掘方法的前提和基础。【方法/过程】本文将系统研究 数据预处理在涉恐情报量化分析中的应用。主要讨论数据清洗、数据集成、数据离散化以及数据二元化等预处理 方法在涉恐信息处理时应该重点注意的问题。文中所有涉恐数据特征均从媒体公开报道中获取。【结果/结论】本 文讨论的预处理方法可以为展开涉恐情报数据挖掘消除数据缺陷,提供标准化的基础数据,为挖掘结果分析和可 视化展现打下良好基础,有利于反恐预警的实现。  相似文献   

4.
李勇男 《情报杂志》2021,(2):90-94,68
[目的/意义]对多源异构时空数据进行同现模式挖掘可以发现涉恐人员、涉恐物资、涉恐活动在邻近地点同时段共同出现的规律,为反恐工作提供包含时间特征和空间特征的情报信息。[方法/过程]在同位模式挖掘的基础上提出预先确定目标情报类别从而确定涉恐人员分类方式,使用概念层次树对涉恐物资和涉恐活动进行数据预处理,使得目标同现模式覆盖更多情报信息。[结果/结论]该方法与同位模式挖掘、频繁时间序列模式挖掘以及各种时空轨迹模式挖掘可以相互补充,覆盖多种不同的反恐情报信息,完善反恐预警机制,为反恐决策提供客观依据。  相似文献   

5.
李勇男 《现代情报》2019,39(7):37-43
[目的/意义]利用子图模式对暴恐案件中的人员关联进行分析可以发现涉恐人员关联图中的规律,为反恐情报分析提供有效参考。[方法/过程]首先对涉恐基础数据进行预处理,保证图中各顶点的唯一性。通过计数统计出所有的频繁1-子图和频繁2-子图,然后不断迭代生成其他候选子图并筛选频繁子图,直到达到终止条件为止。[结果/结论]该方法根据反恐情报的特点进行了优化,避免了普通频繁子图挖掘中的大量图同构检测,挖掘出的频繁子图可以反映不同类别涉恐人员之间的联系规律和联系特点,发现暴恐案件线索,有效预测和打击恐怖活动。  相似文献   

6.
李勇男 《现代情报》2018,38(12):65-69
[目的/意义]对反恐情报中的时空轨迹数据进行伴随模式挖掘,可以发现涉恐群体的同时间段动态空间位置移动规律。[方法/过程]根据反恐情报数据的特点,修改经典伴随模式挖掘方法中的相似度度量方式和聚类方式,不断迭代完成"聚类和取交集"操作,将满足条件的涉恐活动时空轨迹伴随模式导出。[结果/结论]该方法能够挖掘涉恐群体的同步移动路径,定位重点活动地点,分析涉恐人员之间的亲近度,为打击暴恐活动提供数据参考。  相似文献   

7.
传统的关联规则挖掘技术过于依赖数据之间的关联属性,造成挖掘算法在高冗余知识空间关联规则不明显或者较弱的情况下挖掘耗时。本文提出一种应用与高冗余知识空间的优化数据挖掘算法。该算法首先找出最大频繁项集和频繁1-项集进行区域分类,然后利用已有频繁项集找出所有的其它频繁项集,去除冗余关联环境,节省了计算频繁项集的时间,节约了存储空间,使算法的效率得到提高。仿真实验结果证明了改进算法的可行性和有效性。  相似文献   

8.
李勇男 《情报科学》2018,36(4):80-84
【目的/意义】利用数据挖掘技术分析涉恐人员的物流、资金流、信息流等数据进行反恐预警可以有效提高 反恐工作效率和优化资源配置。【方法/过程】本文将研究如何利用信息增益决策树对涉恐情报信息进行快速分 类。分类过程为从根节点的涉恐人员属性开始不断产生新的分支。产生每个分支都需要计算不同属性的信息增 益并选择分裂属性。【结果/结论】文中的方法可以对大量涉恐情报基础数据进行快速分类,在实际工作中可以与关 联分析、聚类分析、异常检测等其他数据挖掘方法组合使用。该方法既可以应用于公安情报学专业本科生的课堂 教学,也可以应用于情报分析人员的培训。  相似文献   

9.
本文借助ARIZ思想深入研究了关联规则挖掘模式,综合介绍了关联规则的理论基础,进一步明确了项、项集、候选项集、频繁项集、支持度、置信度这些重要知识点,对关联规则进行了多角度的分类,研究分析了关联规则挖掘的经典算法,并对关联规则的评价标准进行了创新研究,引入了主观兴趣度和客观相关性分析,为后续研究和改进关联规则的算法提供了理论基础。  相似文献   

10.
[研究目的]对恐怖分子的时空轨迹数据进行聚集模式挖掘,有助于了解涉恐人员的群体行为模式,进而预测并提前防范一些涉恐的群体活动。[研究方法]通过对比反恐情报数据特征和多种聚集模式的特点,选择移动簇作为反恐情报中的聚集模式类型,修改移动簇挖掘经典方法中的数据采样、数据预处理、移动对象邻近度度量方法、时间点聚类方法以及移动簇的筛选条件等环节,找出适用于反恐工作需求的移动簇,再由有经验的情报分析人员进一步研判并提出处置对策。[研究结论]提出的方法通过与其他时空类型数据分析方法相结合,可以挖掘反恐情报时空轨迹数据分布规律,为反恐预警和反恐决策提供科学客观的参考。  相似文献   

11.
Apriori算法是关联规则挖掘中的经典算法。在Apriori算法中,使用频繁项集的先验知识,逐层搜索的迭代方法,通过扫描数据库,累积每个项的计数,并收集满足最小支持度的项,找每个Lk都需要扫描一次数据库。算法的效率随着数据量的增大,频繁项集的增多,算法的效率就非常的低,本文通过对Apriori算法分析,应用散列、事务压缩、划分、抽样等方法,最大可能的减少数据库扫描的次数,快速发现频繁项集,提高Apriori算法的效率。  相似文献   

12.
【目的/意义】从开放政府数据主题的多个政策文本的语义挖掘出发,发现多个政策文本内容间的语义关 系,探索能降低人工干预,实现多政策文本协同性自动化分析的方法。【方法/过程】利用数据挖掘的关联规则算法 对经过预处理的开放政府数据政策文本进行语义挖掘,按照得到的有效强关联分析多政策文本间的协同性。【结 果/结论】以开放政府数据主题的多个政策文本为研究对象,确定置信度为 0.7,提升度大于 3时得到的有效强关联 规则数量较稳定;经过不同层次的政策文本关联规则分析,可以得到与人工分析基本吻合的结论,验证了该方法可 以应用于多政策文本语义协同性的定量研究。【创新/局限】采用数据挖掘中的关联规则算法完成数据政策多文本 的协同性知识推理研究,有效的实现了语义自动化计算的问题。实验中政策词表的完整性、数据预处理过程、参数 设定等环节都会对实验结果准确性有影响,需进一步降低人工干预影响。  相似文献   

13.
廖大强 《科技通报》2019,35(8):125-128
为了提高用户需求数据挖掘的时效性及准确性,提出基于径向基函数神经网络的数据关联挖掘算法。在对数据频繁项集约束性关联规则研究的条件下,通过约简计算,得到满足约束条件的候选数据集,并对用户需求数据频繁项集更新;利用径向基函数神经网络对候选数据集进行训练优化,通过上界剪枝法,获取用户需求数据,并实现其实时挖掘。实验结果表明,所提数据挖掘算法执行效率受数据规模变化的影响较小,挖掘效率更高,扩展性更好。  相似文献   

14.
为了更好的对户外运动资源进行整合,以提高资源利用率,本文采用数据挖掘技术构建了一种并行拓展及关联分析的户外运动资源整合模型。首先将整个数据集随机分割成若干个非重叠子数据集,并且每个子数据集还可继续划分成更小的子集,进而并行分层地挖掘出局部频繁项集,然后根据频繁项集先验性质,连接局部频繁项集得到全局候选项集;最后扫描数据集统计出每个候选项集的实际支持度,以确定全局频繁项集。算法实例仿真结果表明,本文提出的改进算法与普通Apriori算法相比更高效,并且在户外运动资源整合的应用中,本文提出的算法表现出更好的挖掘效率。  相似文献   

15.
基于关联规则挖掘的食品安全信息预警模型   总被引:4,自引:1,他引:3  
顾小林  张大为  张可  浦徐进  曹文彬 《软科学》2011,25(11):136-141
针对食品生产加工的安全问题,建立了基于关联规则挖掘的食品安全信息预警模型,此模型从数据挖掘视角以食品生产加工的检测数据为处理对象,分析数据异常情况,采用改进的关联规则挖掘APTPPA算法,生成关联路径树、寻找频繁项集、最大频繁项和最大关联规则,进而抽取报警关联规则,挖掘导致食品安全问题的因素并进行诊断和预警,最后通过实验验证了预警挖掘模型的正确性和算法的有效性。  相似文献   

16.
对大数据的频繁项集挖掘是关联规则挖掘的关键步骤,通过有效的频繁项挖掘提高大数据量数据库的访问效率。传统方法中对大数据的频繁项集挖掘采用FP-Growth的粗糙集挖掘算法,扩展性和容错性不好。提出一种基于贝叶斯粗糙集的大数据频繁项挖掘技术,引入后缀项表的概念,通过后缀项表的构建,保留频繁项集的完整信息。构建FP-Tree,生成闭频繁项集,计算样本的密度,并抽取高密度区域的点集作为聚类中心集合,进行后缀项表的构造,按支持度分成若干集合,对各约简集内的属性集合进行融合,用变精度粗糙集的贝叶斯粗糙进行数据挖掘算法改进,仿真结果表明,算法不受可变参数的影响,鲁棒性较高,数据挖掘的准确度较高,运行时间较短。算法将在人工智能和数据挖掘领域具有更广的应用前景。  相似文献   

17.
基于关系数据库的教学评价数据的关联规则挖掘   总被引:1,自引:0,他引:1  
於实 《科技通报》2012,28(4):99-101
频繁项集的挖掘是数据挖掘中的一个十分重要的组成部分。本文结合关系数据库的特殊性,利用标准SQL语言,提出适合于关系型数据库频繁项关联规则挖掘的算法,应用于教学评价数据的挖掘,得出一些潜在的关联信息,为教学管理提供决策。  相似文献   

18.
张佳 《科技通报》2019,35(2):76-79,84
针对当前只关注对数字图书馆网络功能的提高,忽略了对信息扩散的问题。为此,通过关联规则方法对海量图书信息数据扩散进行研究,给出关联规则的基本概念,并介绍了数字图书馆网络的特征,将API与编写抓取程序、开放数据等技术结合在一起;利用Apriori算法通过层次顺序搜索的循环方法对图书信息数据频繁项集进行挖掘,采集数字图书馆网络中某用户粉丝、关注者、转发以及评论信息扩散数据;将关联规则作为研究海量图书信息数据扩散方法,通过关联规则衡量节点度和出入度;在此基础上通过关联规则对海量图书信息数据扩散情况进行研究,发现海量图书信息扩散有高低谷期;转发量和评论量呈一定的正相关性;数字图书馆网络中海量图书信息数据扩散的广度和用户影响力相关。  相似文献   

19.
[目的/意义]通过异常检测可以在海量涉恐数据中发现异常信息,为反恐预警提供重要情报。[方法/过程]首先利用聚类将基础数据分为不同的簇,识别出其中区别于大部分数据对象的异常人员,然后设计一种专门的相似度综合度量参数用于计算与恐怖分子最相似的人员。[结果/结论]该方法为检测异常人员数据提供了一种可以参考的思路,用于从多种来源数据中快速找出涉恐敏感程度较高的人员,有望提高反恐情报分析的效率,实现精准打击重点涉恐人员和恐怖活动。  相似文献   

20.
关联规则挖掘是数据挖掘领域中的一项重要研究内容,由于数据库规模的不断动态扩展,迫切需要针对增量式关联规则挖掘的研究。在分析现有算法的基础上,分别从两个可改进的角度出发对算法进行优化:先在关联规则挖掘中,提出一个高效的搜索频繁项集算法,该算法只需扫描一次数据库即可完成所有频繁项集的搜索,然后利用此方法设计出一个新的增量式挖掘算法,在不影响准确率的情况下大大地提高了挖掘效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号