首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
关联规则数据结构分布重排的数据库索引算法   总被引:1,自引:0,他引:1  
数据库优化索引是实现文本数据信息智能存储和调用的关键技术,网络信息文本数据具有较大的关联规则特性,造成了数据结构类间干扰,影响数据库索引精度。传统方法采用虚拟数据分布重组数据库索引技术,文本数据库扩展查询中会出现聚类特征不一致。提出一种基于关联规则数据结构分布重排的数据库索引算法。先构建网络信息文本数据库相对关联状态系统模型与关联规则关系图,在此基础上进行数据库规则信息流的结构分布重排,挖掘关联特征,实现数据库索引算法改进。仿真结果表明,采用该算法进行文本数据库索引,提高了特征匹配效率,降低执行时间,展示了优越性能。  相似文献   

2.
当前超文本查询算法存在查询关键词和超文本用词不匹配的问题,导致查询精度低,效率低下。为此,提出一种新的基于关联规则的大型关系数据库超文本查询算法,对权重计算过程、关联规则算法和信息检索模型进行分析。利用起始查询结果的前几篇超文本对关联规则进行挖掘,选取包含起始查询项的关联规则建立规则数据库,挑选出和查询词相关度最高的几个词作为扩展词,和起始查询结合成新的查询后重新查询,通过K-means聚类算法对新的查询结果进行聚类解析,求出各篇超文本的最后相关度,按照降序顺序对相关度进行排列,输出查询结果。实验结果表明,所提算法精度和效率高。  相似文献   

3.
姜攀 《科技通报》2015,(2):76-78
多源数据辨识系统广泛应用在机载数据辨识控制、大型机械设备故障诊断和云存储系统数据库集成等领域。对多源数据的辨识系统并行查询和数据调度中,因数据的静态非线性测量过程影响了查询效益,需要对辨识系统并行查询链路进行扩展。提出一种基于振幅调节Fourier变换边缘逆理论的辨识系统并行查询扩展算法。进行多源数据辨识系统基本构造和模型设计,提取查询特征信息,采用RBF神经网络系统进行多源数据输入自适应学习,构建神经网络辨识系统的边缘逆向量,采用边缘逆理论进行振幅调节Fourier变换实现多源查询数据的状态重组,实现查询链路扩展设计改进。仿真结果表明,该算法提高了辨识系统的查询通道的链路相位,多源数据调度的时间成本及空间成本大幅降低,加速比提高,算法将在系统状态识别、机械故障智能诊断等领域具有较高的应用价值。  相似文献   

4.
丁秀琴 《科技通报》2015,(4):199-201
采用传统算法进行混合型数据库查询,由于文档与查询的匹配过于严格,存在对检索词的重要程度无法区分的问题,造成无法进行检索结果的排序的缺陷。为此,提出了一种基于改进均值聚类算法的混合型数据库查询优化方法。建立混合型数据库查询执行计划代价模型,精准的定义了数据库查询执行代价。将改进均值聚类算法与粒子群算法有效的相融合,将粒子群中的粒子划分为多个子群,更新所有的粒子,通过粒子间的相互信息融汇,搜寻到数据库查询最优解。实验仿真证明,基于改进均值聚类算法的混合型数据库查询优化方法精确度高,效率高。  相似文献   

5.
对层次网络数据库的敏感信息快速索引是提高数据库访问技术的基础,传统方法采用矢量模型特征聚类算法进行数据库敏感信息特征提取和索引,当数据库中的信息呈现多源化状态时,数据库索引精度不高。提出一种基于多源数据相位谱补偿的数据库索引算法。构建多源数据库模型,进行数据库访问信道分配设计,分析多源数据的相位谱特征,进行相位谱补偿实现数据库索引算法优化,仿真结果表明,采用该算法对含有多源信息特征的数据库进行信息检索和访问,信息匹配准确度较高,特征提取准确,提高数据库访问性能。  相似文献   

6.
由于向量空间模型在文本聚类中的应用,而必须对文本特征进行降维。本方法首先利用特征的概率分布计算特征之间的相似度,在此基础上对特征进行聚类;然后在文本聚类的结果上计算各个特征的信息增益值;最后在各个特征类上取出一定比例的最重要的特征达到特征选择的目标。实验表明,该改进算法在聚类的准确度方面较以前的方法有所提高,可以有效地用于文本自动聚类。  相似文献   

7.
提出了一种新的相似视频快速检索方法.根据视频的时空分布统计得到图像特征码和视频单元,通过统计视频单元数量度量视频相似性.为了适应可扩展计算的需要,提出了基于聚类索引表的检索方法.通过对大规模数据库的查询测试证明该相似性检索算法快速有效.  相似文献   

8.
SOM聚类算法在文本分类上的应用   总被引:2,自引:0,他引:2  
丁露  崔平 《现代情报》2007,27(9):162-164
随着网络信息指数级的增长,如何高效地组织海量的文本信息成为众多终端信息查询的基本要求。本文利用神经网络的联想记忆原理,提出一种改进自组织映射(SOM)神经网络聚类算法来对这些信息进行索引和分类。改进SOM聚类算法通过文本的预处理和词汇权值的计算,SOM网络的训练过程以及多次聚类来细化各文本类别,最终产生概念空间。试验结果表明该算法对文本有很好的分类管理功能,便于文本检索。  相似文献   

9.
提出一种基于数据倾斜关联度的数据高效算法,首次给出数据倾斜度的概念,利用数据类间特征进行数据倾斜程度的判断,对相似数据进行类间聚类,将数据库中数据特征进行信息相似度计算,计算概念总出现次数时应累加其所有子概念的出现次数。在查询的过程中,充分考虑同一数据属性的多样性,对数据特征加入模型的数量进行约束,减少不必要的繁琐数据特征。判断符合查询条件的数据类别,根据不同的数据类别进行数据查询,实现数据结构的优化。实验结果表明,利用这种算法进行数据库查询优化,能够有效提高海量数据库信息查询的效率。  相似文献   

10.
基于大数据技术的网络舆情文本挖掘研究   总被引:1,自引:0,他引:1  
通过分析大数据与网络舆情数据的相似特征,基于大数据思想构建网络舆情的文本挖掘模块,并在此基础上构建预警模型,对关系型数据库与分布式数据库进行了融合,使之适应模型从数据采集到分析查询的全部流程;并对大数据核心技术MapReduce进行扩展,改进的MapReduce贯穿于数据处理模块的文本特征向量提取与舆情指数的矩阵-向量乘积运算。通过仿真实验,证明该模型具有一定的准确性与良好的时效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号