共查询到10条相似文献,搜索用时 15 毫秒
1.
关联规则数据结构分布重排的数据库索引算法 总被引:1,自引:0,他引:1
《科技通报》2015,(10)
数据库优化索引是实现文本数据信息智能存储和调用的关键技术,网络信息文本数据具有较大的关联规则特性,造成了数据结构类间干扰,影响数据库索引精度。传统方法采用虚拟数据分布重组数据库索引技术,文本数据库扩展查询中会出现聚类特征不一致。提出一种基于关联规则数据结构分布重排的数据库索引算法。先构建网络信息文本数据库相对关联状态系统模型与关联规则关系图,在此基础上进行数据库规则信息流的结构分布重排,挖掘关联特征,实现数据库索引算法改进。仿真结果表明,采用该算法进行文本数据库索引,提高了特征匹配效率,降低执行时间,展示了优越性能。 相似文献
2.
3.
多源数据辨识系统广泛应用在机载数据辨识控制、大型机械设备故障诊断和云存储系统数据库集成等领域。对多源数据的辨识系统并行查询和数据调度中,因数据的静态非线性测量过程影响了查询效益,需要对辨识系统并行查询链路进行扩展。提出一种基于振幅调节Fourier变换边缘逆理论的辨识系统并行查询扩展算法。进行多源数据辨识系统基本构造和模型设计,提取查询特征信息,采用RBF神经网络系统进行多源数据输入自适应学习,构建神经网络辨识系统的边缘逆向量,采用边缘逆理论进行振幅调节Fourier变换实现多源查询数据的状态重组,实现查询链路扩展设计改进。仿真结果表明,该算法提高了辨识系统的查询通道的链路相位,多源数据调度的时间成本及空间成本大幅降低,加速比提高,算法将在系统状态识别、机械故障智能诊断等领域具有较高的应用价值。 相似文献
4.
采用传统算法进行混合型数据库查询,由于文档与查询的匹配过于严格,存在对检索词的重要程度无法区分的问题,造成无法进行检索结果的排序的缺陷。为此,提出了一种基于改进均值聚类算法的混合型数据库查询优化方法。建立混合型数据库查询执行计划代价模型,精准的定义了数据库查询执行代价。将改进均值聚类算法与粒子群算法有效的相融合,将粒子群中的粒子划分为多个子群,更新所有的粒子,通过粒子间的相互信息融汇,搜寻到数据库查询最优解。实验仿真证明,基于改进均值聚类算法的混合型数据库查询优化方法精确度高,效率高。 相似文献
5.
6.
由于向量空间模型在文本聚类中的应用,而必须对文本特征进行降维。本方法首先利用特征的概率分布计算特征之间的相似度,在此基础上对特征进行聚类;然后在文本聚类的结果上计算各个特征的信息增益值;最后在各个特征类上取出一定比例的最重要的特征达到特征选择的目标。实验表明,该改进算法在聚类的准确度方面较以前的方法有所提高,可以有效地用于文本自动聚类。 相似文献
7.
提出了一种新的相似视频快速检索方法.根据视频的时空分布统计得到图像特征码和视频单元,通过统计视频单元数量度量视频相似性.为了适应可扩展计算的需要,提出了基于聚类索引表的检索方法.通过对大规模数据库的查询测试证明该相似性检索算法快速有效. 相似文献
8.
SOM聚类算法在文本分类上的应用 总被引:2,自引:0,他引:2
随着网络信息指数级的增长,如何高效地组织海量的文本信息成为众多终端信息查询的基本要求。本文利用神经网络的联想记忆原理,提出一种改进自组织映射(SOM)神经网络聚类算法来对这些信息进行索引和分类。改进SOM聚类算法通过文本的预处理和词汇权值的计算,SOM网络的训练过程以及多次聚类来细化各文本类别,最终产生概念空间。试验结果表明该算法对文本有很好的分类管理功能,便于文本检索。 相似文献
9.
提出一种基于数据倾斜关联度的数据高效算法,首次给出数据倾斜度的概念,利用数据类间特征进行数据倾斜程度的判断,对相似数据进行类间聚类,将数据库中数据特征进行信息相似度计算,计算概念总出现次数时应累加其所有子概念的出现次数。在查询的过程中,充分考虑同一数据属性的多样性,对数据特征加入模型的数量进行约束,减少不必要的繁琐数据特征。判断符合查询条件的数据类别,根据不同的数据类别进行数据查询,实现数据结构的优化。实验结果表明,利用这种算法进行数据库查询优化,能够有效提高海量数据库信息查询的效率。 相似文献