首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
Web信息复杂程度不断加深,多维度、高复杂度的信息越来越多,信息中的错误信息特征在海量复杂数据属性中表述越来越困难,造成信息挖掘耗时过长,挖掘效果不好的问题。为了解决这一问题,提出了一种距离信息模糊信息权值分类的Web错误数据挖掘算法。在Web特征表述过程中,运用距离描述Web数据的错误数据特征,运用模糊信息熵,对错误数据特征进行距离分类,保证数据分类的准确性,最大程度的完成错误数据高效挖掘。实验结果表明,该算法能有效减少错误数据信息在海量信息中的挖掘时间,提高了挖掘的准确性,取得了满意的效果。  相似文献   

2.
网络环境下的信息检索与数据挖掘技术   总被引:1,自引:0,他引:1  
陈维  阮海红 《现代情报》2009,29(5):144-146
首先对网络环境下信息检索的现状进行分析。主要介绍网络信息检索的代表工具一搜索引擎的工作原理、缺陷夏发展方向,引出数据挖掘技术。并进一步对WEB数据挖掘技术作了概要的介绍,阐明WEB数据挖掘技术是网络信息检索智能化的重要发展方向之一。最后,提出一个结合数据挖掘技术的新的搜索引擎结构模型。  相似文献   

3.
张佳 《科技通报》2019,35(2):76-79,84
针对当前只关注对数字图书馆网络功能的提高,忽略了对信息扩散的问题。为此,通过关联规则方法对海量图书信息数据扩散进行研究,给出关联规则的基本概念,并介绍了数字图书馆网络的特征,将API与编写抓取程序、开放数据等技术结合在一起;利用Apriori算法通过层次顺序搜索的循环方法对图书信息数据频繁项集进行挖掘,采集数字图书馆网络中某用户粉丝、关注者、转发以及评论信息扩散数据;将关联规则作为研究海量图书信息数据扩散方法,通过关联规则衡量节点度和出入度;在此基础上通过关联规则对海量图书信息数据扩散情况进行研究,发现海量图书信息扩散有高低谷期;转发量和评论量呈一定的正相关性;数字图书馆网络中海量图书信息数据扩散的广度和用户影响力相关。  相似文献   

4.
WEB访问信息挖掘在B2C站点中的应用研究   总被引:1,自引:0,他引:1  
施建华 《大众科技》2010,(12):22-22,25
文章立足于WEB数据挖掘技术,就WEB访问信息挖掘技术如在在网购B2C站点中的应用展开研究。其主要应用有以下几方面:利用WEB访问信息挖掘发现导航模式、利用WEB访问信息挖掘改进B2C站点访问效率、利用WEB访问信息挖掘进行B2C站点商业智能发现。  相似文献   

5.
Web网络中存在海量文本,需要进行合理高效的文本抽取,实现Web文本数据挖掘。由于Web文本数据的高维特性,文本抽取过程中自动分类配对困难。提出一种基于RBF神经网络隐节点共振致密配对的Web数据文本抽取算法,进行Web数据文本特征采样与关联主特征挖掘,在每次移动中形成RBF隐节点共振致密配对,得到最优文本特征选择的路径,建立RBF神经网络分类器,实现基于蚁群算法的特征抽取算法改进。实验结果表明,该算法能有效实现对隐节点的共振致密配对,特征挖掘跟踪性能较好,保障了挖掘性能,系统所提取的特征分量与其他模糊分量差距较小,文本正确抽取召回率高于传统方法,在Web网络数据文本抽取中具有优越可靠的应用价值。  相似文献   

6.
现阶段的信息挖掘技术中准确度受到影响最为严重,对用户造成重大的安全隐患。为此,提出一种基于参数模糊判断的海量信息挖掘模型,通过互联网环境下产生的海量信息进行参数模糊识别判断,经由互联网环境下参数采集模块将采集信息进行模糊判断信息挖掘。仿真实验表明,基于参数模糊判断的海量信息挖掘模型能够有效地提高海量信息提取的准确性,并且在长海量信息挖掘过程中挖掘速度快,可靠性强。有效地为海量信息挖掘技术高效运行提供更好的保障。  相似文献   

7.
数据密集型网格示范站点建设与应用取得良好效果   总被引:1,自引:0,他引:1       下载免费PDF全文
近年来,随着科学研究规模的日益扩大,科学家需要采集海量数据用于研究和解决复杂的科学问题,而科学数据呈数量级增长对计算技术提出了更大的挑战。数据密集型网格平台建立在网格技术基础上,是一种对海量数据进行高效分  相似文献   

8.
在网络社区兴起的背景下,鉴于网络社区的海量评论数据中蕴含着大量专家用户群体智慧,本文提出基于网络评论文本挖掘的技术预见新型方法,以促进技术预见活动顺利实施并取得准确可信的最终结果。首先从多源数据中获得种子科技主题,并将其投放至开放网络社区,吸引专家用户进行充分讨论形成交互数据,经过数据爬取、清洗、存储等环节得到网络评论数据集,再利用情感分析、主题模型等方法对网络评论中蕴含的隐性知识进行显性化挖掘,并结合相关领域专家的研判,最终得到辅助技术预见决策的有价值信息。通过新型方法,可以使技术预见活动大幅降低成本、打破时空限制,便于大规模专家参与其中,并最大限度降低少数专家主观色彩浓厚的负面影响。  相似文献   

9.
汪苗苗  焦学磊 《科技通报》2019,35(6):20-23,57
为了提高对海量数据的检测过滤能力,提出基于概率数学模型的数据过滤方法,采用描述性统计分析方法构建大数据过滤的统计特征分析模型,采用高阶累积量进行数据过滤的概率密度特征统计量设计,结合模糊数学推理进行数据过滤的检测统计量分析,在海量数据环境下根据检测统计量分布的概率密度进行回归分析,采用阈值检验和门限判决方法,实现数据过滤。数据测试结果表明,采用该方法进行大数据过滤的准确性较好,数学模型的可靠性和收敛性较好。  相似文献   

10.
"老科学家学术成长资料采集工程"(以下简称"采集工程")是由中国科协牵头,会同中组部、教育部、科技部等11部委,以抢救和挖掘我国老一辈科学家学术成长史料为目标的国家基础性工程。采集工程历经10年建设,已积累海量可供探究科技人才成长规律、宣传卓越科技人物的实物和数据资料。本文从信息化建设角度出发,在系统介绍当前采集数据成果的基础上,对各环节涉及的数据采集、存储、分析和展示的全生命周期管理和信息化系统进行归纳分析和展示,总结采集过程中遇到的问题,并据此提出建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号