首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
数据挖掘技术是一门新兴的数据分析技术。文章介绍了数据挖掘的技术方法,探讨了该技术在数字图书馆中的应用。通过分析基于Web的数据挖掘技术,提出一个基于Web的数字图书馆数据挖掘模型,并对模型各个组成部分的功能进行了说明。  相似文献   

2.
数据挖掘在电子商务中的应用   总被引:1,自引:0,他引:1  
通过分析电子商务应用数据挖掘的必要性和可行性,概述数据挖掘的一些挖掘技术,重点介绍了数据挖掘在电子商务中的实际应用,包括营销、电子商务系统规划和系统安全、客户关系管理以及网络广告方面的应用。  相似文献   

3.
通过分析电子商务应用数据挖掘的必要性和可行性,概述数据挖掘的若干挖掘技术,重点介绍了数据挖掘在电子商务中的应用,包括营销方面的应用、电子商务系统规划和系统安全方面的应用、客户关系管理方面的应用以及网络广告方面的应用等。  相似文献   

4.
数据挖掘技术近几年在图书馆行业得到不断广泛的应用,文章通过文献计量学、研究方向和算法、应用软件、数据处理和选择及技术应用详情等方面分析图书馆在数据挖掘实践应用方面的进展情况。  相似文献   

5.
数据挖掘技术近几年在图书馆行业得到不断广泛的应用,文章通过文献计量学、研究方向和算法、应用软件、数据处理和选择及技术应用详情等方面分析图书馆在数据挖掘实践应用方面的进展情况。  相似文献   

6.
本文介绍数据挖掘的一般技术与方法,综述数据挖掘技术在信息管理领域的应用,着重对数据挖掘在图书馆和档案馆中的应用进行了分析比较。  相似文献   

7.
Web 是动态性极强的信息源,访问、分析信息必须研究异构数据的集成问题,并选择合适的技术进行数据 分析、集成和处理。怎样对Web 海量的数据信息进行深层次的应用已成为数据挖掘技术的研究热点。本文介绍了XML (可扩展标记语言)在Web 数据挖掘中的应用,探讨了Web 数据挖掘中的数据异构问题。通过XML技术建立数据抽取模 型,解决互联网上绝大多数因异构、非结构化所导致的Web 数据挖掘问题。  相似文献   

8.
数据挖掘的应用研究   总被引:5,自引:0,他引:5  
数据挖掘是当今新的技术热点。本文从数据挖掘概念及预处理过程展开研究,分析了数据挖掘的常用算法及其应用,重点阐述了数据挖掘在知识管理中的应用,分析了利用数据挖掘发现的知识类型,并用具体案例叙述数据挖掘的应用,明确指出了在知识管理应用中存在的问题,展望了数据挖掘未来的研究方向。  相似文献   

9.
如何在图书管理工作中应用数据挖掘技术,更好地提供智能化和人性化的服务,是目前高校图书管理者所亟待解决的问题。本文分析了数据挖掘技术给高校图书馆所带来的机遇和挑战,对数据挖掘技术在高校图书馆中的应用进行了分析。  相似文献   

10.
基于数据挖掘的数字图书馆个性化服务系统的构建   总被引:15,自引:0,他引:15  
本文通过介绍数据挖掘技术及数字图书馆个性化服务的含义,探讨数据挖掘在数字图书馆个性化服务中的应用,提出了利用数据挖掘技术构建数字图书馆个性化服务系统的过程。  相似文献   

11.
数据挖掘技术的改进在图书馆个性化服务中的应用   总被引:8,自引:0,他引:8  
Apriori 算法是关联规则挖掘的一个经典算法,在分析关联规则挖掘算法的基础上,提出利用HASH表技术及减少生成候选集的数量对经典Apriori 算法进行改进,从而提高图书馆数据资源的利用率,加强图书馆个性化服务。  相似文献   

12.
杨海廷 《图书馆杂志》2012,(1):70-75,25
将CARMA算法这一新式数据挖掘算法应用于图书借阅流通领域。在概述CARMA算法的基础上,文章完整、详尽地阐述了将CARMA挖掘算法应用于图书流通领域从数据预处理到建立模型再到数据挖掘结果分析的整个流程,并基于上海交通大学图书馆2009-2010年的借阅数据进行了实证研究,得出了各类图书间的借阅关联性。本研究意在为图书馆图书资源采购和馆藏资源空间布置提供可资借鉴的依据。最后,文章还给出了图书馆在图书采购工作和馆藏资源空间布置等方面的建议。  相似文献   

13.
We present a non-greedy version of the recently published Principal Direction Divisive Partitioning (PDDP) algorithm. The PDDP algorithm creates a hierarchical taxonomy of a data set by successively splitting the data into sub-clusters. At each level the cluster with largest variance is split by a hyper-plane orthogonal to its leading principal component. The PDDP algorithm is known to produce high quality clusters, especially when applied to high dimensional data, such as document-word feature matrices. It also scales well with both the size and the dimensionality of the data set. However, at each level only the locally optimal choice of spitting is considered. At a later stage this often leads to a non-optimal global partitioning of the data. The non-greedy version of the PDDP algorithm (NGPDDP) presented in this paper address this problem. At each level multiple alternative splitting strategies are considered. Results from applying the algorithm to generated and real data (feature vectors from sets of text documents) are presented. The results show substantial improvements in the cluster quality.  相似文献   

14.
周波  杨朝峰 《情报工程》2016,2(1):077-090
全面总结和介绍基于二分网络的推荐算法研究现状,旨在介绍基于二分网络推荐算法的思想和各种优化方法,帮助读者了解这个研究领域.先介绍了二分网络推荐算法研究的背景和基于物质扩散和热传导的两种基本二分网络推荐算法,然后总结了8大类的优化算法,最后指出了当前还未研究的但还值得进一步研究的地方,并对大数据环境下基于二分网络的推荐算法进行了展望.  相似文献   

15.
在互联网发展的下半场中,算法作为数据与人工智能的节点,发挥着构造流量入口、捕捉用户黏性的关键作用.在一个媒体和代码无处不在的社会,权力越来越存在于算法之中.文章对算法在新闻环节中的权力体现进行了具体分析,并考察了媒介和受众的权力变化过程,最后对算法纠正偏差的机制做出了相应的展望式探讨.  相似文献   

16.
文章在对DBSCN与K-means两种经典聚类算法分析研究基础上,结合中文文本数据的特点,对这两种方法进行结合与改进,提出了一种中文文本聚类方法:DKTC。该算法能自动产生簇的个数,且对“噪声”或异常数据不敏感,对数据的输入顺序不敏感,另外,与DBSCAN相比,该算法有更高的处理效率。实验表明,DKTC算法不仅能对中文文本进行聚类,且与传统DBSCN与K-means法相比,聚类效果都有一定程度的改善。  相似文献   

17.
图书流通信息多层关联规则挖掘法的优化与应用   总被引:1,自引:0,他引:1  
通过对FP-Growth算法的扩展,提出图书流通信息关联规则挖掘的新算法即MACLC-FP(Multilevel Association with Chinese Library Classification FP)算法;结合实例着重阐述应用该算法,采用多层关联分析技术,挖掘读者借阅行为中隐含规律的可行性;进而探讨该数据挖掘技术在现代图书馆中的应用前景。这对图书馆调整资源建设的学科结构、提升读者服务的工作水平都具有重要意义。  相似文献   

18.
针对传统的相似度计算方法在海量信息处理过程中暴露出的数据处理规模限制和性能不足等方面的瓶颈问题,以非结构化文档为研究对象,提出一种基于Hadoop分布式环境,结合Hive数据处理平台和PostgreSQL关系型数据库的文档相似度计算方法,并给出关键技术思路、具体实现步骤和实证研究,通过研究证明Hive SQL语言可有效简化分布式数据处理的复杂性,但实时性有待改进。  相似文献   

19.
基于改进编辑距离的相似重复记录清理算法   总被引:1,自引:0,他引:1  
相似度计算是相似重复记录清理过程中的一个关键问题,编辑距离算法在其中具有广泛应用。在传统编辑距离算法的基础上,通过分析影响相似度计算结果的序列长度、同义词等因素,得到一种同时引入同义词词库和归一化处理思想的改进的基于语义编辑距离的相似重复记录清理算法,适用于相似记录的识别过程。实验分析表明,改进算法计算结果更符合句子的语义信息,绝大部分结果符合人们的认知经验,从而可以有效地提高相似重复记录识别的准确率和精确度。  相似文献   

20.
K-means算法研究综述   总被引:4,自引:0,他引:4  
对聚类分析中的基本算法K-means算法中的K值确定、初始聚类中心选择以及分类属性数据处理等主要问题进行综述,理清K-means算法的整个发展脉络及算法研究中的热点和难点,提出改进K-means聚类算法的思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号