首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 658 毫秒
1.
本文基于国内外最新研究成果对电子商务中应用的web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题,给出了基于web日志的客户群体聚类算法及web页面聚类算法。利用这些web挖掘技术可有效挖掘用户个性特征,从而指导电子商务网站资源的组织和分配。  相似文献   

2.
语义web是web2.0时代计算机对网络发展做出的定义,是自动语义处理用户的数据,以帮助用户使用,同时提供个性化的服务。web数据挖掘是数据挖掘的一个应用,利用数据挖掘技术从网络文档中抽取并且发现信息,着重从web日志和数据中发现模式。语义结构可以通过web挖掘发现的模式或关系来构建,通过结合两个应用程序,实现语义web挖掘。在电子教学中的web挖掘应用,已成为一个教育的基本组件。  相似文献   

3.
随着互联网的日益普及和电子商务的迅速发展,基于Web日志挖掘聚类算法的电子商务在市场中竞争越来越激烈.本文首先概述Web使用挖掘,简单介绍日志挖掘技术中两个关键技术,聚类分析和序列模式挖掘,进而讨论Web日志挖掘的数据预处理过程,包括用户,数据净化,路径补充等.对于传统的矩阵聚算法进行优化,应用该算法可以对客户和页面进行聚类分析,达到发现相似的客户群体,挖掘潜在客户群.通过实验表明改进的算法具有较高的扩展性和准确性,证明将挖掘结果应用于个性化推荐系统的思想是可行有效的.  相似文献   

4.
Web使用模式挖掘是从用户浏览网站的数据中抽取感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构或为用户提供个性化的服务。尽管Web日志挖掘是一些数据挖掘算法的应用,但不是简单地将数据挖掘算法修改为适用于新的数据类型,其中涉及许多处理工作。试从偏离网页的去除、使用者浏览路径相似程度的计算,对使用者浏览路径的模糊聚类的分析三个方面论述FC—MDE模糊聚类的Web用户模式挖掘。  相似文献   

5.
粗糙集理论是有效处理不精确、不确定和含糊信息的软计算工具,模糊聚类分析是依据客观事务间的特征、亲疏程度和相似性,通过建立模糊相似关系对客观事务进行分类的方法.网站日志数据通常是大量的,冗余的,日志中的页面之间的关系也是模糊的,不确定的.该文利用粗糙集理论和模糊聚类的方法对某学校网站的日志数据进行实例分析,抽取用户感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构,为用户提供个性化服务.  相似文献   

6.
针对Apache web服务器集群产生的海量日志记录进行数据分析,使用Flume-ng从web服务器集群收集日志文件,利用Hadoop云平台的HDFS进行分布式日志数据存储,以MapReduce为日志数据分析编程框架,设计实现了一个web日志分析系统,论文阐述了系统的结构、设计思想和实现方法。  相似文献   

7.
长期稳定的更新是精品课程资源拥有生命力和价值的保障。但是,目前大部分精品课程在专家评审之后很少再去不断地更新,精品课程先进性、科学性、"示范课程"的价值也就得不到很好的体现。精品课程网站的日志记录了大量的学习者使用信息,通过web日志挖掘技术统计分析这些使用行为信息,对优化精品课程建设有重要意义。本文主要通过统计web日志中使用者的ip、访问时间、访问频率等信息,挖掘使用者的使用行为习惯,根据使用者使用行为习惯来模糊评价该精品课程资源的更新情况,以此督促精品课程建设者不断更新精品课程资源,保证其动态化。  相似文献   

8.
在Web日志挖掘的基础上,构建挖掘系统模型,采用模糊聚类方法对采集的日志数据进行聚类,得到用户的访问模式,从而指导校园网网站管理人员改善Web站点结构,提高用户查找信息的准确率和效率。  相似文献   

9.
提出了一种基于核的聚类方法,增加对样本特征的优化;通过核函数,把数据样本空间映射到一个高维的特征空间;在特征空间对数据样本进行k-中心点聚类,并通过计算类内距离作为适应度准则,取其最优的结果。通过Web日志挖掘中的Web客户聚类应用比较,表明核聚类方法在性能上比经典的聚类算法有较大的改进,从而实现更为准确的聚类。  相似文献   

10.
随着互联网信息的增长,Web挖掘已经成为数据挖掘研究的热点之一,尤其适用于电子商务领域。阐述了Web数据挖掘的定义从及分类,并分析了Web日志挖掘的处理流程。接着谈及Web数据挖掘在电子商务中的作用,并通过具体实例探讨了电子商务中web 数据挖掘过程。  相似文献   

11.
大学生网络生活方式之聚类分析:以北京大学为例   总被引:3,自引:0,他引:3  
网络生活方式是近年国内外学者关注的一个热点问题,对青少年的生活、学习、认知以至价值观念都产生了深远影响。本文以北京大学为案例,对大学生网络生活方式进行了实证研究。作者以社会学研究中生活方式及其测量方法为基础,提出了网络生活方式的概念、内涵及分析模型,并通过问卷方式调查北大学生网络生活现状,通过因子萃取与聚类分析等统计方法,将目标研究人群细分为网络沉溺型、冷静保守型、信息前沿型和社交活跃型四种基本类型。最后,作者提出了根据大学生网络类型而实施分类引导的相关教育建议。  相似文献   

12.
随着SOA迅猛发展和互联网上服务数量俱增,服务发现成为极具挑战性的工作。传统的服务发现方法在语义稀疏情境下精准度不高,主要是缺乏有效信息对发现工作的支持,无法对服务进行准确的类别划分。针对此问题,提出一种基于BTM面向Web服务短文本描述的服务聚类方法S3C,该方法的主要思想是利用BTM在短文本聚类过程中使用Biterm(词对)优势对服务描述进行潜在特征表示,基于服务潜在特征使用Kmeans聚类方法进行服务聚类。BTM采用词对的主题建模方式,能够极大程度地扩展文本信息,解决短文本中的关键词稀疏问题。采用PWeb数据集进行大量对比实验可知,该方法与经典聚类方法相比,类簇的平均纯度提高30%,平均熵降低近50%。  相似文献   

13.
聚类是指按照事物间的相似性对事物进行区分和分类的过程。对网络个性化学习行为中的大量数据,首先对样本数据进行了预处理,然后运用数据挖掘算法中的K-means算法进行分类,获取各类与网络学习行为属性的关系。在Clementine中的实验结果表明,该算法能够将数据准确聚类,为教师教学培养目标的制定提供一定的决策支持。  相似文献   

14.
互联网的飞速发展为大众带来便利的同时也产生了大量冗余信息,利用自然语言处理技术对新话题文章进行提取,控制新话题中虚假新闻传播,可为舆情控制提供有效支持。提出一种基于词聚类信息熵的新闻提取方法,并对“一带一路”相关新闻语料进行实验。实验通过网络爬虫的方式获取相关报道,利用Pkuseg工具分词进行一系列预处理后训练生成Word2vec词向量,然后利用词频统计筛选出历史高频词进行K-means聚类,将聚类后的词簇作为随机变量计算当前文章的信息熵。若文章的信息熵高于设定阈值,则为新话题文章,需要重点关注。结果表明,该方法在阈值设置为0.65时,新闻提取结果的准确率可达到84%。  相似文献   

15.
针对分布式无线网络多跳、移动的特点,要实现整个网络的快速部署以及拓扑结构变化后的动态重建,最有效的方法是采用分群协议,并在linux环境下,利用基于图论的ANMP分群算法,实现自组网的分群。  相似文献   

16.
大学生网络使用心理与行为及网络依赖特征研究   总被引:1,自引:0,他引:1  
本研究综合运用访谈法和问卷法,探索了294名大学生的互联网使用心理与行为特征及网络依赖特征间的相互关系。结果表明大学生互联网使用的心理与行为特征存在一定的性别和年级差异;不同的上网动机与不同的互联网服务呈显著正相关;除上网时间与对网络的依赖程度呈显著正相关外,不同的互联网使用动机与行为也显著影响着对网络依赖的程度。本研究的发现可以用来引导大学生用户科学地使用互联网,避免互联网使用可能带来的消极影响。  相似文献   

17.
为了探讨大学生心理需求、网络控制自我效能与网络成瘾行为的关系,选取五所大学的1183名学生为被试进行研究.采用的问卷有中文网络成瘾量表、大学生心理需求网络满足问卷、网络控制自我效能问卷.研究发现:心理需求现实满足、心理需求网络满足与大学生网络成瘾显著相关;心理需求现实满足对大学生网络成瘾行为有负向的预测作用,而对心理需求网络满足有正向预测作用;网络控制自我效能是心理需求现实满足与网络成瘾的中介变量,而非心理需求网络满足与网络成瘾的中介变量.研究结果对大学生网络成瘾的预防和干预具有一定的意义.  相似文献   

18.
采用网络交往问卷和总体幸福感量表对258名高职学生进行施测,探讨网络交往对主观幸福感的影响作用。结果表明网络人际关系是主观幸福感的积极影响因素;网络社交自我知觉、网络交往依赖是主观幸福感的消极影响因素。网络人际关系得分越高,个体精力越旺盛;网络社交自我知觉得分越高,个体对生活的满足和兴趣越低,感觉越紧张;网络交往依赖得分越高,个体精力越差,对情感和行为的控制越弱。网络交往对主观幸福感的影响不能一概而论,要从网络交往的关系层面、认知层面等进行细分。  相似文献   

19.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

20.
针对互联网带来的负面影响,教育工作者必须用疏导的方式,转变观念,树立数字化信息时代的德育意识;加大网络道德的教育力度,帮助学生树立健康的网络意识,培养健康的网络人格;运用网络功能与青少年进行思想交流;利用网络优势,培养学生的创造精神和实践能力,开展新型的班会和课外活动,提高家长的网络知识水平和网络道德意识。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号