首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 154 毫秒
1.
余润海 《考试周刊》2009,(24):181-181
本文首先介绍了Web结构挖掘技术在Web中的应用,其次陈述了Web结构挖掘技术中的经典链接分析算法PageRank,最后分析了PageRank在网页搜索中具体实现的方法。  相似文献   

2.
设计一个社区发现方法挖掘在线内容网络的潜在结构,在预处理阶段基于网络的链接和节点内容属性对内容网络进行重构,基于重构网络进行链接抽样;在社区发现阶段利用概率链接模型对采样后的网络建模,并用EM算法求解模型参数,根据参数可得内容网络的潜在结构。  相似文献   

3.
Web社区是Web组织中非常重要的信息,将其用于信息搜索策略中可从本质上改善信息检索的结果,为用户提供潜在、及时、准确的信息;如何发现这些高精度的社区,进而快速从网上找到更多关于某一主题的网页是Web数据资源挖掘领域的热点.本文提出了一种多尺度语义Web社区提取算法,该算法很好的将语义信息融入到传统的社区模型中.实验表明,该算法提取的社区精度高,且漏检率较低,社区结构与其所对应的语义产生了较好的映射关系.它为信息检索的社区化奠定了重要的理论基础.  相似文献   

4.
分析了Web链接结构及其应用,对链接分析在Web信息搜索、万维网潜在的社团发现及万维网建模等方面的研究进行了综述,并深入研究了各个链接分析算法的优缺点及性能,作出了分类评价,为以后的算法改进提供了理论基础。  相似文献   

5.
Web挖掘是指使用数据挖掘技术从Web文档和服务中发现和提取信息和知识的技术。本文概述了Web数据挖掘的基本情况以及Web结构挖掘和Web使用挖掘的基本概念。结合对Web结构挖掘中的PageRank算法和Web使用挖掘的主要步骤和算法的研究后,本文提出了一种融合这两种Web挖掘算法的一种新的、综合的Web挖掘算法。  相似文献   

6.
介绍了搜索引擎和Web结构挖掘的相关知识,重点研究Web结构挖掘的PageRank算法以及它在搜索引擎中的应用。在基于Web页面相似度的基础上提出了改进的PageRank算法,通过实验证明,改进后的算法可以使搜索引擎的性能得到极大的提高。  相似文献   

7.
随着计算机网络的快速发展,Web数据量呈快速增长,在海量的Web数据中发现有价值的数据和知识,是数据挖掘技术的重要应用.分析和研究Web数据挖掘的内容和过程,介绍Web数据挖掘的算法十分必要.  相似文献   

8.
Web日志挖掘是对用户与Web服务器在交互时产生的数据,采用数据挖掘技术发现隐含的规律性知识。首先对Web日志挖掘进行了概述,重点研究了关联规则算法中的Apriori算法,并对Apriori算法进行了改进,最后给出具体实例。  相似文献   

9.
为了提高从web中挖掘数据记录的精确性和完整性,提出了同构页与目录页的概念及3个算法.如果一组网页结构相同,只是主信息不同,该网页称为同构页.一个包含有多个指向同构页连接的网页称为目录页.算法1用于发现目录页,它首先将连接排序,并对同一目录的链接记数,如果记数大于某一给定阀值,则对其链接子页进行相似比较并得到结果.同时给出了一个网页相似度判断的函数.算法2采用了噪声信息过滤方法从同构页中挖掘主信息并得到数据记录,该算法是基于在2个同构页中噪声信息相同而只有主信息不同.算法3通过采用Spider技术可以实现从整个网站中自动挖掘数据记录.实验表明所提算法比已有算法可挖掘更完整的数据记录.从同构页中挖掘数据记录是一种有效的方法.  相似文献   

10.
随着互联网的日益普及和电子商务的迅速发展,基于Web日志挖掘聚类算法的电子商务在市场中竞争越来越激烈.本文首先概述Web使用挖掘,简单介绍日志挖掘技术中两个关键技术,聚类分析和序列模式挖掘,进而讨论Web日志挖掘的数据预处理过程,包括用户,数据净化,路径补充等.对于传统的矩阵聚算法进行优化,应用该算法可以对客户和页面进行聚类分析,达到发现相似的客户群体,挖掘潜在客户群.通过实验表明改进的算法具有较高的扩展性和准确性,证明将挖掘结果应用于个性化推荐系统的思想是可行有效的.  相似文献   

11.
web挖掘技术是指从大量的web数据中提取隐含的、先前未知的、有潜在应用价值的模式、规则和知识,它是在数字图书馆中应用广泛的新技术。以XML为基础的新一代Web环境是直接面对Web数据的,不仅可以4良好地兼容原有的Web的应用,而又可以更好地实现Web中的信息共享与交换。本文介绍了基于XML的web挖掘技术的特点、方法及在数字图书馆中的应用。  相似文献   

12.
Web挖掘研究   总被引:3,自引:0,他引:3  
介绍了Web挖掘的任务和分类;讨论了Web的内容挖掘、结构挖掘和使用记录挖掘。  相似文献   

13.
Web挖掘技术和个性化、主动式Web信息服务一直是人们研究的热点,由于网络数据量大、结构复杂、内容多变,因而这两个问题的研究也存在着许多困难。本文将Web挖掘技术和Agent技术、机器学习相结合,以用户为中心和出发点构建了一个基T-Web挖掘的个人智能信息助手系统,并对其主要模块的功能进行了详细设计,最后对该系统的特点进行了阐述。  相似文献   

14.
在数据挖掘研究领域中,Web日志挖掘是Web使用挖掘的一个分支。它作为Web挖掘的一个重要组成部分,具有独特的理论和实践意义.通过介绍Web日志挖掘的概念,系统阐述了Web日志挖掘的全过程:数据收集、数据预处理、模式识别、实际应用.说明Web日志挖掘应用广泛,能够实现网站的优化问题.  相似文献   

15.
阐述了基于数据语义的XML语言规范,在此基础上,讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。  相似文献   

16.
在语义Web中,用户访问行为模型可以作为本体论共享.如何把Web访问活动转变成为本体论是一个非常关键的问题.为了解决这个技术问题,本文提出了一种在Web使用挖掘中集成模糊逻辑和形式化概念分析的本体论自动生成方法.文章首先对Web使用挖掘以及语义Web和本体论进行了介绍,然后该方法的体系结构及其生成过程也被详细地论述.  相似文献   

17.
基于Web挖掘的个性化信息服务系统的设计   总被引:1,自引:0,他引:1  
W eb挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。本文探讨了W eb挖掘的基本流程,提出了一种基于W eb挖掘的图书馆个性化信息服务系统实现方案。  相似文献   

18.
Web日志挖掘是利用数据挖掘技术挖掘和分析网络日志,并获取网站使用过程中的有价值的信息和模式的过程。预处理是Web日志挖掘的第一步,也是非常关键的一步,预处理的结果决定了挖掘的效率和质量。本文主要阐述了预处理的一般过程,并针对目前国内外常用的一些预处理技术进行了探讨和分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号