首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
本文在简要介绍了当前Web领域内链接分析的研究现状后,重点介绍了情报学视角和社会学视角的链接分析,最后通过比较两个视角研究之异同,提出了深化情报学视角的链接分析研究的建议.  相似文献   

2.
本文在简要介绍了当前Web领域内链接分析的研究现状后,重点介绍了情报学视角和社会学视角的链接分析,最后通过比较两个视角研究之异同,提出了深化情报学视角的链接分析研究的建议。  相似文献   

3.
Web2.0环境下的知识交流可以通过合作和链接这两种形式开展.Web2.0的主要特征是交互性,这正是知识交流的核心问题.论文探讨Web2.0与知识交流的关系主要从Web2.0环境下知识交流者之间的合作与链接关系出来,分别分析合作与知识交流、链接与知识交流的关系,最后分析Web2.0在知识交流中起到的重要作用,有利于进一步研究知识交流的模式和规律问题.  相似文献   

4.
主要介绍了设计开发Web主题信息采集系统的一个核心算法——超链接主题预测算法。文章在已有理论的基础上,通过实验分析,发现超链接的主题主要取决于三个因素:父网页的主题相关度、锚文本的主题相关度和Web子图的链接结构特性,从而提出了基于Web页面内容和链接结构的超链接主题预测算法,系统评价结果显示该算法有很好的效果。  相似文献   

5.
指出Web挖掘是从数据挖掘发展而来,是集合Web技术、数据挖掘、信息科学等多领域为一体的一项综合技术;介绍Web挖掘的概念、分类以及Web页面之间链接结构挖掘的HITS与Page-rank等算法;提出基于样本模式特征提取的信息检索方法。最后,分析Web链接挖掘面临的问题和未来研究的发展趋势。  相似文献   

6.
链接分析用于学术网站评价存在的问题及解决办法   总被引:12,自引:1,他引:11  
袁毅 《情报学报》2005,24(5):585-593
Web链接分析是网站评价时广泛采取的一种方法。但是,网络链接受到多种因素的影响,单纯利用链接测度评价网站的可靠性受到质疑。本文系统地分析了影响链接分析的诸因素,并探讨了消除或减少误差的方法。  相似文献   

7.
论我国Web版分类法的研制开发   总被引:3,自引:0,他引:3       下载免费PDF全文
Web版分类法是基于WWW环境下的文献分类法 ,它是建立在Web站点上的文献分类体系 ,具有快捷的获取途径、数据更新及时、非线性超文本链接等特征。在《中图法》电子版的基础上 ,开发、研制《中图法》Web版是我国检索语言进入互联网 ,达到国际先进水平的重要标志。参考文献 5  相似文献   

8.
在数字图书馆Web 学术信息资源的优化采集中,有效结合网页空间特征、内容特征和标签信息对网页进 行分块,研究对分块结果进行识别和合并,然后输出网页的主题文本和相关链接块集合,最后通过实验分析该方法能 够进一步去除页面中噪音、准确地分析页面的主题相关性和提高Web 主题信息采集的质量。  相似文献   

9.
从实证分析的角度将社会网络分析方法应用到Web链接结构的研究中,以留学咨询网为研究对象,依次从网络密度、点度中心度、中介中心度三个角度对网页间内部的分布关系和链接特征进行定量分析.结果发现留学咨询网络密度较低,个别网站的链接关系较复杂,存在一个点度中心度和中介中心度都很高的核心网站,大多数留学咨询网并不具有资源中介的能力.  相似文献   

10.
Web使用挖掘下的Web页面层次分类技术研究   总被引:1,自引:0,他引:1  
Web使用挖掘研究用户访问行为所体现的行为特征,Web站点结构分析对于Web使用挖掘具有重要意义.本文讨论如何结合Web站点内页面间的超链结构和关键页面分析技术实现对Web站点的链接结构分析,得到清晰的站点拓扑结构和页面层次分类,进而以此为Web页面进行层次编码,和Web用户行为向量的建立方法,为准确表述用户的访问行为提供数据支持;用一种新的方式进一步有效的挖掘用户的行为特征.最后,把它同一些重要的页面分类方法,从算法的计算效率和页面分类的准确率上进行了比较,试验数据的分析表明,该方法在效率和准确率上有一定提高.  相似文献   

11.
Web表格信息抽取研究综述   总被引:4,自引:0,他引:4  
介绍Web表格的特点与结构、Web表格信息抽取及其过程,分析Web表格信息抽取的4个关键技术:Web表格定位、Web表格结构识别、Web表格内容整合和抽取结果表示,以及Web表格信息抽取的应用。最后指出目前国内外该项研究的不足之处及未来发展方向。  相似文献   

12.
超链接作为WWW 中的一种信息组织方式, 在W eb 信息服务中已占有重要的地位。但是由于超链接仅仅是为了实现文档的非线性组织而产生的, 因而超链接本身缺乏语义信息。因此, 首先对超链接从语义上进行分类具有重要的意义。本文首先介绍了以往对超链接类型定义和分类的研究工作, 然后通过分析W eb 页面类型及相互之间的关系提出了一个基于结构语义来划分超链接类型的方法, 并初步探讨了它在信息收集和查询等方面的应用。  相似文献   

13.
Web信息检索技术最新进展   总被引:18,自引:1,他引:17  
Web 信息检索是一个集人工智能、数据挖掘、自然语言处理、数据库技术、计算机网络等于一体的综合技术。尽管搜索引擎的出现在一定程度上缓解了用户对信息需求难以满足的矛盾, 但是它还没有达到令人满意的程度。本文对Web 信息检索技术作了一个比较全面的论述, 尤其从超链分析的角度, 对网络链接的重要性做了深入探讨并指出了它的发展方向, 对这方面的理论研究和实际开发具有一定的参考价值。  相似文献   

14.
Web与数据库接口技术研究   总被引:6,自引:0,他引:6  
Web 与数据库的结合是目前Web 技术和数据库技术发展的主流方向。本文通过对B/S 体系结构的分析, 对当前比较流行的几种接口技术进行了研究和分析, 主要包括: CGI(Common Gateway Interface) 技术、Web API(Application Programming Interface) 技术、JDBC (Java DataBase Connect ion) 技术和A SP (Active Server Pages) 技术。  相似文献   

15.
网络结构挖掘思想源自于引文分析,本文在阐述引文分析的原理及作用的基础上,分析了网络结构挖掘的原理和作用。目前,网络结构挖掘技术已经在搜索引擎中得到了初步的应用,并取得了很好的效果。  相似文献   

16.
基于Web结构挖掘的网络动态竞争情报采集研究   总被引:2,自引:0,他引:2       下载免费PDF全文
通过挖掘蕴含在Web内部结构和网页中的关联信息与结构模式,Web结构挖掘为企业实现多维度和多层面的竞争情报采集提供了一种有效途径。基于Web结构挖掘的网络动态竞争情报采集方法有:URL挖掘、Web内部结构挖掘和超链接挖掘。图1。参考文献15。  相似文献   

17.
基于结构对Web网页区域分割与语义识别,实现网页语义理解,给出Web多媒体相关文本的定义,并结合其分布特点,采用个体级、区域级、网页级三级分析方法分别进行提取,从而实现Web多媒体相关文本准确提取。  相似文献   

18.
Web日志挖掘数据预处理方法研究     总被引:1,自引:0,他引:1  
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

19.
在分析传统网络爬行器爬行算法的基础上,通过将隧道算法和网页页面分块技术相结合,指导专题爬行器进行爬行。通过4所高校门户网站的教育资源搜索实验表明,新的算法可以有效提高搜索效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号