首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
随着Internet在全球广泛的应用,网络信息也随之大幅度增加。面对浩瀚的网络信息,如何能迅速准确地获取和利用自己需要的中文信息就成了一个大问题。目前解决这一问题的最佳途径就是使用搜索引擎。搜索引擎的使用已经成为中国当前第二大互联网应用(仅次于收发E-M ail)。它已成为网站建设的重要功能和网络信息挖掘的主要途径,为用户和网络信息源之间架起沟通的桥梁。搜索引擎就是利用自动抓取程序,在广域网或局域网上遍历各个结点使用全文检索技术对在各结点上抓取的信息进行分析,并加以索引、分类,建立相应的数据库,以备用户查询的一项信息…  相似文献   

2.
论文详细阐述了政府信息资源网络获取的途径和方法,介绍如何通过政府门户网站、政府信息目录、索引工具、搜索引擎查询政府信息,并就法律信息、统计数据等专门信息的查找提供线索.  相似文献   

3.
XML搜索引擎研究   总被引:1,自引:0,他引:1  
首先分析传统搜索引擎查准率不高的原因,然后介绍XML以及XML搜索引擎研究现状,并对XML搜索引擎所涉及的文档存储、索引、查询等关键技术进行详尽探讨。在此基础上,设计现行网络环境下的XML搜索引擎模型。认为该模型可充分利用XML文档的DTD模式信息,并能大幅度提高查询的准确率。  相似文献   

4.
网上信息检索系统的核心是搜索引擎。由于目前在网上运行的各类搜索引擎均属综合性的搜索引擎, 学科专业十分庞大, 用户要从上亿个网站中筛选出自己所需信息相当不易。本文从网络搜索模式解剖入手, 阐述了在Internet 上信息资源搜索引擎的类型, 总结归纳出信息资源检索的方法和技巧, 同时也指出了搜索引擎信息资源检索中的问题。  相似文献   

5.
1 搜索引擎及其现实不足 1.1 搜索引擎及其分类 搜索引擎是用于帮助因特网用户查询信息的检索工作,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织和处理,并提供给用户,达到信息导航的目的。通常意义上的搜索引擎只是信息检索系统的前端,即面向用户的一面;而整个信息检索还包括系统后端的收集、索引信息等功能模块。从不同的角度来划分,搜索引擎有不同的类型:按其覆盖内容的范围来分,有通用型、专业型和特殊型;按是否有人参与索引来分,  相似文献   

6.
黄倩 《情报学报》2005,24(6):713-717
Internet的发展使互联网成为一个巨大的信息库,但是信息的获取质量却停滞不前。传统的搜索引擎大都基于关键字机械匹配,因而不具备理解文档内容的能力,导致查询效率普遍不高。由于计算机可以理解RDF描述和携带的元数据的含义,因此可以做到基于内容的精确检索。为此,本文提出一种基于RDF的科技论文搜索引擎的设计与实现方案。该方案包括含词汇集设计、RDF描述生成工具、运行于服务器端的RDF描述信息收集和解析程序、基于词汇集的查询四个模块。查询结果为搜索网页的元数据显示,从而使用户对查询结果有准确的了解,可大大提高用户的搜索效率。  相似文献   

7.
一种支持高效检索的实时更新倒排索引策略   总被引:5,自引:0,他引:5  
李栋  史晓东 《情报学报》2006,25(1):16-20
最近的研究使得搜索引擎中搜取的网页文档与万维网的变化越来越同步。为使用户通过搜索引擎获取网络上的最新信息,必须加快倒排索引的更新。本文介绍了使用界标和增加/删除网页文档两种典型的倒排索引更新策略,并分析了它们的优缺点,提出了一种支持高效检索的实时更新倒排索引策略。这种策略综合了减少更新操作、加快实时更新和缩短用户查询响应时间等方面的优点,较好地适应了当前网络内容变化的特点。最后通过实验对这种策略进行了验证。  相似文献   

8.
面对搜索引擎基于关键词全文检索导致检索准确度低和学科信息门户加工描述只到站点级别的问题,作者提出了将搜索引擎和学科信息门户结合构建智能学科门户搜索引擎的建议--在经过学科专家筛选的、学科信息门户目录中的高质量网站中自动收集网页,形成网页索引,利用自动标引与自动分类方法对收集到的网页进行标引和分类,最后通过分类浏览目录与主题词检索的方式,向用户提供学术资源网页的查找.文章重点介绍了智能学科门户搜索引擎的网页采集、网页自动标引与自动分类及用户接口的设计与实现,并对该搜索引擎存在的问题进行了分析和讨论.  相似文献   

9.
在非结构化对等网络上,提出一种基于查询请求扩展和相似节点聚合的P2P搜索方法.该方法利用用户的搜索行为自动发现关键字之间和节点之间的关系,记录在每个节点上的知识库内并不断更新.在以后的搜索中,利用关键字的关联关系,增加命中目标;利用相似节点的聚合,缩小搜索范围.模拟实验结果证实该方法具有较高的查询命中率和查询准确率.  相似文献   

10.
一、相关性问题及其意义.随着互联网发展,网络信息变得异常丰富,如何从海量的信息库中获取想要的信息,成为网络用户共同关心的焦点问题。目前,应运而生的搜索引擎已经成为网络用户查找信息的主要途径。然而,面对一个用户查询,搜索引擎往往返回大量的结果,真正相关的却是不多的几个。造成这个问题的主要原因是由于自然语言的歧义性,一个关键词可以出现在多个不同的信息领域中,并有不同的意义。不同的搜索引擎对相关性判断采用的技术方法不同,从而导致搜索引擎的性能各不相同,为了引导用户更好地利用它们,有必要对它们进行评价研究。  相似文献   

11.
王若佳  李培 《图书情报工作》2015,59(11):111-118
[目的/意义] 针对当前我国网络用户的健康信息检索行为, 探索利用中文搜索引擎的健康信息检索规律, 为完善健康搜索引擎和网站建设提供参考。[方法/过程] 基于搜狗搜索引擎的大规模查询日志, 采用日志挖掘的方法, 从查询行为和点击行为两个角度对网络用户的健康信息检索行为进行研究。查询行为的研究指标包括会话层(会话长度、用户重复查询), 查询串层(查询串长度、重复查询)和词项层(高频词汇, 主题分类);点击行为的研究指标为点击位置和点击内容。[结果/结论] 健康相关查询的重复率较高, 提示相关网站可缓存高重复率查询串的返回结果;大众关注的热点领域为疾病、保健、母婴、医疗机构与美容整形, 提示网站的导航设计注意导航方向;用户更偏爱使用问答型平台, 提示网站设计者应更加关注与用户间问答型的互动模式。  相似文献   

12.
国外搜索引擎检索效能研究述评   总被引:2,自引:0,他引:2  
在网络搜索引擎的使用中,搜索引擎的检索效能成为影响用户信息获取效果和搜索引擎服务质量的重要因素.目前,国外的相关研究主要采取实验的方法,从用户体验角度出发评价搜索引擎的检索效能,主要步骤包括确定信息需求、选择搜索引擎、评价结果文档相关度以及确定测度指标.最常用的测度指标是查全率和查准率.此外,影响用户检索效能的指标还有搜索引擎返回结果文档的排序质量、重复度,而索引的数量、用户满意度等指标都会影响用户使用的效果.无论是从搜索引擎的用户使用角度,还是用户评价角度,"用户参与"的模式是最贴近检索现实的.  相似文献   

13.
搜索引擎已成为信息用户不可缺少的网络工具.随着搜索引擎的竞价排名为搜索引擎网站赢利的同时,也在很大程度上降低了信息用户的体验满意度.中文搜索引擎到底该如何平衡这么一个矛盾体呢?本文通过比较百度、中文Google、中文雅虎三大中文搜索引擎,对该问题进行了探讨.  相似文献   

14.
Internet的迅速发展与普及,使人们通过网络就可以获取大量的信息资源。然而,Internet的信息浩如烟海,而且增长和更新的速度越来越快,要从如此海量的信息中找到满足需要的部分是一项极富挑战性的工作。当前的搜索引擎,通过进行超大规模的搜索将页面采集过来并在本地进行索引,  相似文献   

15.
网络搜索引擎探析   总被引:19,自引:0,他引:19  
文章通过对网络搜索引擎的现状、工作过程、类别以及四个网站的搜索引擎的分析 ,就网络上的信息查询提出若干问题与解决办法 ,得出搜索引擎的大致评价标准  相似文献   

16.
倪勇 《中国索引》2006,4(2):35-35
黄页一词从本质上去理解就是一本将企业信息根据产品或服务的特性进行归类后并按一定方法编排的名录。它也是一种为人们提供信息的搜索工具或搜索引擎。黄页与目前非常红火的网络搜索引擎之问到底有何关系?孰优孰劣?让我们一起来看看黄页分类索引与网络关键字索引究竟有何异同吧。  相似文献   

17.
搜索引擎机理剖析   总被引:3,自引:0,他引:3  
Internet网上信息量大且类型复杂,据估计现在至少有 800亿网页在网上,为了快速、有效地获得网上信息,网上信息检索系统"搜索引擎"得以迅速发展。搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的 ,其站点也被美誉为"网络门户"。搜索引擎技术是一个新的研究、开发领域。其内容涉及信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术。 搜索引擎有 4种类型: 1.目录式搜索引擎。目录式搜索…  相似文献   

18.
针对通用搜索引擎存在搜索不够快速、不够深入、不够准确的缺点,本文设计并实现了旅游信息搜索网络蜘蛛,给出了该网络蜘蛛对旅游网页的主题相关度进行预测和判断的算法.该算法保证了网络蜘蛛只采集旅游主题相关的网页,使得垂直搜索引擎在查询的准确率和效率上都有显著地提高.最后通过实现一个旅游信息垂直搜索系统,给出了其信息搜集模块、信息处理模块和信息搜索模块的设计与实现.  相似文献   

19.
网络用户信息查寻行为研究述评   总被引:11,自引:0,他引:11  
沙勇忠  任立肖 《图书情报工作》2005,49(1):128-132,111
从3个方面对国内外网络用户信息查询行为研究领域的主要进展和热点问题进行评介,包括:①网络用户信息查寻行为的相关概念;②主要研究内容,包括用户利用搜索引擎的信息查寻行为研究、特定用户群体信息查询行为研究、用户个体差异对网络信息查寻行为的影响、网络用户信息查寻行为模型的构建;③研究方法,包括查询日志分析法、问卷法、访谈法、观察法、出声思维法。  相似文献   

20.
针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数 据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领域知识的共享和语义表达,提高元数据的检索效率和查准率,为用户和应用提供语义查询和信息汇集能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号