首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
本文对现阶段中文搜索引擎的两种主要搜索方式:目录式搜索(即分类搜索)与关键词搜索分别进行了介绍和分析,以网易搜索引擎为例阐述了网站信息标引的三种方式,并分析了网易搜索引擎特色及问题,国内搜索引擎发展前景的问题。 现阶段网络搜索引擎有两种主要搜索方式:目录式搜索(即分类搜索)与关键词搜索 目前因特网上的搜索引擎很明显地可分为两大类,一类是自由词或关键词检索搜索引擎(国外称之为索引搜索引擎Indexing),另一类是分类搜索引擎,即通过分类浏览来查询信息,(国外称之为目录服务Director Service)。 当然这两类搜索引擎的功能是互相借鉴和渗透的。目前的搜索引擎,尤其是中文搜索引擎有互相融合的趋势,关键词搜索引擎与分类搜索引擎通常是我中有你,你中有我,国内的关键词搜索引擎大多又建有一个分类库。一般来讲,我们将由网上机器人(Spider或Robot)自动收集网页建库,而检索又以全文检索为主的搜索引擎归入关键词搜索引擎,而将主要由人工维护建库,以分类导航或分类摘要查询为主的搜索引擎归入分类搜索引擎。以下将按关键词搜索引擎与目录式(分类)搜索引擎两大类型来分别进行一些分析。  相似文献   

2.
学科信息门户建设中深层网页资源采集的方法与策略   总被引:3,自引:2,他引:3  
文章阐述了国内外学科信息门户建设现状、深层网页资源的概念和特点及学科信息门户网站收集深层网页资源的意义。作者提出采用人工采集、自动化采集、人机结合采集和用户推荐等四种深层网页资源的收集方法;采用网络导航、跨库检索平台和数据保存等方法加以整合,信息整合应遵循标准化、开放性、及时性和权威性四大原则;最后探讨了深层网页资源的收集、整合过程中可能涉及的法律问题和解决方案。  相似文献   

3.
基于知识库的网页自动标引和自动分类系统的设计   总被引:15,自引:0,他引:15  
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。  相似文献   

4.
搜索引擎机理剖析   总被引:3,自引:0,他引:3  
Internet网上信息量大且类型复杂,据估计现在至少有 800亿网页在网上,为了快速、有效地获得网上信息,网上信息检索系统"搜索引擎"得以迅速发展。搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的 ,其站点也被美誉为"网络门户"。搜索引擎技术是一个新的研究、开发领域。其内容涉及信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术。 搜索引擎有 4种类型: 1.目录式搜索引擎。目录式搜索…  相似文献   

5.
万维网搜索引擎的研究   总被引:3,自引:0,他引:3  
随着全球互联网上信息资源的迅速增加,WWW服务器的急剧增加,通过浏览器一步步浏览所需信息已十分不便,为帮助用户在信息的海洋中快速方便地搜寻自己所需的信息,很多机构和个人开发了称为搜索引擎或WWW检索工具的软件,通过采集标引众多网络站点来提供全局性网络资源控制与检索机制,从而帮助用户方便地在网络中准确检索所需信息。WWW网页的迅速增加、搜索引擎数量的增长、各种搜索引擎使用的检索方式日益复杂,使得如何准确选择搜索引擎、如何减轻用户学习与操作负担、如何有效利用各个搜索引擎的集成资源与检索能力就成为制约…  相似文献   

6.
基于UCL的网页信息自动标引技术研究   总被引:1,自引:0,他引:1  
参照都柏林核心元数据规范构建网页信息的标引框架,提取网页特征信息,采用ADO技术实现网页信息的自动标引,实验结果表明,标引信息映射到网页的正确率为100%。最后,将标引技术应用到互补结构网络智能代理终端,验证UCL标引方法的有效性。实验结果显示,通过基于UCL的网页信息自动分类及标引技术能够实现信息的主动服务,满足用户的个性化需求。  相似文献   

7.
中文自动标引是图书馆学情报学界多年研究的问题并取得了一定成果,其在信息检索数据库研究领域不可或缺。随着全文检索和中文搜索引擎的盛行,中文信息处理有多个学科涉及。中文自动标引、全文检索和中文搜索引擎是什么关系有必要加以明确,以确定其在中文信息处理领域的地位。经探讨认为,全文检索利用了中文自动标引的各种方式,搜索引擎利用了全文检索,因此搜索引擎利用了中文自动标引。中文自动标引、全文检索及中文搜索引擎三者关系是中文自动标引被利用和在技术发展方面相互促进的关系。  相似文献   

8.
高校图书馆学科知识门户的构建   总被引:3,自引:0,他引:3  
针对互联网中搜索引擎检准率不足,以及高校科研人员在特定学科或主题领域检索中所遭遇的尴尬,学科信息门户的作用凸显,本文从网络环境下用户对高校图书馆信息服务的需求入手,阐述了学科信息门户产生的基础及其特有优势,探讨了如何构建基于知识服务的学科信息门户,并对其建设的可持续发展做出了思考。  相似文献   

9.
搜索引擎指自动从互联网搜集信息,经过一定整理以后,提供给用户进行查询的系统.互联网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则绘制一幅一目了然的信息地图,供用户随时查阅.  相似文献   

10.
学科信息门户:概念、结构与关键技术   总被引:15,自引:0,他引:15  
以信息与应用高度集成、个性化和智能化为显著特征的新一代学科信息门户系统框架正在成为构建基于WWW的专业数字图书馆的理想模式。网络信息技术如门户构件、跨系统集成检索、元搜索引擎和智能代理等技术的迅速发展,为构建学科信息门户提供了关键技术支撑。图4。参考文献9。  相似文献   

11.
ABSTRACT

Search engine use is one of the most popular online activities. According to a recent OCLC report, nearly all students start their electronic research using a search engine instead of the library Web site. Instead of viewing search engines as competition, however, librarians at Binghamton University Libraries decided to employ search engine optimization strategies to make their Web site more visible on the search engine result pages. Although search engine optimization is used frequently by commercial Web sites, few libraries have attempted to optimize their own sites. This article describes Binghamton University's experiences in developing and implementing an optimization pilot project. The research presented in this article has importance for libraries who may be considering an optimization project for their own sites.  相似文献   

12.
Web资源虚拟图书馆与搜索引擎的比较研究   总被引:7,自引:1,他引:6  
贺亚锋 《情报学报》2000,19(6):574-577
本文对Web上的主要信息检索工具-图书馆制作的Web资源虚拟图书馆和ICP研制的搜索引擎作分析比较,目的在于探讨两种检索工具之间的检索理论、检索性能和检索效果的异同,以期对Web资源虚拟图书馆的发展和搜索引擎的改进提供借鉴。  相似文献   

13.
如何利用搜索引擎检索网络信息   总被引:23,自引:1,他引:22  
从搜索引擎的工作机理, 评价标准, 分类, 使用方法, 使用技巧等五个方面介绍如何利用搜索引擎检索网络信息。  相似文献   

14.
探讨当前搜索引擎存在的问题以及搜索引擎的语义功能需求,然后基于Web搜索引擎和语义Web,提出语义Web环境下的搜索引擎功能流图,并针对crawler、本体与知识库、语义注释、筛选与推理、语义索引、语义检索等对搜索引擎的功能进行分析。语义Web环境下的搜索引擎将促进信息、知识需求得到更好、更精确的语义表述和满足,推动高效的信息和知识管理。  相似文献   

15.
秦杰  谢蕙  王春云 《图书情报工作》2010,54(15):113-116
针对元搜索结果中的网页重复问题,把基于最长公共子序列(Longest Common Subsequence,简称LCS)的网页去重方法应用到元搜索引擎的去重中,提出基于SLCS(首字母S表示Summary)的元搜索去重方法。在获得网页文档摘要后,根据查询词在语句中出现的次数和语句长度,计算摘要语句集合中每个语句权重,提取权重最大的语句作为网页摘要特征语句,通过比较摘要特征语句间的LCS,计算出结果网页相似性,以提高元搜索引擎的检索质量,实验表明该方法具有较高的准确率。  相似文献   

16.
智能搜索引擎信息过滤机制研究   总被引:3,自引:0,他引:3  
智能搜索引擎是人工智能技术和传统搜索引擎技术相结合的产物。面对信息无时无刻不在进行更替的网络环境,智能搜索引擎具有自然语言过滤智能化、多文档处理智能化、用户服务智能化等信息处理机制。为促进智能搜索引擎发展,应重视用户建模技术研究,加强基于多Agent智能搜索引擎系统的研制与实践,加大智能搜索引擎关键技术研究力度。  相似文献   

17.
在ACSI(美国客户满意度指数)模型基础上,构建Web搜索引擎满意度(简称WSES)模型。同时,依据已有的搜索引擎评价指标体系,结合所构建的WSES模型,建立相应的测量指标体系,为进一步进行结构方程模型的验证分析建立基础,并为评价Web搜索引擎满意度提供参考。  相似文献   

18.
王树梅  金澎  吴慧中 《情报学报》2003,22(5):557-560
如何对索引词加权是信息检索中的一个关键技术。本文针对搜索引擎检索的对象是Web页面这一特点 ,通过分析HTML标签的修饰功能 ,结合传统的tf idf加权公式 ,对网页进行加权索引。实验证明对于精确匹配 ,在查全率较低时系统的查准率有较大的提高。  相似文献   

19.
Search engine optimization, or the practice of designing a web site so that it rises to the top of the results page when users search for particular keywords or phrases, has become so prevalent on the modern web that it has a significant influence on Google search results. This article examines the techniques used by search engine optimization practitioners, the difference between “white hat” and “black hat” optimization tactics, and why it is important for library staff to understand these techniques and their impact on search engine results pages. It also looks at ways that library staff can help their users develop awareness of the factors that influence search results and how to better assess the quality and relevance of results listings.  相似文献   

20.
专业搜索引擎的排序算法研究   总被引:5,自引:0,他引:5  
探讨影响搜索引擎排序的一般性因素:词频和词位置信息、用户行为信息、网页之间的链接信息等,在此基础上针对专业搜索引擎的排序算法,提出主题相关度并结合基础教育搜索引擎进行实验。实验结果表明,专业搜索引擎中主题相关度的适当应用能明显改善排序结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号