首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
以去除冗余网页为目标,分析搜索引擎工作原理,讨论现有的去重算法,并提出基于Suffix Tree的倒排索引改进算法.实验表明该算法有着优秀的判断文档相似度的特性.最后对现有去重算法进行分析总结并提出网页去重新思路,以便进行下一步研究.  相似文献   

2.
基于三数组Trie索引树的词典查询机制*   总被引:1,自引:0,他引:1  
对双数组Trie进行改进,设计实现基于三数组Trie索引树原理的汉语词典查询机制,并用递归算法实现构词状态表的自动构建。  相似文献   

3.
面对搜索引擎基于关键词全文检索导致检索准确度低和学科信息门户加工描述只到站点级别的问题,作者提出了将搜索引擎和学科信息门户结合构建智能学科门户搜索引擎的建议--在经过学科专家筛选的、学科信息门户目录中的高质量网站中自动收集网页,形成网页索引,利用自动标引与自动分类方法对收集到的网页进行标引和分类,最后通过分类浏览目录与主题词检索的方式,向用户提供学术资源网页的查找.文章重点介绍了智能学科门户搜索引擎的网页采集、网页自动标引与自动分类及用户接口的设计与实现,并对该搜索引擎存在的问题进行了分析和讨论.  相似文献   

4.
“看不见的网页“(The Invisible Web)是指搜索引擎商出于自身考虑不愿索引的某些网络内容,或是因为技术原因普通搜索引擎(popular search engines)无法索引的网络内容.……  相似文献   

5.
全文检索系统中动态索引技术的研究与实现   总被引:6,自引:1,他引:5  
分析了传统全文检索系统中静态索引技术的实现,讨论了静态索引技术的优缺点;然后提出来一种动态索引技术,阐述了动态索引技术的原理,并在两个数据库开发平台上给出了动态索引技术的实现。  相似文献   

6.
现代的索引就是数据库   总被引:8,自引:1,他引:7  
本文从索引工作现代化、数据库与传统索引在结构与功能上的比较、数据库推动了索引工作的现代化、数据库扩大了索引原理的应用、数据库对索引学发展的贡献几个方面。说明“现代的索引就是数据库,现代的索引工作者就是数据库建设者”这一观点,指出“当前索引事业发展的重点是数据库建设”。  相似文献   

7.
搜寻引擎必须以crawler程式(又称spider程式)来自动抓取网页并建立索引,如果crawler程式仅仅循着网页所提供的超连结来搜寻网页并抓取内容,称为一般性的crawler程式;如果不论网页是否提供超连结,crawler程式会自行计算并找到网页的所有内容并加以抓取,此种crawler则称为深度crawler。而crawler抓取网页内容的步骤可以细分为「取得资料」及「储存并建立索引」二大步骤。在「取得资料」阶段中,深度crawler虽然是自行透过演算法来取得网页的所有内容,但本文认为仍不至于构成非法存取(unauthorized access)。此外,不论是一般的crawler或是深度crawler,如果取得网页内容时会耗费网站资源而干扰网站的正常运作,就可能构成如美国eBay案中讨论的财产侵害(trespass to chattel)。在「储存并建立索引」阶段中,原则上应该不会侵害网页拥有者之重制权。然而,有些搜寻引擎(例如Google)将其取得的内容以「库存页面」(cache)的方式允许使用者存取,此时即有争议发生。但本文以为,由于搜寻引擎的主要目的是在使网路使用者更容易接触网页,所以此种「重制」与「散布」行为原则上应有著作权法「合理使用」原则的适用,故不会构成侵害著作权,但仍应考虑搜寻引擎与原网站之间是否处于竞争关系,以及所抓取之资料量占原网站之比例等因素综合判断。要解决搜寻引擎与网站间可能发生的法律争议,除可以强化现行的robot exclusion标准外,网站也可以考虑增强自动过滤crawler的功能,以杜绝争议。  相似文献   

8.
一种支持高效检索的实时更新倒排索引策略   总被引:5,自引:0,他引:5  
李栋  史晓东 《情报学报》2006,25(1):16-20
最近的研究使得搜索引擎中搜取的网页文档与万维网的变化越来越同步。为使用户通过搜索引擎获取网络上的最新信息,必须加快倒排索引的更新。本文介绍了使用界标和增加/删除网页文档两种典型的倒排索引更新策略,并分析了它们的优缺点,提出了一种支持高效检索的实时更新倒排索引策略。这种策略综合了减少更新操作、加快实时更新和缩短用户查询响应时间等方面的优点,较好地适应了当前网络内容变化的特点。最后通过实验对这种策略进行了验证。  相似文献   

9.
本文谈了一些对网页设计的看法,指出网页功能突出的这一特点是高质量网页设计的体现,并且谈到网页设计师的素质是高素质质量网页设计 的保障。  相似文献   

10.
罗友松 《中国索引》2003,1(4):46-52
钱亚新先生是我国索引学的奠基者,对索引事业作出巨大贡献。撰写、出版了我国关于索引和索引法的第一部专著,系统地论述索引的定义、范围、功用、种类,索引的编制原理、编制方法,填补了空白,为构建我国索引学奠定基础。他拓展索引研究领域,在杂志索引、书目索引、古籍索引、中国索引学史、索引评论、汉字排检法等方面均有卓越贡献。编纂索引,硕果累累,编纂与研究有机结合。他建议建立索引的规则条例,为全国统一规格、标准化而努力。先后开设索引和索引法、汉字排检法、书目与索引等课程,培育人才。奖掖后学,积极扶持索引学专著的编写出版。-担任《申报索引》和中国索引学会顾问、积极出谋画策,推进索引事业发展。治学目的性明确,理论联系实际。为人风格高尚,将自己未发表著述提供他人参考引用,尊师重教,吾辈楷模。  相似文献   

11.
张琪玉 《中国索引》2004,2(2):12-14
阐述关键词索引与数据库的一般原理、结构与功能,汉语题内关键词索引的含糊抽词,列举四种汉语题内关键词索引的样式,分析了题内关键词索引与数据库的检全率、检准率、检索方便性、编制难度与编制成本,并提出某些可以进一步完善之处。  相似文献   

12.
[目的/意义]索引是检索、统计、分析信息的利器,是图书情报学/信息资源管理研究的核心内容。数据库具有索引的功能,现代索引就是“数据库”。加强索引及数据库在学术规范与评价上的研究和实践,对于坚守图书情报学/信息资源管理的核心内容,适度扩展到相关学术领域或公共学术话题,具有重要意义。[研究设计/方法]利用概念分析法,探讨索引原理及其推论、索引与目录、目次和数据库的关系。利用典型案例分析法,分析各类型索引、数据库在学术规范和评价上的作用。[结论/发现]源文献抽取、注出出处、“异排”是索引区别于目录、目次等类似检索工具的“本质属性”。根据索引的原理,可以推出四大命题。索引及数据库在学术规范与评价方面有重要作用,但索引等技术手段仅是辅助工具。[创新/价值]提出“异排”一词来概括索引的独特性。同时概括出索引的本质属性及其原理和四大推论,率先将索引、数据库与学术规范与评价的关系明确地关联起来。  相似文献   

13.
美国索引学会将于2009年4月23—25日在美国俄勒冈州西北部港口城市波特兰举办2009年年会。详情请留意美国索引学会网站年会网页http://www.asindexing.org/site/mtgs.shtml。  相似文献   

14.
本分析了建立图书馆部门网页设计的软、硬件环境,阐述了图书馆部门网页制作的必要性和部门网页制作的内容,并结合制作部门网页的实际工作,谈了部门网页制作的体会。  相似文献   

15.
浅谈图书馆网站的设计规划   总被引:1,自引:0,他引:1  
网页在宣传和利用图书馆方面起着重要的作用,学校图书馆网页的设计主要以信息传递和资源检索为目的,网页内容的设置应遵循一定的原则,网页设计应突出主题,合理组织链接结构,注重整体布局和图文色彩的搭配。  相似文献   

16.
因特网上高校图书馆的网页设计   总被引:14,自引:0,他引:14  
旨在探讨高校图书馆网页设计的原则,针对图书馆业务,网页应该包含的具体内容,高校图书馆如何用自己特有的网页魅力,为广大读者提供网上服务。  相似文献   

17.
衡中青  熊歆 《图书馆论坛》2004,24(1):95-96,78
文章试图对自动索引的方法作一些探讨。首先介绍了自动索引的五种理论模型和六种自动标引方法,随后探讨了自动索引中不可或缺的两个对象——全文索引和数据库索引的原理。  相似文献   

18.
杜彦峰 《图书馆论坛》2012,32(3):158-161
运用符号学的原理,对网页和纸质印刷品的版面布局、字体、线条、色彩、图表、插图、照片等阅读符号进行多层次比较,分析了网页特有的动态设计即交互式导航、隐喻设计和故事叙述,提出了相对于纸质印刷品传递的阅读符号来说,网页传递的阅读符号是有形的、立体的,是符号互动理论的延伸。  相似文献   

19.
美国索引学会已于2008年4月30日--5月3日在美国科罗拉多州首府丹佛举办第四十届年会,详情请留意美国索引学会网站年会网页http://www.asindexing.org/site/conferences/cont2008/index.shtml。  相似文献   

20.
高校学术文库网页的栏目设计   总被引:5,自引:0,他引:5  
高校图书馆的学术文库主要收藏本校教师、校友的学术著作和其他作品及与本校有关的各类资料,是高校图书馆的特色资源,建立本校文库网页非常必要。本文探讨了高校文库网页栏目的设计原则,并在清华大学图书馆文库网页栏目设计中作了尝试。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号