首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 270 毫秒
1.
Content characteristics of a webpage include factors such as keyword position in a webpage, keyword duplication, layout, and their combination. These factors may impact webpage visibility in a search engine. Four hypotheses are presented relating to the impact of selected content characteristics on webpage visibility in search engine results lists. Webpage visibility can be improved by increasing the frequency of keywords in the title, in the full-text and in both the title and full-text.  相似文献   

2.
李立威  刁征艳 《现代情报》2011,31(10):142-146
本文以北京16家区县政府网站为例,对政府网站的搜索引擎优化状况从网站内容优化、网站结构优化和搜索引擎可见性三方面进行了实证分析。其中网站内容优化评价指标包括网站首页标题、关键词及描述设置情况,网站结构优化评价指标包括网站层次结构、链接情况和网站导航,而搜索引擎可见性的评价指标主要是网页收录数量。分析结果表明,网站优化程度与搜索引擎可见性呈现出一定的相关性、政府网站对内容未做优化、政府网站结构优化在细节方面还不够、政府网站对搜索引擎优化重视程度不够。  相似文献   

3.
OAI-PMH框架内的全文获取研究   总被引:4,自引:0,他引:4  
郭少友 《情报理论与实践》2006,29(3):353-354,379
OAI-PMH是一种元数据收割协议,虽然不直接支持对元数据所描述的全文的获取,但通过某些元数据字段可以找到全文的URL,从而可以利用全文获取程序来获取全文。本文探讨了以长期保存为目的的全文获取方法和步骤,同时也探讨了以实现全文检索或建立引文索引为目的的全文获取方法和步骤。  相似文献   

4.
搜索引擎检索结果的网页组织技术及其优化策略   总被引:2,自引:0,他引:2  
张海涛  高松 《情报科学》2006,24(6):900-903
本文分析了搜索引擎检索结果的组织技术及其存在的不足,并对检索结果的组织技术进行了优化处理,最后分析了搜索引擎检索结果中提高网页排名的优化策略。  相似文献   

5.
廖腾芳 《情报科学》2003,21(11):1181-1184
等级列举式分类法在图书分类中存在较多的问题,在因特网搜索引擎元数据分类中,由于各种原因,也很难得到遵守。为此,必须使用分面组配式分类法。那么分面组配后的标引是否仍构成面?本文利用分形理论对阮刚纳赞提出的分面理论标引后的构成分布进行研究。  相似文献   

6.
[目的/意义] 在信息检索、科技论文评价和知识结构演化方面,引文分析都起着至关重要的作用。随着格式化全文数据库的出现,引文分析迈入了4.0时代——全文引文分析阶段。但是,目前还没有中文的格式化全文数据库,这极大地制约了全文引文分析在我国科技文献中的研究和应用。[方法/过程] 在本文中我们提出建立高效的中文全文引文分析依赖的数据集和检索平台的方法,主要包括:1)提出了基于规则和SVM分类方法的论文元数据和引用提取方法;2)提出基于Spark平台的实现高效引文内容分析标准化数据集生成方法;3)提出建立引用内容的科技文献检索平台。[结果/结论] 引文内容分析标准化数据集的建立将全面提升全文引文分析在我国科技领域中的研究效能,提高科技文献查找精度。  相似文献   

7.
Metadata is designed to improve information organization and information retrieval effectiveness and efficiency on the Internet. The way web publishers respond to metadata and the way they use it when publishing their web pages, however, is still a mystery. The authors of this paper aim to solve this mystery by defining different professional publisher groups, examining the behaviors of these user groups, and identifying the characteristics of their metadata use. This study will enhance the current understanding of metadata application behavior and provide evidence useful to researchers, web publishers, and search engine designers.  相似文献   

8.
This article proposes a process to retrieve the URL of a document for which metadata records exist in a digital library catalog but a pointer to the full text of the document is not available. The process uses results from queries submitted to Web search engines for finding the URL of the corresponding full text or any related material. We present a comprehensive study of this process in different situations by investigating different query strategies applied to three general purpose search engines (Google, Yahoo!, MSN) and two specialized ones (Scholar and CiteSeer), considering five user scenarios. Specifically, we have conducted experiments with metadata records taken from the Brazilian Digital Library of Computing (BDBComp) and The DBLP Computer Science Bibliography (DBLP). We found that Scholar was the most effective search engine for this task in all considered scenarios and that simple strategies for combining and re-ranking results from Scholar and Google significantly improve the retrieval quality. Moreover, we study the influence of the number of query results on the effectiveness of finding missing information as well as the coverage of the proposed scenarios.  相似文献   

9.
王泽贤 《情报探索》2014,(5):95-100
利用Lucene的全文索引和搜索技术,开发了与ILAS III集成的全文搜索型OPAC系统Bookle。介绍了Bookle的体系结构以及参数管理器、索引器、搜索器、用户接口等的设计与实现。Bookle系统实现了扩展书目信息的自动抓取并使之本地化,扩展了书目检索点,为读者提供了书目记录及其扩展书目信息的任意词全文搜索等服务,弥补了ILAS III OPAC的不足。  相似文献   

10.
Web搜索引擎与全文检索技术   总被引:6,自引:0,他引:6  
李玮  李利 《情报科学》2003,21(5):558-560
本文主要阐述了全文检索技术在Web搜索引擎中的应用。对国内Web搜索引擎的全文检索技术中的不足进行了分析和思考并提出解决办法,同时对web搜索引擎中的全文检索技术的发展提出了自己的观点。  相似文献   

11.
The advancements of search engines for traditional text documents have enabled the effective retrieval of massive textual information in a resource-efficient manner. However, such conventional search methodologies often suffer from poor retrieval accuracy especially when documents exhibit unique properties that behoove specialized and deeper semantic extraction. Recently, AlgorithmSeer, a search engine for algorithms has been proposed, that extracts pseudo-codes and shallow textual metadata from scientific publications and treats them as traditional documents so that the conventional search engine methodology could be applied. However, such a system fails to facilitate user search queries that seek to identify algorithm-specific information, such as the datasets on which algorithms operate, the performance of algorithms, and runtime complexity, etc. In this paper, a set of enhancements to the previously proposed algorithm search engine are presented. Specifically, we propose a set of methods to automatically identify and extract algorithmic pseudo-codes and the sentences that convey related algorithmic metadata using a set of machine-learning techniques. In an experiment with over 93,000 text lines, we introduce 60 novel features, comprising content-based, font style based and structure-based feature groups, to extract algorithmic pseudo-codes. Our proposed pseudo-code extraction method achieves 93.32% F1-score, outperforming the state-of-the-art techniques by 28%. Additionally, we propose a method to extract algorithmic-related sentences using deep neural networks and achieve an accuracy of 78.5%, outperforming a Rule-based model and a support vector machine model by 28% and 16%, respectively.  相似文献   

12.
龙怡  云太真 《情报科学》2021,39(9):117-124
【目的/意义】我国“互联网+政务服务”发展迅速,在线政务服务资源日益丰富,民众能否通过搜索引擎查 找到政务服务是影响在线政务服务平台成效的重要因素。政务服务资源搜索的主要目标是“查准”,研究提出关于 中美政务服务资源搜索引擎可见性的八个假设。【方法/过程】按照查找典型政务服务个人事项“申领机动车驾驶 证”和法人事项“注册有限责任公司”的需求构造中英文关键词,分别通过百度和谷歌,以定位到中国各省和美国各 州经济最发达城市为目标进行搜索实验,采集首页搜索结果并进行相关性评分。在此基础上进行搜索引擎搜索功 能的统计分析,用非参数检验验证假设。【结果/结论】研究认为搜索引擎理解政务服务词汇的能力直接影响了其搜 索水平,政务服务平台也可以通过搜索引擎优化提升可见性。【创新/局限】研究创新在于构建中英文关键词,直接 采集百度和谷歌的搜索结果进行跨国比较研究,突破了以往同类研究的宽度和深度;局限主要在于相关性判断存 在主观性和搜索对象的规模较小。  相似文献   

13.
搜索引擎的发展及盈利模式研究   总被引:6,自引:0,他引:6  
整个搜索引擎市场的发展非常迅速。随着Google和Baidu等公司的上市,更是掀起了一股强劲的搜索热潮。但是搜索引擎的盈利模式不同于一般的网络公司。本文分析了搜索引擎的发展过程以及其现有的各种盈利模式,还对搜索引擎市场的未来发展趋势作了分析和预测。  相似文献   

14.
平晓亚  张自然  陈红丽 《情报科学》2021,39(10):133-139
【目的/意义】探究学术文献搜索结果选判过程中用户元数据关注特点及其与选择行为的关系,为检索系统 优化、用户选择行为指导提供理论依据。【目的/意义】利用出声思维法、半结构化访谈以及关键事件法对30名在读 硕士和博士研究生对知网学术文献检索结果的选判行为进行观察与访谈,对得到的材料进行分析。【结果/结论】用 户对题名、期刊、摘要等元数据信息关注较多,而对相似文献、下载量等元数据信息关注较少;高年级用户对于文献 内容特征的关注程度明显高于低年级用户,但对于新功能的关注度较低;用户关注的元数据信息越多,检索的次数 也越多;用户常用的元数据关注路径为LB、LB-LD和SI-LB,文献选择效果较好的路径为LB-LD和SI-LB。【创新/ 局限】充实丰富了学术信息搜索结果选判行为研究的视角,以期为后续的检索系统优化、用户选判行为指导提供理 论支持;本次研究得到的结论较适用于初级科研用户,对于经验丰富的科研用户适用性仍有待考证。  相似文献   

15.
阳勇林 《大众科技》2013,(10):24-26
根据检察信息网站的特点,文章分析了网页配色对网站建设的作用,研究了网页设计中色彩搭配的方法,总结归纳了网页配色的一般原则和技巧,阐明了色彩搭配对于网页设计中的重要性,为实施检察信息网站建设中的网页设计工作提供了理论依据。  相似文献   

16.
在网络教学平台加入定制的Lucene全文搜索引擎,实现了针对各种类型教育资源的全文索引/检索功能。通过在网络教学平台上的应用测试,证明了在网络教学平台上构建一个全文检索引擎是成功的,可以对网络教学平台站内网页中各种教学资源进行全文检索。  相似文献   

17.
仇壮丽 《现代情报》2013,33(2):52-55
总结了目前国内知识产权文献数据库的不足,提出了国家知识产权文献数据库系统设计的目标、数据库构成及概念结构。为了实现"快速、全面、准确"的检索目标,需要建立元数据实现数据库的标准化,采用科学的分类体系实现族性检索,开发知识产权领域本体扩展用户检索入口词汇,通过搜索引擎实现全文检索。最后提出了系统的实现方式。  相似文献   

18.
基于智能搜索引擎的数字图书馆个性化服务研究   总被引:4,自引:0,他引:4  
刘崇学 《现代情报》2006,26(11):16-18
智能搜索引擎具有独特的信息检索优势,可以实现自然语言检索、并行检索、分布式检索和移动代理。智能搜索引擎在数字化图书馆个性化服务中具有重要的作用.但也必须加强知识决策服务.有效利用问题库技术.发展集成元搜索功能,提高对元数据、元知识的判断与认识水平,研究多用途、多检索点的搜索引擎模式.全面强化知识语义分析能力。  相似文献   

19.
基于Linux和Myeclipse 8.6平台,应用Java语言和开源工具Lucene,采用流行框架Struts 2.2,Spring 3.0,Hibernate 3.6开发了合作检索引擎"天涯·比邻",该搜索引擎主要通过用户检索输入与检索历史及当前检索进程的语词相似度计算来识别潜在用户。从合作检索界面、合作检索实现过程和检索轨迹呈现3个方面对"天涯·比邻"搜索引擎进行详细说明,最后讨论本研究相对于一般搜索引擎后控词表机制的主要改进及进一步研究内容。  相似文献   

20.
英国政府数据共享与开放的元数据标准建设及启示   总被引:1,自引:0,他引:1  
翟军  翟玮  裴心童  李剑锋 《情报杂志》2021,(4):132-138,186
[目的/意义]为促进政府数据的开放共享和高效使用,英国率先在元数据领域采纳开放标准,对其的系统介绍可为我国政府数据资源的元数据标准建设提供一定的参考和借鉴。[方法/过程]采用文献分析和网络调查方法,分析和介绍2020年4月成立的英国政府数据标准局的第一批成果——共享和开放政府数据的元数据标准、实施指南和应用情况。[结果/结论]采纳开放标准代表着国际上元数据标准建设的最新发展方向。对我国而言,应在将元数据标准看作重要的数据基础设施、重视引进和鼓励使用开放标准、持续提升元数据管理的成熟度水平上借鉴先进经验。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号