共查询到20条相似文献,搜索用时 21 毫秒
1.
2.
通过研究Deep Web数据库的集成及词频数准确估算问题,提出Deep Web数据库三层集成构建体系和一种有效估算Deep Web数据库的大小和词频关系的方法,可以准确有效地估算Deep Web数据库中的信息数据大小词频数。实现了对Deep Web数据库宏观处理。对文本特征提取算法进行研究,研究了瑕疵文本去除率(去伪)和有用文本提取率(存真)等性能比较指标,得到算法瑕疵文本去除率相对传统算法是最优秀的,然而其存真的有用文本提取率UR相对较低。仿真实验表明:当数据集样本数大于5000时,词频趋于收敛稳定,取得5000样本数据集为有效最小值,所得到的趋于稳定后得到词频结果与实际词频结果是基本一致的。研究结果对Deep Web数据库的宏观统计决策和单个Deep Web数据库的查询效率问题有重要指导作用。 相似文献
3.
Invisible Web研究综述 总被引:12,自引:0,他引:12
本文对有关Invisible Web的内容进行了全面、详细地介绍。首先论述了什么是InvisIble Web以及为什么要研究Invisible Web,同时介绍了两个相关概念;其次对Invisible Web不可见的原因加以分析;对Invisible Web的类型进行了划分;介绍了Invisible Web的检索工具;最后总结了Invisible Web研究的方向。 相似文献
4.
5.
数据库的索引路径优化选择是实现对Deep Web数据库的深度访问和安全访问的关键。传统方法中对Deep Web数据库的路径选择采用关键字搜索方法,根据关键字罗列出所有可能复合信息的数据,当出现歧义特征时,数据索引准确度不高。提出一种基于语义高斯边缘化的数据库索引路径选择方法。构建Deep Web数据库的特征模型,计算节点与关键词的匹配度,得到高斯边缘化路径控制目标函数,把语义相似度分解为用户查询意图的相关性指向函数,实现高斯边缘化路径控制。将数据库的预测控制指令输入序列进行变量耦合加权,与邻阶跨层链路进行均衡处理,设置语义高斯边缘化索引复激活函数,提高对数据库的索引性能,实现路径优选。仿真结果表明,该算法能提高数据库的查准率,减少查询时间,实现对Deep Web数据库高效安全访问。 相似文献
6.
基于Web的信息抽取技术研究综述 总被引:1,自引:0,他引:1
本文在讨论Web信息抽取技术的发展历程、概念及其功能,Web信息抽取技术方法的分类及技术特点分析。Web信息抽取系统的构建研究及其性能评价的基础上。分析了当前研究存在的问题以及未来的研究方向。 相似文献
7.
Web2.0环境下信息服务的定位与重构 总被引:1,自引:0,他引:1
在探讨Web2.0服务理念对信息服务影响的基础上,指出Web2.0带来大变革:长尾理论、众包模式和云计算,强调以用户为中心和强化用户积极参与;提出Web2.0环境下的信息服务在功能上需重新定位:社会化和个性化服务;因此Web2.0环境下信息服务需从三个方面进行重构:信息资源建设、服务系统和服务业务组织。Abstract: Based on the discussion on the impact of Web2. 0 service concept on information service,this article points out the great changes brought about by Web2. 0: the long tail theory,the user-centred mode and cloud computer,emphasizing the centric position of users and strengthening their active participation. The article points out that the function of information service in the Web2. 0 environment should be re-orientated to social and personalized service. Therefore,the information service in the Web2. 0 environment should be reconstructed from 3 aspects: information resources construction,service system organization and service business organization. 相似文献
8.
Web信息资源正在引起人们越来越多的重视和研究,而无论从信息检索的角度,还是从信息计量分析的角度,对Web信息数据的计量和采集都是一个重要的基础。本文基于信息计量学研究的目的,在对Web概念进一步认识的基础上,深入全面地探讨了Web信息数据的计量模式、测度单位,以及采集Web信息数据的各种不同方法。 相似文献
9.
针对西部山区信息服务业的现状,通过网络信息资源开发利用的背景分析,探索了一条西部山区信息资源开发与利用的新途径。提出了一种新的模式及工作流程,将网络信息资源开发与服务有机结合起来,建立基于Web网站,面向开发主体、面向服务对象的信息服务系统。 相似文献
10.
阐述了语义Web服务搜索机制的体系结构,语义Web服务搜索体系结构由页面浅搜索及其WebDeep数据深搜索组成。RDF4S是一种针对语义Web服务而定义的一种资源描述框架。提出了搜索语义Web服务的一种方法和机制,指出了DeepWeb深层数据进行了查询处理的方法。用实验结果表明了这种方法的有效性。 相似文献
11.
国内Web信息资源无障碍化建设初探 总被引:5,自引:0,他引:5
本文首先分析了Web信息资源无障碍化建设的必要性和重要意义,并简要介绍了国内外发展状况,然后着重从意识、策略、技术三个层面就如何构建国内Web信息资源无障碍化建设环境进行探讨。 相似文献
12.
基于信息计量学研究的目的,对Web信息资源规模范围的定量测度、Web信息资源变化情况的计量分析等问题进行了初步研究和探讨。同时,综述了有关Web文档及其网络链接所服从文献计量学分布模型的理论研究进展。 相似文献
13.
Web2.0环境下网络信息组织研究综述 总被引:1,自引:0,他引:1
从Web2.0环境下网络信息呈现的新特征入手,就目前关于Web2.0时代网络信息资源的组织方式与方法、标准和技术、信息的检索模式和服务,以及网络信息组织未来的发展方向等方面,对网络信息资源组织研究的成果进行了概括和总结。 相似文献
14.
基于Web2.0的信息服务实践及其改进策略 总被引:1,自引:0,他引:1
探讨了Web2.0在用户互助式服务、信息共享服务、实时信息服务,主动信息服务等实践中的应用,分析了Web2.0在上述信息服务实践中的优势和不足,并提出了相应的改进策略. 相似文献
15.
WEB医学信息资源的识别和获取 总被引:1,自引:0,他引:1
随着Web医学信息资源的日益普及和丰富,Web医学信息资源的采集就显得尤为重要,本文在分析Web网页文档特点的基础上,探讨了Web医学信息资源的识别和获取方法。 相似文献
16.
从人理解的角度和“机器理解”的角度,提出了网络信息资源的共享模式:基于人理解的共享模式分为显性信息资源的共享和隐性信息资源的共享,“机器理解”的共享模式则为基于语义Web的智能共享模式。 相似文献
17.
介绍了Deep Web的跨库检索系统Explorit,分析了Explorit系统的特点--检索结果的分面导航、相关度排序、系统部署方式、多语言翻译等等,阐述了跨库检索系统的应用前景. 相似文献
18.
交互式学科门户——Web2.0时代图书馆资源组织新理念 总被引:3,自引:0,他引:3
本文在回顾Web1.0时代学科门户发展状况的基础上,探讨了Web2.0带来用户需求变革对学科门户的影响,提出交互式学科门户的资源组织思想. 相似文献
19.
Web资源保存中的法律问题探讨 总被引:6,自引:0,他引:6
法律问题特别是知识产权问题是当前Web资源保存领域讨论的热点。本文首先从Web资源的采集、保存、利用、呈缴等角度分析了Web资源保存面临的法律困境,然后针对这些问题提出了相应的解决方案与建议。 相似文献
20.
Web2.0环境的自由性和开放性促进了UGC这种用户生成内容网络信息资源生产的新型模式。在分析UGC网络资源开发现状和存在问题的基础上,以UGC内生环境用户生成资源的动因为出发点,提出了激励资源持续开发和资源组织,深层开发的策略。同时以UGC社区资源开发的经济价值为落脚点,提出了资源开发实现路径。为UGC网络信息资源开发提供了一条利用用户生成内容可控、可查、可指导的盈利思路。 相似文献