首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
Web信息资源正在引起人们越来越多的重视和研究,而无论从信息检索的角度,还是从信息计量分析的角度,对Web信息数据的计量和采集都是一个重要的基础。本文基于信息计量学研究的目的,在对Web概念进一步认识的基础上,深入全面地探讨了Web信息数据的计量模式、测度单位,以及采集Web信息数据的各种不同方法。  相似文献   

2.
Deep Web信息资源动态性强、质量高、易于深度分析,使得它成为企业竞争情报采集的重要信息源.但是,目前各种搜索引擎及主题指南等工具不能对Deep Web信息资源有效地进行采集.因此,提出了基于语义Web Setvice的Deep Web的企业动态竞争智能采集体系框架结构,并对该框架下的动态竞争情报采集过程进行了详细论述.  相似文献   

3.
WEB医学信息资源的识别和获取   总被引:1,自引:0,他引:1  
何丽娟 《现代情报》2007,27(5):70-71
随着Web医学信息资源的日益普及和丰富,Web医学信息资源的采集就显得尤为重要,本文在分析Web网页文档特点的基础上,探讨了Web医学信息资源的识别和获取方法。  相似文献   

4.
信息采集中Web文档模型的表示是影响采集精度的重要因素之一。本文通过LIRA系统对用户的信息需求进行目标表示,对Web文档模型结构进行分析,提出基于该模型的特定领域目标信息预测采集控制方法,并通过用户自学习实验给出该模型的优化指标。  相似文献   

5.
从提高Web用法挖掘系统整体运行效率的角度出发,优化设计Web用法挖掘数据方案;通过细化采集工作,实施简化待采集信息元集合,扩展信息元标识功能,在信息抽象基础上对信息进行分类提交和存储,进行分布式数据预处理等策略,使得在高质量完成数据采集工作的基础上,系统的存储效率、性能平衡、解析与转储效率也得到明显提升。  相似文献   

6.
由于因特网和web都是开放、变化、非结构化、动态无序的海量信息资源组织,所以对于网络信息数据的采集和质量控制成为网络计量学领域集中研究的热点问题。本文针对网络信息数据采集的质量控制问题进行了比较全面的研究,内容涉及网络检索时段的统一测定,Web网页及Web网站的抽样设计,避免重复采集网页和优先搜集重要网页的方法,以及面向主题进行特定信息采集的技术等。  相似文献   

7.
为了构建信息污染测度指标体系,首先要采集信息污染源样本数据.文章将信息污染源大致归纳为四种主要类型,针对信息污染源的不同类型,将信息污染源的采集范围划分为内容范围、时间范围和地域范围.根据信息污染源的类型、特点和内容,针对分析信息污染的对象和目的,将信息污染源的采集方法确定为文献调查、社会调查及Web文本挖掘等几种方法,从而为定性和定量分析信息污染程度提供可靠、准确、实用的样本数据.  相似文献   

8.
高校实验中心教学管理信息系统的设计研究   总被引:2,自引:0,他引:2  
从实践教学管理工作的流程出发,运用最新Web编程技术及大型数据库的海量存储功能,对实验教学信息进行计算机化采集、归档、统计,提高实验教学质量.促进实践教学管理工作走向规范.  相似文献   

9.
文章针对目前互联网上科技信息需要定向追踪的需求,利用基于Web的信息采集技术,设计了一个基于B/S的高校科研信息采集系统,对科技管理人员所需科研信息进行自动采集、信息过滤和数据除重,帮助科研管理部门持续有效地捕获上级传达的科研信息,减轻工作人员重复查阅固定网站的负担。  相似文献   

10.
Internet信息量以指数规律迅猛地增长和扩展,由于信息不断地更新和增加,人们很难在短时间内找到自己的目标。解决这些问题关键在于将Internet从被动接受浏览者的请求转化为主动感知浏览者的信息需求,实现Internet系统对浏览者的主动信息服务。新一代的信息服务将是个性化主动信息服务,本文参考了前人所做的工作,讨论了设计个性化服务系统的几个关键问题:1)用户浏览行为信息的采集;2)个性化用户模型的构建;3)个性化用户模型的更新;4)个性化用户模型的应用-如何过滤与用户无关的信息。在此基础上,讨论了将Web Usage Mining和用户兴趣主题结合起来,构建个性化Web用户模型的方法,并运用了二级采集用户兴趣的方法。  相似文献   

11.
针对使用搜索引擎采集竞争情报的准确性和相关性不高的缺点,提出利用语义Web挖掘技术挖掘网络信息资源中的深层知识和情报,并构建基于本体的竞争情报采集模型,最后探讨模型的体系结构、关键技术等问题。  相似文献   

12.
随着互联网的快速发展,Web信息抽取技术的研究及应用已越来越多,本文介绍了Web信息抽取技术的概念及国内外的发展历程,分析了Web抽取信息的原理;对目前主流的Web信息抽取技术进行了归纳分析,阐述了Web信息抽取的评价指标。  相似文献   

13.
文章详细阐述了人工影响天气作业装备信息采集系统的设计方案。该方案将宽带网络及无线通信、传感采集技术、自动控制技术,应用于Web、GIS、数据库等计算机应用,依托前端设备物联网技术,搭建人工影响天气信息大数据服务器,实现采集系统设计。通过前端采集的传感器接收作业装备的方位角、仰角、以及控制发射数量的计数器,采集的信息通过通信协议,利用网络传输至系统,实现作业装备人工影响天气的科学水平和作业效率。  相似文献   

14.
文章研究了Drupal数据采集在阅读推广活动中的应用。利用DrupalFeeds、XPath Parser、Crawler、Image Grabber、Bibliography模块,快速高效地采集互联网平台的图书信息,并与图书管理系统中的书目信息对比筛选后,生成满足广大师生读者需要的书目清单。实现Web图书信息采集的系统化和专业化,为图书馆开展阅读推广活动,提供有效的技术支持。  相似文献   

15.
张旭华 《现代情报》2013,33(1):51-53
Web2.0技术的出现使教育信息资源传播过程发生了巨大的变化。在分析Web2.0技术对教育信息资源传播过程的四个基本要素的影响基础上,针对传统教学环境下教育信息资源传播的基本模式进行了解读,进一步构建了Web2.0技术视域下教育信息资源传播创新模式,并对模式进行了详细的分析和解读,指出Web2.0技术下重新构建教育信息资源模式与教学结构的重要性。最后简单阐释了Web2.0技术的优点和对教育信息资源传播活动的影响。  相似文献   

16.
基于Web3.0思想的图书馆3.0服务新模式   总被引:1,自引:0,他引:1  
介绍了Web3.0思想的发展历程、概念、技术特征等, 引出了基于Web3.0的图书馆3.0的概念、特征、应用模式,揭示了新一代图书馆3.0给图书馆的情报采集、资源共享等方面带来的伟大变革.最后通过构造一个图书馆3.0的互联网信息检索模型实现了校园招聘信息的高效检索.  相似文献   

17.
基于模式匹配抽取技术的网上产品情报获取   总被引:1,自引:0,他引:1  
产品生命周期的逐渐缩短迫使企业关注从因特网上大量、散乱的信息中及时获取新产品信息,跟踪竞争对手研发动向。本文引入基于模式匹配的自动Web信息抽取技术,叙述抽取产品的关键信息方法,并以家用冰箱性能参数信息的自动抽取为例,分析了冰箱领域知识,进行了样本页面的分析归纳,确认了冰箱产品的多种属性及产品信息抽取的模式特征,最终获得了清晰、结构化的产品数据,形成从Web页面上抽取同类产品关键信息的整个处理流程模型,成为网络环境下情报采集与分析的新情报研究模式的一个有力探索。  相似文献   

18.
本文简述Web2.0的概念及对个性化信息服务的作用,对Web2.0环境下建立个性化信息服务模式提出设想.并介绍了Web2.0对医学高校图书馆个性化信息服务中的实际应用.  相似文献   

19.
时态信息抽取和检索是Web领域中时态信息处理的两个关键问题.本文首先分析了时态信息对于Web应用的意义,然后对Web领域中时态信息抽取和检索的相关现状进行了深入讨论.在此基础上讨论了Web时态信息的本体表示问题.最后,预测了Web时态信息抽取与检索的若干未来发展方向.  相似文献   

20.
赵哲  马晓珺 《科技通报》2014,(4):206-208
利用Web页面的采集序位和被检索页面的相关信息和主题,使得以主题为分块的网络爬虫算法,能够尽可能多地把整个Web按照主题为依据进行分块整合,可以采用对URL定位信息,提高了页面的高效检索能力。仿真实验中表明,提出的主题相关爬虫算法能够跨越BBS中URL网页中的断裂带,提高了URL网页的召回率,也不至于因为网页的断裂而中止检索。算法精度分析表明,误判点都在等分线附近徘徊,偏差不大,表明算法精度较高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号