首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
信息采集是图书馆网络信息处理的起点,文章通过Web信息采集工作模型、信息处理算法等内容,总结了当前Web信息采集技术领域研究情况和特点。  相似文献   

2.
面向主题的网络竞争情报采集系统*   总被引:7,自引:0,他引:7  
分析Web页面的主题特征,构建基于主题的竞争情报采集模型的框架,详细论述面向主题的信息采集策略和采集流程,进而探讨影响信息采集质量的关键因素。  相似文献   

3.
企业竞争情报智能采集的策略研究   总被引:1,自引:0,他引:1  
目前,网络竞争情报(Competitive Intelligence,CI)源已成为企业竞争情报采集系统的主要来源.企业竞争情报采集系统面临的挑战主要表现在信息的重复采集,信息采集缺乏连续性,信息采集结果的随机性.本文针对这些问题研究了企业竞争情报智能采集策略,包括信息的智能化提取、智能化的数据挖掘以及信息采集结果的可视化;进而探讨了构建智能情报采集机制的策略,包括在企业内部确立竞争情报的组织体系、建立企业信息采集网络和集成各种竞争情报采集技术与方法.  相似文献   

4.
面向Deep Web的动态竞争情报智能采集策略   总被引:1,自引:0,他引:1  
企业间竞争互动的高强度与高速度,突显出竞争情报的时效性,动态竞争情报是企业在复杂多变的环境下取得成功的关键.Web资源可分为surface Web和Deep Web.Surface Web由静态网页构成,Deep Web信息资源由动态页面、商业数据库、实时数据和企业内部数据库组成,具有质量高、实时性强、易于深度分析的特点,是企业动态竞争情报的重要来源,但常规网络信息采集工具不能直接获得这些信息.针对动态竞争情报采集中存在的信息源选择、信息抽取、信息分析中存在的障碍,提出面向Deep Web的动态竞争情报智能采集策略,详细探讨了动态数据源的智能选择、查询结果的智能抽取、智能化的数据集成和智能分析策略.  相似文献   

5.
本研究针对舆情信息源特征就舆情信息增量采集、提取和存储、文本信息预处理提出了基于Web—Harvest的定点信息采集以及基于输入法平台的新词收集策略,构建了一个互联网用语扩展词库,实现了信息预处理关键模块。  相似文献   

6.
在数字图书馆Web 学术信息资源的优化采集中,有效结合网页空间特征、内容特征和标签信息对网页进 行分块,研究对分块结果进行识别和合并,然后输出网页的主题文本和相关链接块集合,最后通过实验分析该方法能 够进一步去除页面中噪音、准确地分析页面的主题相关性和提高Web 主题信息采集的质量。  相似文献   

7.
王烁  丁宇 《档案》2012,(4):42-44
上世纪90年代中期开始,一些国家纷纷实施网页归档项目,但由于侧重点不同,归档项目的类型也不同.网页归档项目是一个系统工程,涉及法律、资金、主体、信息采集策略、与采集相关的技术问题、国际合作等诸多方面,它们相互联系,构成一个复杂的整体.研究网页归档项目,需对其进行分解及归纳,使其呈现出发展脉络.本文对美国网页归档项目Web Citation的发展状况进行了研究.  相似文献   

8.
Web2.0信息传播思想在知识管理中的应用   总被引:10,自引:0,他引:10  
指出Web2.0在信息传播思想方面有三大革新:将六度关系理论应用于信息传播、以微内容为信息传播的基础、在大众信息传播中着眼于用户个体。基于知识管理模型分析知识管理中隐性知识转化显性知识的障碍,认为在知识管理中运用Web2.0的思想和方法是消除障碍的一种方案。提出基于Web2.0的知识管理框架并分析其KMS应该具备的功能。  相似文献   

9.
Web资源保存的热点问题管窥   总被引:7,自引:0,他引:7  
论述国内外关于Web资源保存研究的几个热点问题:Web资源采集策略问题;采集与保存的技术问题;法律问题;保存责任问题和资金问题。在对上述问题进行详细论述的基础上,结合我国现状,提出建立中国国家Web资源保存的战略机制;选择合理的技术方案;研究与实践同步进行;建立广泛的合作机制的解决方案。  相似文献   

10.
主要介绍了我们设计的Web主题信息采集系统的一项核心工作——Web信息主题的识别,主题识别算法从构造专业性较强的主题词典着手,充分分析和考虑Web网页文本的特点,从而大大提高了主题信息采集的效率和精度,该算法同样适用于其他领域的主题信息识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号