首页 | 本学科首页   官方微博 | 高级检索  
     检索      

舆情搜索引擎中网页信息的采集与抽取研究
引用本文:王兰成.舆情搜索引擎中网页信息的采集与抽取研究[J].情报学报,2011,10(10).
作者姓名:王兰成
作者单位:南京政治学院上海分院军事信息管理系,上海,200433
基金项目:国家社科基金军事学项目
摘    要:网络舆情搜索引擎与通常的网络信息搜索不同,其最终结果要深入到站点和页面内部采集与抽取有效数据,给情报界提出了许多新的研究内容和方法.在对网页信息抽取的模板和页面分析两种方式、基于自然语言处理、包装器归纳和Ontology抽取方法的分析基础上,使用基于包装器归纳方式并在规则生成模块中采用专家模式,设计一种基于样本学习的新闻抽取方法,通过人工分析网页源代码制定和修改抽取规则,然后根据抽取规则进行信息自动抽取,以提高舆情搜索引擎的精度和质量.

关 键 词:网络舆  情抽取规则  新闻网页  信息抽取

Information Collection and Extraction of Web Pages with Public Opinion Search Engine
Wang Lancheng.Information Collection and Extraction of Web Pages with Public Opinion Search Engine[J].Journal of the China Society for Scientific andTechnical Information,2011,10(10).
Authors:Wang Lancheng
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号