首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于隐条件随机场的异构Web数据源数据抽取算法研究
引用本文:於实.基于隐条件随机场的异构Web数据源数据抽取算法研究[J].科技通报,2012,28(8):168-170.
作者姓名:於实
作者单位:无锡科技职业学院教学科研处,江苏无锡,214028
摘    要:提出了一种基于改进的隐条件随机场的异构Web数据源数据抽取算法。通过对隐条件随机场进行的改进,对隐含变量进行更为准确的计算,并且克服了该模型的性能严重依赖于初始参数选择的问题,而且进行模型训练时不需要大量的人工标注的样本数据。实验结果表明,对比已有方法,本文算法在对具有缺省属性以及多属性特征的网站进行数据抽取时,在查全率,查准率以及F1值上都获得了令人满意的性能。

关 键 词:条件随机场  隐条件随机场  Web数据抽取  判别式模型

Research on Heterogeneous Web Data Extraction Algorithm Based on Hidden Conditional Random Fields
YU Shi.Research on Heterogeneous Web Data Extraction Algorithm Based on Hidden Conditional Random Fields[J].Bulletin of Science and Technology,2012,28(8):168-170.
Authors:YU Shi
Institution:YU Shi(Wuxi Professional College of Science and Technology,Teaching and Research Office,Wuxi 214028,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号