首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于条件随机场的专利摘要信息抽取研究
引用本文:黄绍杉,乔晓东,桂婕,李鹏.基于条件随机场的专利摘要信息抽取研究[J].数字图书馆论坛,2010(9):7-12.
作者姓名:黄绍杉  乔晓东  桂婕  李鹏
作者单位:中国科学技术信息研究所,北京,100038
基金项目:国家科技部"十一五"科技支撑计划,中国科学技术信息研究所重点工作项目,中国科学技术信息研究所2009年度预研基金项目(项目 
摘    要:专利摘要是重要的情报分析数据来源,但其自然语言文本的特征,使得专利摘要的自动内容抽取具有较大难度。文章利用亚洲语言信息检索测评会议(NACSIS Test Collections for IR, NTCIR,)提供的英文专利文摘测试语料,采用文本信息抽取统计方法中的条件随机场模型,通过提取并添加有效的特征,有针对性地抽取专利摘要中表示技术和功效内容的信息,为专利的技术功效矩阵分析提供可机器自动抽取的强大支持。

关 键 词:专利摘要  信息抽取  条件随机场

Information Extraction of Patent Summary Based on Conditional Random Fields
Huang Shaoshan,Qiao Xiaodong,Gui Jie,Li Peng.Information Extraction of Patent Summary Based on Conditional Random Fields[J].Digital Library Forum,2010(9):7-12.
Authors:Huang Shaoshan  Qiao Xiaodong  Gui Jie  Li Peng
Institution:( Institute of Scientific and Technical Information of China, Beijing, 100038)
Abstract:Patent summary is an important data source of inteUigence analysis. However, the characteristics of natural language text make automatic content extraction more difficult. In this paper, we use the testing data provided by NTCIR-8 and the conditional random fields model which is one of the information extraction statistical methods, by extracting and adding effective features, we extract the technology and efficacy information, to provide the machine automatical extraction for technical and efficiency matrix analysis of patent.
Keywords:Patent summary  Information extraction  CRFs
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号