首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 515 毫秒
1.
命名实体识别(Named Entity Recognition)是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等.首先对我国关于命名实体识别研究的文献进行了总结,给出命名实体识别的主要方法及模型.并针对文献中对这些命名实体识别方法的效果进行统计分析,探讨各种识别对象、识别模型的效果及适用性.经过对现有研究文献的统计,结论为:在不考虑运行效率的情况下,对于机构名,识别效果最好的是层叠CRF模型;对于地名,测试效果最好的是CRF方法与专家知识相结合;人名识别方法中表现不错的则是边界模版和局部统计相结合的模型.  相似文献   

2.
针对在线医疗社区问答文本复杂程度高、结构化程度低的特点,结合卷积神经网络(CNN)和双向长短期记忆神经网络(BiLSTM)两种深度学习模型以及条件随机场(CRF)模型,提出一套适用于在线医疗问答文本的实体识别方法并进行验证.将问答文本进行清洗和BIO标注后,分别用CNN和BiLSTM进行字级别的特征抽取,将通过两种模型抽取到的特征进行融合后放入CRF中训练出实体预测模型,再将问答文本放入训练好的模型中,得到最终的实体识别结果.以关于乳腺癌疾病问答文本为例,研究结果表明,运用该方法得到的识别结果优于其他模型,且识别准确率达到92.3%、召回率达到89.3%、F值达到90.8%.  相似文献   

3.
丁浩  孔令圆  刘清  胡广伟 《现代情报》2023,(11):135-145
[目的/意义]本文针对农业领域提出一种基于融合多重特征词嵌入模型的农业命名实体识别方法,以提高识别准确度。[方法/过程]通过使用结合字符、位置语义、领域知识字典特征等多重特征向量作为嵌入层,充分考虑字符的位置信息和上下文语义信息,并根据农业领域的中文实体的特点改进了单一字符向量嵌入,获得更多的农业实体特征,同时采用双向长短时记忆网络BiLSTM和多头注意力机制来学习文本的长距离依赖信息,再利用条件随机场CRF获得全局最优标注序列。[结果/结论]本文在农业领域中文实体语料数据集中与9种基于基线方法进行对比实验,模型的Precision为92.2%,Recall为92.0%,F1值为92.11%,均优于其他基线模型,说明本文模型对于中文农业命名实体识别更精确。  相似文献   

4.
丁晟春  方振  王楠 《现代情报》2009,40(3):103-110
[目的/意义] 为解决目前网络公开平台的多源异构的企业数据的散乱、无序、碎片化问题,提出Bi-LSTM-CRF深度学习模型进行商业领域中的命名实体识别工作。[方法/过程] 该方法包括对企业全称实体、企业简称实体与人名实体3类命名实体识别。[结果/结论] 实验结果显示对企业全称实体、企业简称实体与人名实体3类命名实体识别的识别率平均F值为90.85%,验证了所提方法的有效性,证明了本研究有效地改善了商业领域中的命名实体识别效率。  相似文献   

5.
本文研究对象为汉语中较为复杂的兼语结构,通过对大规模语料中兼语结构的分布观察,进行其内部语言特征及外部语言特征分析;一是从定量角度对其结构研究提供数据支持,二是为计算机自动识别提供语言学支持。基于这些特征建立模板,从而构建条件随机场模型,对兼语结构进行自动识别。在开放训练中,F值最高可达85.71%,这个结果表明条件随机场在兼语结构识别中已经接近应用水平,可以作为兼语结构识别的有效方法。  相似文献   

6.
[目的/意义]针对在线医疗社区问答文本复杂程度高、结构化程度低的特点,结合卷积神经网络(CNN)和双向长短记忆神经网络(BiLSTM)两种深度学习模型以及条件随机场(CRF)模型,提出一套适用于在线医疗问答文本的实体识别方法并进行验证。 [过程/方法] 将问答文本进行清洗和BIO标注后,分别用CNN和BiLSTM进行字级别的特征抽取,将两种模型抽取到的特征进行融合,后放入CRF中训练出实体预测模型,再将问答文本放入训练好的模型中得到最终的实体识别结果。[结果/结论]在所选取的乳腺癌医疗社区问答文本数据集上,所提出的方法结果优于其他模型,且识别准确率达到92.3%,召回率达到89.3%,F值达到90.8%。  相似文献   

7.
【目的/意义】金融领域实体关系抽取是构造金融知识库的基础,对金融领域的文本信息利用具有重要作 用。本文提出金融领域实体关系联合抽取模型,增加了对金融文本复杂重叠关系的识别,可以有效避免传统的流 水线模型中识别错误在不同任务之间的传递。【方法/过程】本文构建了高质量金融文本语料,提出一种新的序列 标注模式和实体关系匹配规则,在预训练语言模型BERT(Bidirectional Encoder Representations from Transformers) 的基础上结合双向门控循环单元 BiGRU(Bidirectional Gated Recurrent Units)与条件随机场 CRF(Conditional Random Field)构建了端到端的序列标注模型,实现了实体关系的联合抽取。【结果/结论】针对金融领域文本数据 进行实验,实验结果表明本文提出的联合抽取模型在关系抽取以及重叠关系抽取上的F1值分别达到了0.627和 0.543,初步验证了中文语境下本文模型对金融领域实体关系抽取的有效性。【创新/局限】结合金融文本特征提出 了新的序列标注模式并构建了基于BERT的金融领域实体关系联合抽取模型,实现了对金融文本中实体间重叠关 系的识别。  相似文献   

8.
基于认知科学的研究提出一个新颖的计算模型用于物体识别.特征整合理论为计算模型提供了总体路线.基于最大熵原理构建学习过程,获得必要的先验知识构成认知网络.利用认知网络,将底层的图像特征和高层知识捆绑起来.利用条件随机场的基本概念和原理建模捆绑过程.将计算模型应用于现实世界的物体识别,在标准图像库上进行评估,取得了很好的效果.  相似文献   

9.
於实 《科技通报》2012,28(8):168-170
提出了一种基于改进的隐条件随机场的异构Web数据源数据抽取算法。通过对隐条件随机场进行的改进,对隐含变量进行更为准确的计算,并且克服了该模型的性能严重依赖于初始参数选择的问题,而且进行模型训练时不需要大量的人工标注的样本数据。实验结果表明,对比已有方法,本文算法在对具有缺省属性以及多属性特征的网站进行数据抽取时,在查全率,查准率以及F1值上都获得了令人满意的性能。  相似文献   

10.
基于利益相关者理论对机场的相关利益者进行识别,通过建立机场相关利益者关系模型,进一步梳理相关利益者与机场的关系,并分析他们对机场的目标,最后对机场管理提出策略建议.  相似文献   

11.
马颖  丁周敏  张园园 《科研管理》2015,36(6):168-176
网络已经成为人们日常生活中必不可少的发布和获取信息的渠道,越来越多的消费者依靠网络获取突发事件的相关信息,因此,网络舆情在推动突发事件发展的过程中越来越重要。本文基于传染病模型理论,构建了食品安全事件网络舆情传播演变中的模仿传染模型,研究网民在食品安全事件网络舆情传播中的模仿传染机理和行为,并以双汇"瘦肉精"事件为例,对模型进行仿真以验证模型的正确性,以期为食品安全事件利益相关者正确应对网络舆情演变过程中网民的传染行为提供决策参考。  相似文献   

12.
王仁武  孟现茹  孔琦 《现代情报》2018,38(10):57-64
[目的/意义]研究利用深度学习的循环神经网络GRU结合条件随机场CRF对标注的中文文本序列进行预测,来抽取在线评论文本中的实体-属性。[方法/过程]首先根据设计好的文本序列标注规范,对评论语料分词后进行实体及其属性的命名实体标注,得到单词序列、词性序列和标注序列;然后将单词序列、词性序列转为分布式词向量表示并用于GRU循环神经网络的输入;最后输出层采用条件随机场CRF,输出标签即是实体或属性。[结果/结论]实验结果表明,本文的方法将实体-属性抽取简化为命名实体标注,并利用深度学习的GRU捕获输入数据的上下文语义以及条件随机场CRF获取输出标签的前后关系,比传统的基于规则或一般的机器学习方法具有较大的应用优势。  相似文献   

13.
非政府组织在食品安全监管中的作用研究   总被引:1,自引:0,他引:1  
我国现有的食品安全监管体系是政府主导型监管体系,民间力量参与较少。文章分析了在食品安全监管中政府作用的不足、非政府组织(Non—governmental Organizations,NGO)的优势,结合食品安全相关法规阐述了NGO在食品安全监管中的作用,最后得出结论:实现国家监管和社会监管相结合的模式,协调好政府NGO的行动,可以提高食品安全监管的效率,有效减少食品安全事件的发生。  相似文献   

14.
近几年来层出不穷的食品安全事件使我国当前食品安全问题日益突出。对于食品供应链,任何一个环节的出错都会给整条供应链带来巨大损失。从整个食品供应链的角度出发构建食品供应链安全等级评价指标体系,运用可拓评价方法建立可拓评价模型,并以乳制品供应链为例进行实证研究。评价结果和实际基本一致,验证了该模型的可行性,对保障食品供应链的安全和优化企业供应链合作伙伴选择有重要参考价值。  相似文献   

15.
张晓杰 《科教文汇》2014,(1):173-174
地名标识是指为社会公众使用所设立标志地理实体名称的标志。包括:行政区域,居民地,街(路、巷),门(楼)编码,山、河、湖、岛等自然地理实体,具有地名意义的建筑物和台、站、港、场及其他起导向作用的辅助地名标志。本文就天津市地名标识拼写问题介绍国家有关地名标识的相关规定,分析目前天津市地名标识存在的主要问题,通过对天津市目前地名标识拼写状况的分析,以国家和天津市地名标识的相关规定为依据,提出解决建议。  相似文献   

16.
在大数据背景下,基于网络爬虫技术挖掘2011至2015年食品安全新闻事件与数据,并融合网络舆情视角,构建食品安全风险预警因素体系。针对食品安全事件是由多种风险因素累积和复杂关联造成的特点,进一步运用Fuzzy-DEMATEL方法对风险因素的因果类别及重要程度进行实证研究,分析和提炼食品安全核心风险预警因素。  相似文献   

17.
Incidents become crises through a constant and intense public scrutiny facilitated by the media. Two incidents involving dioxin contamination of food led to crises in Belgium and the Republic of Ireland in 1999 and 2008, respectively. Thought to cause cancer in humans, dioxins reached the food supply in both incidents through the contamination of fat used for animal feed. The food and agricultural industries connected to each incident relied on crisis management activities of federal governments to limit adverse public reaction. Analysis of the management of the two crises by their respective federal governments, and a subsequent review of crisis management literature, led to the development of an effective crisis management model. Such a model, appropriately employed, may insulate industries associated with a crisis against damaged reputations and financial loss.  相似文献   

18.
全媒体时代我国食品安全网络舆情构成要素研究   总被引:1,自引:0,他引:1  
林萍  黄卫东  洪小娟 《现代情报》2013,33(11):12-16
食品安全事件是涉及民生的敏感事件,食品安全舆情是公众在媒介信息技术高度发达的风险社会中不安全感的集体释放,是公众对政府完善食品安全治理的需求和对舆论正确引导的强烈呼声。本文在借鉴网络舆情概念和特征的基础上,结合食品安全问题事件的特殊性,分析食品安全网络舆情的构成要素以及各构成要素的特点,建立包括主体、客体、载体、时空因素和舆情本体特征的较为完整的食品安全网络舆情构成体系,以期为食品安全预警机制建立提供参考。  相似文献   

19.
根据国内外文献综合分析、大量调研及专家访谈,提出诱发供应链环境下食品质量安全风险传导的九大关键动因。在此基础上,利用ISM技术,构建食品供应链质量安全风险传导动因的五级递阶结构模型,从而清晰表征各种风险传导动因之间相互影响的等级层次关系。进而揭示驱动食品质量安全风险在食品供应链上进行传导的最直接动因和最根本动因,同时还可以清楚地看出各诱发动因对食品质量安全风险传导后果影响的作用路径。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号