首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在分析工程文本中命名实体实际特征的基础上,提出一种基于CRF与规则相结合的工程领域命名实体识别方法。在完善用户词典并对文本进行分词后,以短语级的粒度为原则从中确定特征,将文本交由CRF算法进行处理;分析CRF的处理结果,根据语言学规律及工程文本特点编写规则,对CRF处理结果进行优化。实验表明,该方法的全局F1值能够达到93.45。  相似文献   

2.
传统基于统计的命名实体识别方法存在需要大量人工标注的缺陷,导致识别准确率较低。为了提升识别效果,提出一种基于条件随机场的半监督学习方法(S-CRF)对命名实体进行识别。该方法将实体识别看作序列标注问题,对少量数据进行人工标注并构建实体集,通过K-means聚类算法选取有代表性的未标注数据文本进行自动标注,采用条件随机场对语料进行训练测试。选取中文应急预案文档进行实验,该方法在各个标签上的识别效果分别达到93.52%、93.04%、95.81%。实验结果表明,该方法优于传统规则方法,能有效提高应急预案命名实体的识别效果。  相似文献   

3.
弹幕是最近比较流行的在线视频评论方式,因其内容为自发用户发出,可能带有大量的不和谐性,因此如何识别弹幕中的中文文本内容,文中使用了命名实体识别方法,针对弹幕文本规范化处理和研究,通过采用 Word2vec 方法进行词向量训练,以期望达到合理识别的效果。  相似文献   

4.
郭丽  刘磊 《教育技术导刊》2013,12(4):130-131
实体关系抽取和实体关系分类是信息抽取中重要的研究领域,不仅要识别文本中的实体,还要确定这些实体之间的关系,能够辅助机器对文本语义的理解。提出了一种基于关系相似度计算的实体关系分类模型,并针对7种常见实体关系进行了分类实验。  相似文献   

5.
孔国军 《西北职教》2007,(10):21-21
校园文化建设视角下的学校道路、建筑实体命名是个复杂的、跨学科的综合性的思想活动,而一个好的命名应体现校园文化的追求并具有育人功能。本文初步总结了高职院校道路、建筑实体命名原则,并从育人及校园文化建设的角度,对浙江商业职业技术学院主要道路、建筑等实体的名称提出建议性修改,并说明修改理由及更改后的预期效果。本次探究,革新了目前大多数同类院校的建筑实体以其功能、方位命名的习惯,为同类院校建筑实体命名提供参考。  相似文献   

6.
命名实体识别是自然语言处理基础任务之一。针对“数字敦煌”项目应用命名实体识别技术存在的实体边界难以确定等问题,通过构建小规模敦煌石窟专有名词数据集,对基于BERT-BiLSTM-CRF的命名实体识别基本方法,和基于Multi-digraph的词汇增强方法进行了实验对比,结果表明基本方法已具备较高的识别准确率,而基于词汇增强的方法对未登录词识别效果提升显著。最后将训练得到的模型应用于“数字敦煌”资源库命名实体识别任务,证明了方法的有效性。  相似文献   

7.
本研究将政策文本中的价值分为反映物质层面的实体价值和反映精神层面的符号价值。通过对《国家中长期教育改革和发展规划纲要(2010-2020年)》的价值结构分析以及与改革开放以来前三次教育改革政策文本的比较,《规划纲要》的价值结构具有以下特征:1、实体价值比重大于符号价值,价值组合以实体价值为主;2、实体价值比重上升,技术价值占实体价值首位3;、符号价值比重下降,意识形态和规划目标是符号价值的主要组成部分。研究进一步指出,《规划纲要》价值结构的变化体现了政策制定者更加注重以人为本、公平等价值观念。  相似文献   

8.
论坛、博客、微博、QQ空间等都是重要的网络社交载体,但各自的网页结构和语言风格又有差异.本文根据网络论坛的网页结构和数据特点,阐述了应用于话题检测的网络论坛数据处理的相关技术,包括文本预处理和特征选择技术.介绍了这些技术的发展现状和研究成果,论述了命名实体信息在论坛话题检测中的作用,讨论了论坛中时间信息的识别与规范化处理.  相似文献   

9.
“跳岭头”流传于今广西南部的钦州市,是当地壮、汉民族每年农历八月至十月间在社坛或庙坛前戴面具舞蹈表演的融宗教性和戏剧性于一体的前戏剧形态。“跳岭头”文本是“跳岭头”的文字载体,其名称可划分为四类:以“××科”命名的文本。以“××灯”命名的文本,以“××脚(或格)”、“××偈”命名的文本,以普通词语命名的文本。各类文本名称蕴涵着丰富的文化内涵。文本名称的多样性则是“跳岭头”前戏剧形态的特点之一。  相似文献   

10.
运用马克思主义哲学的“系统”、“质”、“联系与发展”等观点理论,对当前高校后勤社会化改革的种种问题作了分析,提出了要增强后勤社会化改革的命名感与责任感,要进行大后勤改革,给后勤实体定性;正确引导实体健康发展,正确处理好高校后勤社会化改革中的扶持与改革、甲方与乙方等关系的观念。  相似文献   

11.
中文电子病历命名实体识别对于医学知识库的构建和临床决策作用关键。针对中文电子病历结构化实体识别困难的问题,提出一种多特征融合的中文电子病历命名实体识别方法。该方法基于条件随机场,通过逐一融合语言符号、词性、关键词、词典、词聚类等多种特征,采用递增式学习策略验证其有效性,在最优特征组合下识别出疾病、症状、检查和治疗4类实体。实验结果表明,该方法识别准确率达到90.99%,有效满足了应用需求。  相似文献   

12.
价值问题是公共政策研究的基本问题.本文通过对1979-1998年533项高等教育政策文本中价值的经验分析,将高等教育政策的价值划分为实体价值(包括经济价值、权力价值、知识价值、技术价值、福利价值)和符号价值(包括专有称谓、名誉、意识形态、规划目标)两大类,并考察了政策价值之间的相互关系.研究认为,经济价值与知识价值的矛盾是高等教育政策的基本价值矛盾.在很大程度上,符号价值不仅决定了实体价值在政策中实现的范围和程度,同时也影响实体价值的配置和话语表述方式.政策文本中被言说的显性价值由未被言说的隐性价值所决定."市场的强迫"和国家政治系统中的核心权威是隐性价值的主要来源.  相似文献   

13.
湖南侗语地名不仅记录了侗族人对其聚居地的地理环境的认知和分类,也蕴含了丰富的语言、历史、文化信息。湖南侗语地名在语言结构上采用侗语偏正式结构特有的"通名+专名"结构,在命名理据上,通名主要以自然地理实体特征、人工建筑物或设施、聚落或行政区划等命名;专名主要以动物、植物、方位、地形特点、民族、姓氏名等命名。  相似文献   

14.
文章尝试以概念隐喻理论为分析工具,对经济新闻文本中的隐喻进行分析。首先从China Daily和Business Weekly的经济新闻语篇中选取定量隐喻样本,分析了旅途隐喻、战争隐喻、人类隐喻、机器隐喻、容器隐喻和竞赛隐喻等六类概念隐喻。然后,进一步分析了隐喻在经济新闻语篇中一些较为显著的功能,如信息功能、文化功能、命名功能和解释功能等;而且结合所选经济新闻语篇,对其进行了深入阐释。  相似文献   

15.
网络时代的到来极大改变了人们的物质生活和消费方式,网络购物成为了生活的一部分,而食品类的网购消费是网上购物中最重要的部分。本文以淘宝网分层抽取的语料为例,总结了食品类网店命名的基本情况,认为食品类网店命名在语音上音节多于实体店铺,常用多层修饰语,语汇上与经营行业和店铺规模息息相关,并从心理语言学的言语理解和言语影响理论分析认为:食品类网店命名特点体现了商家为了迎合消费者网购食品求实心理的主导影响。在此基础上总结出食品类网店命名应该遵循的基本原则是区别性原则、相关性原则和针对性原则。  相似文献   

16.
藏区地名包含五种主要命名法的特点,通过对其所蕴含的文化含义进行介绍和诠释,将之分为自然资源和地理实体颜色等特征的地名;描述地理位置、形状的地名;反映民族的崇尚心理和宗教信仰的地名;反映历史事件、军事活动等情况的地名和以部族名、人名、动植物名等命名的地名五类。  相似文献   

17.
实体经济是国家的经济命脉,是国家生存发展的重要物质基础,是构筑未来国家竞争优势的重要经济支柱。文本在剖析高质量发展实体经济的必要性和紧迫性的基础上,认为高质量发展实体经济应聚焦创新引领、质量变革、结构调整、数实融合、环境优化等领域。如何提升实体经济的内生动力、如何解决科技创新与实体经济脱节的问题、如何缓解实体经济成本过高的困局、如何降低虚拟经济对实体经济的挤压、如何解决妨碍市场公平竞争的障碍,是新时代高质量发展实体经济的难点。在此基础上,文本提出坚持“一大引擎”、协调“两大关系”、推进“三大融合”、实施“四轮驱动”的战略设计以及高质量发展实体经济的八大路径选择。  相似文献   

18.
本文从刘基重要著作<郁离子>书名的原有解释"所谓郁离,即文明的意思,是说如果天下之人能用其言,则可达到文明之治"入手,分析其错误及错误产生原因,导致的结果,并从<郁离子>文本出发,分析<郁离子>人物命名特点,得出命名与人物行为、命运相一致的规律,由此分析郁离子人物形象特点,把郁离子的行为、命运特点结合郁离本身的事实,从而得出郁离子应该是"郁离乃气郁而遁避"的新解释.  相似文献   

19.
在动态的阅读过程中,文本的空白与未定性召唤着读者。为了意义的探寻,读者进入文本。王安忆的小说《启蒙时代》,将文革时期命名为“启蒙时代”的话语模式引起了读者的阅读阐释。本文从接受反应文论的视角,对《启蒙时代》带来的阏读影响进行意义阐释。  相似文献   

20.
《红楼梦》中人物的命名,按照作者曹雪芹和批注者脂砚斋的提示,主要体现新雅不落俗套,达到令世人换新眼目的阅读效果。有时是随事命名,有时因情生文;更多是借用戏剧中谐声法命名,一名双关,借以关联故事叙述、推进情节展开,或者服从主题创作的需要,在一名之中蕴含着作者文心作意,启发读者借此深入领会小说主旨内涵。甄英莲的命名,就体现着曹雪芹写作此书的缘起和主题创意。因为己卯本、庚辰本《石头记》前十二回中被删去《凡例》部分和脂砚斋评注,并在正文中将此改作"甄英菊",使当今迷信己卯本、庚辰本的学者如邓遂夫等,在校勘时难免辨析失当。本文结合甲戌本与庚辰本的比对,把握文本主题内涵与人物命名原则,剖判分析,考误订疑,正本清源,体现《红楼梦》版本校勘中求真、求善、求实的境界追求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号