首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 890 毫秒
1.
[目的/意义] 在"新冠"疫情这类突发公共卫生事件中,网络社交媒体上迅速产生大量关于疫情的言论,其中包含不少蓄意传播的谣言,不仅危害公众心理健康,而且会影响应对公共卫生事件的方案实施。识别突发公共卫生事件的谣言能够使民众正确面对危机,为社会安定、网络治理起到积极的维护作用。[方法/过程] 首先对采集到的疫情期间已被证实的谣言进行深度分析,提取谣言文本的主要特征,包括上下文特征、话题类别特征、情感程度特征、关键词特征等;然后针对文本分类模型中的文本特征表达较为单一的问题,利用不同的模型对提取的谣言文本特征进行向量化,并对各类文本特征进行加强和融合。其中通过TF-IDF计算的词向量权重在捕获上下文特征的同时,能够加强词粒度的关键词特征信息。最后,使用BiLSTM+DNN模型对融合的特征向量进行分类判别。[结果/结论] 实验结果表明,话题类别、情感程度等特征对谣言识别均有贡献,特别是经过强化后的词向量与其他特征融合后对识别准确率有明显提升,召回率、F1值等指标均达到90%以上,效果超过其他的谣言识别模型,说明笔者所构建的方法能够很好地实现对突发公共卫生事件背景下的谣言识别。  相似文献   

2.
中文电子病历的分词及实体识别研究   总被引:1,自引:0,他引:1  
[目的/意义]健康医疗大数据是我国重要的基础性战略资源,本研究对中文电子病历分词与实体识别的探讨与实证较好地完成了医疗数据的信息抽取任务,对今后医疗大数据在语义层面的应用发展具有重要意义。[方法/过程]本研究首先融合权威词表、官方标准、健康网站数据及其他医学补充词库构建了词语数量级达到10万的医学词表;然后对电子病历的字段进行分词,对比了jieba工具、导入词典后的jieba、无监督学习及AC自动机4种模型的分词效果;最后,以自动分词和人工标注结果为语料,实现基于条件随机场的电子病历实体识别研究,并比较不同实体类别以及不同文本特征下的实体识别效果,选出最优模板。[结果/结论]分词结果显示,AC自动机的效果最好,F值可达82%;实体识别结果表明,"检查"和"疾病"实体的识别效果最好,而"症状"的识别效果不太理想。  相似文献   

3.
[目的/意义]探究信息疫情背景下健康谣言分享意愿的影响因素与形成机理,为危机情境下健康谣言治理提供参考和建议。[方法/过程]在S-O-R与ELM整合模型的基础上,构建信息疫情背景下健康谣言分享意愿影响因素理论假设模型,解释信息刺激驱动用户感知进而影响分享意愿的双重加工路径,利用调查问卷获取数据并采用结构方程模型进行假设检验。[结果/结论 ]结果表明,个人涉入度负向影响健康谣言感知信任,来源可信度正向影响健康信息焦虑和健康谣言感知信任,用户感知正向影响健康谣言分享意愿并在模型中起中介作用。电子健康素养在个人涉入度、健康信息焦虑与感知信任之间都起到负向调节作用。来源可信度触发的外围路径对健康谣言分享意愿的影响更大,信息疫情背景下人们更依赖于非深度思考的信息加工模式。  相似文献   

4.
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务。在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决。[方法/过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别。[结果/结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更高。  相似文献   

5.
中文超声文本结构化与知识网络构建方法研究   总被引:1,自引:0,他引:1  
[目的/意义]超声检查是判断患者病情的重要依据,目前主要检查数据是以文本形式存在。本文提出一种基于超声检查数据的文本结构化和知识网络构建方法,为进一步挖掘临床知识奠定数据基础。[方法/过程]对自然语言处理技术在超声文本环境下的应用进行改进,包括分词处理、内容定位、结构化识别三个主要步骤,实现对超声文本的切分与标记,并且在此基础上建立其结构化知识网络。[结果/结论]真实数据测试结果显示,本文提出的面向超声检查文本的结构化方法具有较好的性能表现。该方法可以实现对批量超声文本结构化网络的自动构建,能够反映超声文本中结构化内容的层次关系与属性结构等潜在知识。  相似文献   

6.
[目的/意义]当前网络舆情事件中网民情感分析研究多聚焦于文本、文本结合图片和视频等内容,缺乏针对图片的探讨。同时,视觉情感分析中多视觉语义特征融合缺乏相应的理论指导。[方法/过程]文章借鉴多模态融合思想,以此作为多视觉语义特征融合的理论指导,按照特征层融合、中间层融合、决策层融合和混合融合策略,以在ImageNet数据集中预训练的VGG19模型和Xception模型为基础,设计对应的网络舆情视觉情感分析模型。[结果/结论]文章将提出的模型在网络舆情图片数据集中展开实证研究,并同基线模型做对比。实验结果表明我们提出的基于决策层融合的网络舆情视觉情感分析模型表现最佳。为增强模型的可解释性,本文对网络舆情视觉情感分析模型中卷积层的输出进行了可视化分析。  相似文献   

7.
[目的/意义]通过搜集和分析国内外社交媒体网络谣言的相关文献,以期了解社交媒体环境下网络谣言国内外的研究进展及未来的研究趋势,为网络谣言治理和学术研究提供一定的指导。[方法/过程]本文运用文献分析和知识图谱可视化分析方法,对国内外网络谣言研究的起源和发展、国内外研究热点及未来研究趋势进行对比和可视化分析。[结果/结论]从研究发展趋势看,国内外相关研究成果的数量呈递增态势,国外研究主要围绕网络谣言的传播、社交媒体网络谣言的监测、社交媒体网络谣言的传播原因进行研究;国内研究主要围绕社交媒体网络谣言的传播模型、社交媒体突发事件网络谣言、不同类型社交媒体平台的网络谣言三个方面;从研究趋势看,未来研究会主要围绕区块链技术在社交媒体网络谣言中的治理、机器学习技术在社交媒体网络谣言中应用、老年群体社交媒体网络谣言治理等。  相似文献   

8.
[目的/意义]学术文本结构功能是对学术文献的结构和章节功能的概括,针对当前研究较少从学术文本多层次结构出发进行融合和传统方法依赖人工经验构建规则或特征的问题,本文在对学术文本层次结构进行解析的基础上,构建了多层次融合的学术文本结构功能识别模型。[方法/过程]以ScienceDirect数据集为例进行实验,该模型首先通过深度学习方法对不同层次学术文本进行结构功能识别,接着采用投票方法对不同层次和不同模型的识别结果进行融合。[结果/结论]研究结果表明各层次集成后的整体效果较单一模型均有不同程度提升,综合结果的整体准确率、召回率和F1值分别达到86%、84%和84%,并且深度学习算法在学术文本分类任务中的性能较传统机器学习算法SVM更优,最后对学术文本结构功能错分情况进行了分析,指出本研究潜在的应用领域和下一步的研究方向。  相似文献   

9.
[目的/意义] 针对中文网络客户评论,提出一种在线评论有用性排序模型,辅助消费者做出购买决策。[方法/过程] 从在线评论的形式特征和内容特征两个方面,提取影响在线评论有用性的7个指标属性进行量化计算,采用模糊层次分析法进行指标赋权,结合并改进TOPSIS分析法进行在线评论有用性计算和排序,构建在线评论有用性指标体系和排序模型。[结果/结论] 通过比较分析,发现本文模型获得的评论有用性排序具有更好的信度与效度,为中文网络客户评论提供一种兼顾评论客观信息和语义特性的有用性排序方法。  相似文献   

10.
近年来,健康谣言频发,《人民日报》盘点十大网络谣言,其中六个都属于健康谣言。从传播学角度研究健康谣言的产生和消弭就会发现,"沉默的螺旋"起着决定性的作用,而意见领袖的登场又使健康谣言往两个方向发展:要么放大谣言,要么辨明真相。值得注意的是,"群体模仿"效应与网络新媒体的"匿名性"对健康谣言的传播起到了推波助澜的作用。我们提出,为平息健康谣言的传播,首先要完善官方信息发布制度,其次要强化媒体的议程设置能力,才能坚持科学舆论导向。  相似文献   

11.
近年来,健康谣言频发,《人民日报》盘点十大网络谣言,其中六个都属于健康谣言。从传播学角度研究健康谣言的产生和消弭就会发现,"沉默的螺旋"起着决定性的作用,而意见领袖的登场又使健康谣言往两个方向发展:要么放大谣言,要么辨明真相。值得注意的是,"群体模仿"效应与网络新媒体的"匿名性"对健康谣言的传播起到了推波助澜的作用。我们提出,为平息健康谣言的传播,首先要完善官方信息发布制度,其次要强化媒体的议程设置能力,才能坚持科学舆论导向。  相似文献   

12.
针对社交媒体中大量健康谣言的广泛传播现象,本文基于动机-机会-能力(motivation-opportunity-ability,MOA)模型对用户的健康谣言分享意愿进行研究,重点分析个体动机、机会和能力相关的因素对其健康谣言分享意愿的影响。基于此,本文选择健康意识、时间成本和健康素养3个变量构建了研究模型,提出了3个研究假设。通过3个步骤选择了8则健康谣言素材,设计网络情境实验收集了252名参与者的2016条数据,利用5个多元线性回归模型进行了假设检验。研究结果表明,相比于饮食类的谣言,参与者对癌症主题的谣言具有较高的分享意愿,男性比女性有更低的健康谣言分享意愿,年长者具有更高的健康谣言分享意愿。同时,健康意识和时间成本能够正向影响健康谣言分享意愿,且健康素养能够负向影响健康谣言分享意愿。本研究为解释人们的健康谣言分享提供了依据,并为干预健康谣言传播提出对策建议。  相似文献   

13.
[目的/意义]信息检索处理的是相关性的不确定性问题,但在技术层面则通常将不确定性转化为确定性的处理方法,对信息内容中存在的不确定性语义关注不多,而这一问题在某些信息检索应用场景中可能显著地影响信息检索的结果,因此针对这类不确定性语义,需要考虑针对性的处理方法。[方法/过程]提出基于D-S证据理论的不确定性语义表示方法和将这类不确定性语义特征与文本特征、主题特征相融合的检索模型,并利用公开的数据集开展实验研究,对所提出的模型进行实验。[结果/结论]D-S理论中的证据区间概念能够描述上述不确定性,多源证据融合方法也能够将这类不确定性语义特征与文本特征、主题特征融合,并通过模型训练得出理想参数,进而改进检索结果。这一模型在理论上具有包容性与可扩展性,基于该模型融合其他检索方法是进一步需研究的内容。  相似文献   

14.
[目的/意义] 快速、准确地从突发网络舆情文本中识别事件。[方法/过程] 提出一种融合句法特征和句法相似度的网络舆情突发事件识别方法。结合句法特征提出面向事件的句法特征提取方法,利用事件语义标注和句法特征提取方法构造事件句法特征库,通过计算待测文本与句法库的句法相似度来识别网络舆情突发事件。[结果/结论] 以新型冠状病毒肺炎疫情为例,所提出网络舆情突发事件识别方法在该舆情下的最优相似度为0.93,在此相似度下从一段新的文本中识别出160个事件和30个非事件,F1值达到了0.848。通过方法测评证明网络舆情突发事件识别方法在利用句法相似度识别事件和进行相同相邻词性合并等方面创新的有效性。  相似文献   

15.
基于知识元的科技文本内容描述框架研究   总被引:1,自引:0,他引:1  
[目的/意义] 从细粒度角度深化科技文本的内容语义描述,弥补目前文本知识对象特征描述粒度较粗且缺乏语义的不足,为知识重组与挖掘,提供精细化的用户知识服务给予一种思路。[方法/过程] 以知识元理论为基础,通过对科技文本内部属性的语义分析,尝试构建细粒度的科技文本内容描述框架,给出两个实例并讨论。[结果/结论] 该内容描述框架实现了检索结果从海量的文献单元聚焦到精准化的知识元的转变。  相似文献   

16.
数字人文概念的提出扩展了古文自动化处理的内涵与外延,实现古籍文本语义的深层理解成为首要任务。因此,本文重点探索古籍句读识别任务中的语义增强模式,以提升主流BBiC模型(BERT-BiLSTM-CRF)表征古籍文本语义的能力。本文融合结构特性从文本与模型两个维度实现古籍文本语义的深层表征,提出引入细粒度文本知识的BBiC-EK (BBiC-external knowledge)模型与融合文本结构特征的BBiCC-EK模型(BBiC-CNN-EK),并从模型结构化角度探究CNN与BiLSTM的最优连接方式以及外部知识编码的最优引入位置,多方位探究模型提升效果。研究结果表明,采用BBiC-EK模型中的最优外部知识组合模式,相较于基线BBiC模型能将句读识别准确率提升0.83个百分点;进一步融合CNN并探究最优模型结构下的BBiCC-EK (Se)模型能将BBiC模型的识别准确率提升1.36个百分点。本文通过融合结构特性的语义增强技术,实现了古籍文本句读识别准确率的提升,为古籍文本的自动化语义理解提供了新思路。  相似文献   

17.
[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。  相似文献   

18.
微博谣言识别研究   总被引:3,自引:0,他引:3  
指出微博在传播信息的同时,也夹杂着谣言等虚假消息、不实言论。针对微博谣言传播速度快、影响范围广等特点,深层挖掘微博中的隐含信息,提出符号特征、链接特征、关键词分布特征和时间差等新特征,将微博谣言识别形式化为分类问题,综合新提取的特征与微博文本特征、用户特征和传播特征构建多个特征模板,利用SVM分类学习方法对微博进行分类,识别结果可有效辅助人们更好、更快地识别谣言。实验结果表明,在基本特征的基础之上,新提出的特征能有效提高微博谣言识别的正确率。  相似文献   

19.
运用图示法自动提取中文专利文本的语义信息   总被引:1,自引:0,他引:1  
姜春涛 《图书情报工作》2015,59(21):115-122
[目的/意义]提出利用图结构的表示法自动挖掘中文专利文本的语义信息,以为基于文本内容的专利智能分析提供语义支持。[方法/过程] 设计两种运用图结构的模型:①基于关键词的文本图模型;②基于依存关系树的文本图模型。第一种图模型通过计算关键词之间的相似性关系来定义;第二种图模型则由句中所提取的语法关系来定义。在案例研究中,借助频繁子图挖掘算法,对所建图模型进行子图挖掘, 并构建以子图为特征的文本分类器,用来检测所建图模型的表达性和有效性。[结果/结论]将所建的基于图模型的文本分类器应用于4个不同技术领域的专利文本数据集,并与经典文本分类器的测试结果相比较而知:前者在使用明显较少的特征数的基础上,分类性能较后者提升2.1%-10.5%。由此而推断,使用图结构的表达法并结合图挖掘技术从专利文本中所提取的语义信息是有效的,有助于进一步的专利文本分析。  相似文献   

20.
[目的/意义] 论文摘要是信息组织的重要标引对象,将论文摘要按一定结构进行标引有利于科学传播、知识发现和情报分析。如何对现有非结构式摘要进行精准快速的自动标引是亟待解决的现实问题。[方法/过程] 假定不同类别的摘要具有内在一致性,即对结构式摘要的研究可为非结构式摘要自动标引提供方法和技术参考。据此,基于美国国家医学图书馆结构要素标签术语集和标签分类映射关系,提出结构要素BOMRC体系和结构式摘要的识别与规范化标引方法。其次选取研究样本并采用文本挖掘方法对样本语料中的单词、动词、三词词块、四词词块等词汇进行词频、TFIDF值等多个指标的定量统计分析,构建能够进行结构要素识别的语义特征词典。最后利用非结构式摘要测试集进行语义特征词典有效性检验。[结果/结论] 结果显示,利用语义特征词典方法能够有效识别非结构式摘要的各类要素,并可用于优化以机器学习方法为核心的自动识别模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号