首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 301 毫秒
1.
范涛  王昊  陈玥彤 《情报学报》2022,(4):412-423
地方志作为中华文化的组成部分,是建设文化强国的重要一环,对其进行挖掘研究具有重要意义;同时,有效识别实体对地方志知识组织和知识图谱构建有着重要影响。当前地方志命名实体识别研究主要基于文本,缺乏文本对应的图片,而图片中的内容能够为识别文本中的实体提供额外的信息,从而提升模型识别实体的性能,并且实体识别还面临着已标注语料匮乏的问题。基于此,本文提出了利用深度迁移学习方法,结合地方志中的文本和图片进行多模态命名实体识别。首先,基于人民日报语料库和中文推特多模态数据集,分别预训练结合了自注意力机制的BiLSTM-attention-CRF模型和自适应联合注意力模型,利用基于神经网络的深度迁移学习方法将权重迁移至地方志多模态命名识别模型中,使模型获得提取文本和图片语义特征的能力;然后,结合过滤门对多模态融合特征去噪;最后,将融合后的多模态特征输入CRF (conditional random fields)层进行解码。本文将提出的模型在地方志多模态数据中进行了实证研究,并同相关基线模型作对比,实验结果表明,本文所提出的模型具有一定优势。  相似文献   

2.
马超  李纲  陈思菁  毛进  张霁 《情报学报》2020,39(2):199-207
为有效识别旅游产品在线评论中多模态数据对在线评论感知有用性的影响因素,探究基于用户生成内容的在线旅游产品优化方法,从数据融合分析角度出发,对旅游产品在线评论中的多模态数据进行特征融合。以旅游产品的真实在线评论数据作为研究对象,进行描述性统计分析,同时使用机器学习和深度学习方法,进行文本向量嵌入与图片内容识别,融合图文特征向量,构建多模态在线评论有用性分类模型,进行模型测试。实验结果表明,与仅包含文本或仅包含图片的单模态评论相比,图文结合的多模态评论能够更好地进行在线评论有用性预测,结合评论激励机制,提高在线评论质量,能够充分发挥用户生成内容潜在价值,为产品提供者提供优化思路,为产品消费者提供决策支持。  相似文献   

3.
廖圣清  游雁麟 《新闻界》2023,(12):21-35
为探索新闻包含多模态信息对受众网络信息可信度评估的影响,本研究根据详尽可能性模型,以信息模态为自变量、详细思考程度为中介变量、信息可信度为因变量,涉入程度作为信息模态与详细思考程度之间的调节变量,建立了一个有调节的中介模型;并通过在线实验(N=429)验证。实验证明,信息多模态对信息可信度具有显著影响,文本新闻添加图片、视频,显著提高信息可信度评估;详细思考程度对信息多模态与信息可信度关系具有中介作用,对于涉入程度较高的受众,信息多模态能够显著提高详细思考程度。本研究,不仅证实信息多模态对信息可信度的影响,而且从认知机制角度解析影响的作用机制。  相似文献   

4.
为了提高海量新闻信息分类的效率,本文探索研究基于Transformer(转换器)模型和《中文新闻信息分类与代码》标准的自动分类标引,包括自动归类、聚类、检索标志的智能抽取,以及人工标引和自动标引的互相结合。Transformer模型训练数据特征效率更高,适应能力更强。基于标准的自动分类表更灵活,更高效,自动标引具有广泛的应用前景。  相似文献   

5.
[目的/意义]当前网络舆情事件中网民情感分析研究多聚焦于文本、文本结合图片和视频等内容,缺乏针对图片的探讨。同时,视觉情感分析中多视觉语义特征融合缺乏相应的理论指导。[方法/过程]文章借鉴多模态融合思想,以此作为多视觉语义特征融合的理论指导,按照特征层融合、中间层融合、决策层融合和混合融合策略,以在ImageNet数据集中预训练的VGG19模型和Xception模型为基础,设计对应的网络舆情视觉情感分析模型。[结果/结论]文章将提出的模型在网络舆情图片数据集中展开实证研究,并同基线模型做对比。实验结果表明我们提出的基于决策层融合的网络舆情视觉情感分析模型表现最佳。为增强模型的可解释性,本文对网络舆情视觉情感分析模型中卷积层的输出进行了可视化分析。  相似文献   

6.
基于句子的文本表示及中文文本分类研究   总被引:1,自引:0,他引:1  
文本挖掘技术是信息资源管理的一项关键技术.向量空间模型是文本挖掘中成熟的文本表示模型,通常以词语或短语作为特征项,但这些特征项只能提供较少的语义信息.为实现基于内容的文本挖掘,本文将文本切分粒度从词语或短语提高到句子,用句子包表示文本,使用句子相似度定义文本相似度,用KNN算法进行中文文本分类,验证模型的可行性.实验证明,基于句子包的KNN算法的平均精度(92.12%)和召回率(92.01%)是比较理想的.  相似文献   

7.
网络环境下的新闻听力多模态教学模式   总被引:1,自引:0,他引:1  
英语新闻语料真实、内容丰富、语音标准、用词规范.并且含有实用的知识和文化,反映世界最新动态,是一种非常好的英语学习素材。本文以多模态语篇分析理论为指导,研究如何通过网络新闻中出现的语言、图像、声音、视频等符号资源进行新闻语篇的意义再现.调动学生的听觉、视觉、触觉等多种感觉进行多模态教学,与文本形成连贯的整体,从而提高教学效率。  相似文献   

8.
文本情感分析作为自然语言处理领域的一个重要分支,被广泛运用于舆情分析和内容推荐等领域,近年来成为研究的热点。提出基于语法规则和自注意力机制的GCN情感分析方法。首先,使用Glo Ve预训练模型与Bi LSTM模型提取文本的语义特征,并采用spa Cy工具对文本进行句法依存分析,从而提取文本的语法规则。其次,引入自注意力机制,并依据语义特征与语法规则构建GCN模型。最后,采用全连接层和Softmax分类器进行情感分类。实验结果表明,该方法与相关基线模型相比,在Twitter数据集上的准确率和宏F1值分别得到了提升,具有较好的情感分类性能。  相似文献   

9.
文章基于阅读全生命周期情感阶段,立足基本情感、专有情感和高级情感3个层级,通过动因情感、实时情感和延伸情感3个扇区,构建智慧图书馆多模态阅读情感群喷泉模型,并从表情、语音、生理、肢体、文本和行为6个模态构建多模态阅读情感表征体系。基于此,设计智慧图书馆多模态阅读情感感知模型并阐释其运行机理,就动态阅读情感提出情感匹配、交流汇聚、双向反馈等阅读情感导引建议。  相似文献   

10.
NVPS:一个多模态的新闻视频处理系统   总被引:4,自引:0,他引:4  
本文设计并实现了一个多模态的新闻视频处理系统NVPS ,该系统通过对视音频特征进行多模态的综合分析来获取新闻视频高层的语义内容 ,以支持用户语义层次的检索。对新闻视频处理系统的框架以及框架中涉及到的句法分段、语义标注等关键技术进行了详细的说明 ,并给出了具体的解决思路以及实验结果  相似文献   

11.
多模态隐转喻是平面广告的创意特征体现,在商业广告中广泛使用,成为多模态语篇分析的主要研究内容之一。本文主要从认知语言学的角度,以多模态隐转喻等理论为依据,通过对国际知名产品的平面广告图进行分析,探讨它们多模态隐转喻类型:文字、图像、构图、颜色等媒介,解析平面广告中隐转喻互动整合形成机制,以及广告意义建构。  相似文献   

12.
李枫  李娜 《编辑之友》2012,(6):84-86
随着现代科技的迅猛发展,多媒体技术和计算机技术被广泛应用到人类的交流和文化传播领域.交际模态也由单一的语言和伴语言模态扩展到包含图像、音乐、动画等的多模态形式.这为多模态外语教材的编写提供了有益的启示.本文首先阐明多模态外语教材的定义;其次分析多模态外语教材的特征:协同化、多维化、网络化和智能化;最后从教育学、生物学、心理学和语言学等学科领域对多模态外语教材的编写理据进行探讨.  相似文献   

13.
随着深度学习的发展,计算机视觉和自然语言处理任务所使用的方法越来越相似,使用Transformer来完成视觉任务成为了一个新的研究方向。如何从单个图像中恢复物体的三维信息是计算机视觉深入研究的一个系统问题。然而,传统的三维重建算法在缺乏物体表面纹理的情况下重建效果较差。因此基于前人的研究,提出一种使用Transformer结构的多视图三维重建方法,经过实验测试后,证明Transformer应用于三维重建的有效性与可行性,并且有较好的重建效果。  相似文献   

14.
李娜 《青年记者》2016,(35):8-9
生产商在不同历史时期登载的广告,折射了不同时期人们对于性别、种族、阶级的印象,并且在传播中使这些刻板印象得以固化.随着女性主义运动的兴起和流行,明显的性别歧视信息已经很少出现在电视广告中.但这是否说明传播领域中对社会性别形象的认知发生了改观呢?笔者以早餐品牌Cheerios(中文名称:脆谷乐)为研究对象,对其不同年代所投放的电视广告进行多模态语篇分析.所谓多模态语篇,是指除了文本之外,还带有音响、图像、图表等符号话语,或者说由一种以上符号编码实现意义的文本.①使用多模态语篇分析的方法,可以观察语篇中的各种模态(语言和非语言)如何建立各自的语法(文本语法和视觉语法)体现话语意义,各模态如何协作呈现各种显性和隐性信息,共同创造完整语篇.②本文研究的重点是解读广告的语言模态、视觉模态和听觉模态所体现的显性信息和隐性信息.  相似文献   

15.
随着深度学习的迅速发展和领域数据的快速积累,领域化的预训练模型在知识组织和挖掘中发挥了越来越重要的支撑作用。面向海量的中文政策文本,结合相应的预训练策略构建中文政策文本预训练模型,不仅有助于提升中文政策文本智能化处理的水平,而且为政策文本数据驱动下的精细化和多维度分析与探究奠定了坚实的基础。面向国家级、省级和市级平台上的政策文本,通过自动抓取和人工辅助相结合的方式,在去除非政策文本的基础上,确定了131390份政策文本,总字数为305648206。面向所构建的中文政策文本语料库,基于BERT-base-Chinese和Chinese-RoBERTa-wwm-ext,本研究利用MLM (masked language model)和WWM (whole word masking)任务构建了中文政策文本预训练模型(ChpoBERT),并在Github上对该模型进行了开源。在困惑度评价指标和政策文本自动分词、词性自动标注、命名实体识别下游任务上,ChpoBERT系列模型均表现出了较优的性能,可为政策文本的智能知识挖掘提供领域化的基础计算资源支撑。  相似文献   

16.
本文开展了基于混合深度信念网络的多类文本表示与分类方法的研究,以解决传统的Bag-of-Words(BOW)表示方法忽略文本语义信息、特征提取存在高维度高稀疏的问题。文章基于文本关键字,针对多类的分类任务(如新闻文本和生物医学文本),以关键字的词向量表示作为文本输入,同时结合深度信念网络(Deep Belief Network,DBN)和深度玻尔兹曼机网络(Deep Boltzmann Machine, DBM),设计了一种混合深度信念网络(Hybrid Deep Belief Network,HDBN)模型。文本分类和文本检索的实验结果表明,基于词向量嵌入的深度学习模型在性能上优于传统方法。此外,通过二维空间可视化实验,由HDBN模型提取的高层文本表示具有高内聚低耦合的特点。  相似文献   

17.
文本情感摘要技术的目的是以简洁的形式准确表达文章的核心情感内容。为解决不同的文档结构及内容特征等问题对摘要结果的影响,提出了一种基于主题的SE-TextRank 情感摘要方法。通过LDA 模型自动获取收敛后的文本主题,利用余弦距离算法进行主题句子分组,使用传统多特征融合以及SE-TextRank 情感摘要算法对组内中心句抽取,最终获取目的摘要。实验表明,采用此方法能够更为高效的获取新闻文本摘要结果。  相似文献   

18.
从文本特征对文本分类结果的整体影响的角度出发,提出一种基于粒子群优化的文本特征选择方法(PSOTFS),使用粒子群算法来挖掘文本特征选择规则。PSOTFS首先使用开方检验对文本特征进行预选择,然后使用粒子群算法对预选择得到的文本特征进行精选。PSOTFS以一个粒子表示一条特征选择规则,特征选择规则集对应某个粒子群,采用分类准确率作为适应度函数,采用分组的方式对粒子的维度进行降维。实验结果表明,PSOTFS比开方检验、信息增益、文档频率和互信息方法能得到更好的分类效果。  相似文献   

19.
[目的/意义]在线医疗信息抽取是实现医疗信息检索、医疗信息推荐、个人医疗健康提醒及警示、疾病诊断、公众健康监控、药物不良反应挖掘等服务的基础环节,而医疗实体抽取则是在线医疗信息抽取的首要工作。本文拟解决传统医疗实体抽取严重依赖于人工特征提取且效率低的问题。[方法/过程]以网络文本为研究对象,首先对医疗实体类型和医疗实体抽取的目标进行描述。将在线医疗文本中的医疗实体抽取任务看作序列标注问题来解决,通过对CNN模型和BiLSTM模型基础理论的探讨,构建基于混合深度学习模型CNN-BiLSTM的医疗实体抽取框架。[结果/结论]通过三组对比实验,验证了本文所使用的CNN-BiLSTM模型在医疗实体抽取任务中的有效性。  相似文献   

20.
肖升 《图书情报工作》2010,54(10):114-29
在基于本体的智能检索框架中引入本体视图,提出一种基于本体视图的特征项提取方法,通过利用中文信息结构提取器对文本进行特征提取,并进行类型映射,得到可计算的特征项。此方法比单纯的词汇信息更能体现概念信息特征,能提高检索系统的性能,提高检索的准确率和效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号