首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 63 毫秒
1.
对话式聊天机器人ChatGPT以近乎摧枯拉朽的气势席卷社会,拨开了通用人工智能的曙光。ChatGPT的升级版GPT-4是个多模态大模型,它从单调的文本交互,升级为可以接受文本与图像组合的多模态输入,相比传统的单模态大模型,多模态大模型更加符合人类的多渠道感认知方式,能够应对更加复杂丰富的环境、场景和任务。GPT-4表明在多模态大模型中引入基于人类知识的自然语言理解与生成能力能够带来模型在多模态理解、生成、交互能力上的巨大提升。本文将介绍多模态大模型的概念、关键技术、近期进展和应用场景、GPT-4的技术特性,并重点探讨以GPT-4为代表的大语言模型对构建多模态大模型的几点启发。具体而言,将讨论如何充分利用大语言模型的语言能力,在多模态大模型的构建中,借助语言的帮助更好地感知理解世界、创作生成内容、与人和环境交互。  相似文献   

2.
以ChatGPT为代表的对话式语言大模型通过使用超大规模模型参数和海量训练数据,涌现出很强的上下文学习能力和思维链推理能力,在各种自然语言处理任务上取得了显著的进步,被视为颠覆性通用人工智能技术。在纯文本语言大模型突破的基础上,近期显现的重要技术发展趋势是向能够理解和生成语音、图像、图形等其他模态数据的跨模态语言大模型的转变。随着大模型技术的快速发展,跨模态语言大模型逐步拥有了较强的多模态感知以及初步的跨模态认知能力。本文将从多模态感知大模型、跨模态认知大模型、以及分布式智能体系统三种范式综述跨模态语言大模型技术体系的演进过程,并总结相关的评测基准,最后讨论跨模态语言大模型面临的技术挑战及潜在重要研究方向。  相似文献   

3.
【目的】探讨元宇宙技术背景下科技出版面临的挑战与机遇,探索以人工智能(AI)技术为核心元宇宙多模态、跨模态内容大爆发带来的科技期刊行业的范式创新和高质量发展路径。【方法】对元宇宙AI多模态、跨模态内容的相关概念、理念、特点、工具、应用场景等进行理论探讨,以《实用临床医药杂志》多模态数智内容融合出版实践范例为模板,剖析科技期刊元宇宙出版与传播的可能路径。【结果】借助多语种即时交互技术,科学共同体可实现“母语化创作,母语化阅读”,即科技期刊从以语种为焦点逐渐向以元宇宙多模态、跨模态学术内容的生产、组织、审核、评价、确权、传播、存储和应用为核心转移。AI赋能的“多模态数智内容编辑器”可解决元宇宙多模态内容的碎片化与孤岛化问题,是编辑与传播多模态内容的利器。【结论】元宇宙为科学共同体引入全新变量,多模态、跨模态传播生态让全球科技出版面临全新的发展格局,科学研究进入第五范式“元宇宙科学范式”,科技期刊发展进入元宇宙多模态、跨模态内容时期。《实用临床医药杂志》实践案例表明“多模态数智内容编辑器”可以解决元宇宙多模态、跨模态碎片化与孤岛化问题。  相似文献   

4.
[目的/意义]多模态资源虽类型丰富但分散无序,挖掘多模态资源间隐含的知识关联进而实现跨模态、多角度的知识重组,对于多模态资源的智能管理与深层服务都具有重要的价值。[方法/过程]文章立足知识服务的特点与需求,结合多模态资源的特征,探讨多模态资源的知识挖掘方案,并基于此方案探讨可通用的多维度知识重组方案。在此基础上,以多模态红色资源为代表,通过对红色人物陈毅相关多模态资源的获取与处理,实现相关文本、图像、视频资源的知识重组,开发了可视化知识服务平台“陈年毅事”,并从时间、地点、人物、主题等不同维度探讨了可视化知识服务的实现路径。[结果/结论]通过实证研究,验证所提出知识重组方案的适用性与可行性,可以为多模态资源的深度挖掘、多维组织与服务应用提供一定的借鉴与参考。[局限]图像及视频资源有待更深层的挖掘;知识关联方式还有待补充。  相似文献   

5.
多模态视角下城市公益广告语篇研究   总被引:1,自引:0,他引:1  
郭静 《科教文汇》2013,(29):70-71
“多模态语篇”指的是除了文本之外,还带有图像、声音或者动作等符号系统的且通过多种符号系统之间的互动来实现意义的复合文本。本文把多模态研究应用到城市公益广告语篇中,阐述了城市公益广告语篇中语言和图像等符号模态是如何实现互动意义构建的。  相似文献   

6.
韩普  叶东宇  陈文祺  顾亮 《现代情报》2023,(10):27-34+151
[目的/意义]随着网络化和数字化的快速发展,线上线下医疗健康活动产生了海量多模态数据,当前迫切需要一种更为完善的知识组织方法,对类型繁多、专业性强的医疗健康多模态数据进行序化和组织。[方法/过程]首先对多模态数据进行预处理以构建多模态医疗健康数据集;接着基于实体对齐和关系抽取实现医疗健康数据的知识单元抽取,并通过知识评估和融合构建多模态知识单元;然后在多模态知识单元和知识图谱基础上提出一种面向多模态医疗健康数据的知识组织模式;最后以文本和图像模态数据为例,以医疗健康问答系统为实践应用进行分析和验证。[结果/结论]针对多模态医疗健康数据的内在特性,基于多模态知识图谱和语义知识组织框架,提出一种面向多模态医疗健康数据的知识组织模式。本研究推进了多模态知识组织的理论深度,可为医疗健康领域知识序化、精准知识服务和深度知识发现提供有效支撑。  相似文献   

7.
多模态的教学模式是提高学生综合素质的必要手段。在英语教学的模态选择过程中,教师一定要在选择模态主导因素的基础上,处理好不同模态之间的协同关系,通过多种途径建立一个合适的多模态教学模式。  相似文献   

8.
吴天乐 《科教文汇》2014,(2):109-109,111
多模态话语分析认为话语分析不应只以自然语言为研究对象.还应关注图像、颜色、声音和动作等其他构成意义的符号系统。Kress&Leeuwen根据Halliday系统功能语法中的三大纯理功能,提出了第一个系统全面的视觉语法分析框架,从再现意义、互动意义和构图意义讨论多模态语篇图像的意义表达方式。通过深入分析可以得出结论:视觉语法对分析多模态语篇的图像意义具有很强的可行性和可操作性,它不仅拓展了多模态话语分析的领域,提高读者的话语识读能力,而且还可以帮助设计者科学地选择和协调各种模态,从而达到最佳设计效果。  相似文献   

9.
刘昊  刘中强 《科教文汇》2014,(34):104-105
本文以系统功能语言学为基础对体育双语教学中的多模态性进行分析,得出了在体育双语教学中多模态选择的程序、模态选择的因素以及模态选择的原则,有助于提高体育双语教学效率。  相似文献   

10.
本文以系统功能语言学为基础对体育双语教学中的多模态性进行分析,得出了在体育双语教学中多模态选择的程序、模态选择的因素以及模态选择的原则,有助于提高体育双语教学效率。  相似文献   

11.
陈锟  裴雷  范涛 《现代情报》2023,(6):24-34
[目的/意义]针对突发事件分类研究中模态单一或缺失、分类效果不理想等问题,本文提出结合文本和图片特征信息,以多模态融合的方式对突发事件进行分类。[方法/过程]本文提出一种基于多模态融合的突发事件分类模型(Emergency Classification Model with Hybrid Fusion, ECMHF),由BERT联动BiLSTM构成的文本特征抽取分类模型、VGG19为基础的图像特征抽取分类模型、融合文本描述特征和视觉语义特征的多模态融合层加上预测类别输出层组成的多模态分类模型3部分构成主体框架,最后将所有模型的决策层输出分配权重后再融合。[结果/结论]以收集的突发事件新闻数据为实验样本进行实证研究。结果表明,ECMHF模型在所有模型中性能最佳,F1值达到最高的99.072%,比次优模型高出0.51%。加入混合融合策略的ECMHF模型能够有效地识别出突发事件的类别。未来将在更为广泛和多元的突发事件多模态数据集中进行验证。  相似文献   

12.
孙淼洁 《科教文汇》2013,(11):69-69,73
随着科技的发展,英语课堂的教学手段日趋多样化,多模态教学逐渐被广大教师接受和运用。本文试从多模态话语分析理论的角度,结合高职英语的特色,分析高职英语教师在课堂中各种模态的运用、相互作用及其对学生学习效率的影响。  相似文献   

13.
该文探讨了多模态在史学通识课程中的赋能原理和实施模式,分析了基于多模态信息的供给、推理、构建和合并过程。与传统依托文本的课程思政教育不同,多模态资源本身具有开放性、互动性和多样性等特点。因此,课程思政的引导重点在于利用多模态信息资源加深学生对史实价值的认识,提供深度互动和自主推理、构建和整合的学习环境,强调问题意识和实践导向。  相似文献   

14.
在过去的二十多年里,越来越多的研究文本和语篇的学者开始意识到仅仅研究语言是不够的。随着技术的发展,人们在交流过程中使用的社会符号越来越多,例如使用图像,手势和声音等来表达。于是越来越多的学者开始关注语言之外的交流方式,即从单一的语言文字文本扩大到包括图像,声音,动画等多模态文本。本文是在克瑞斯和勒文(1996)的《阅读图像》主要分析图像等符号在语篇中的作用,重点探讨图像中的人物、地点和事物是如何组成视觉模式,实现其再现意义、互动意义和构图意义三个方面对2010年广州亚运会会徽进行了多模态话语分析,帮助读者了解不同模态作为社会符号是如何共同作用构成意义的。  相似文献   

15.
[研究目的]为强化国家安全情报能力,推动风险监测预警能力提升,构建基于多模态大数据的国家安全风险态势感知模型。[研究方法]该文对国家安全风险态势感知进行阐释,并分析多模态大数据驱动下的国家安全风险态势感知运作逻辑;在此基础上,构建态势感知模型并解析其内涵。[研究结论]该模型集国家安全风险态势察觉、态势理解、态势预测及态势投射为一体,其构建可为强化国家安全风险监测预警能力提供参考,为服务国家治理体系和能力现代化建设提供支撑。  相似文献   

16.
广告作为一种重要的语篇研究形式,融合了包括文字、图像、声音等多种模态。迄今为止对其研究主要体现在文体、修辞、词汇等语言研究上,而往往忽略了其他模式。本文试图运用社会符号学的多模态来分析广告,重点放在多模态语篇的概念再现意义上,着力探究分类过程、分析过程和象征过程在广告再现意义上的构成和作用,帮助读者了解图像作为社会符号和语言作为符号如何共同作用构成意义,同时提高人们运用多模态理论解读多模态语篇的能力。  相似文献   

17.
本文简要介绍了多媒体语音实验室具备了有丰富的视、听、说、练的资源,以及能够实现课堂互动的特点,符合了多模态教学要求多种模态互补的要求,由此提出了高校教师可以借助多媒体语音实验室实现多模态教学。  相似文献   

18.
【目的/意义】为提升主流融媒体意识形态建设和舆论引导能力,解决大数据时代背景下主流融媒体多模态 信息资源管理的困境,构建高效的热点发现机制。【方法/过程】笔者着眼于主流融媒体热点发现需求构建需求体 系,然后利用Scrapy-Redis框架、HBase数据库和MapReduce实现了数据的精准采集、有序存储和高效处理,再基于 多模态信息融合的理念,借助 NLP技术对信息资源的特征进行提取,最后利用 LDA2vec模型和 Single-Pass算法实 现了信息归集和热点的发现与更新。【结果/结论】仿真实验结果表明,本研究所使用的方法,能够较好地实现多模 态信息的归集和热点的提取,效果较同类模型有明显提升。【创新/局限】但是在运用NLP技术处理多模态信息时各 处理环节的衔接尚不够流畅,后续仍需进行改进提升。  相似文献   

19.
何巍 《情报杂志》2024,(1):160-166
[研究目的]信息技术的发展丰富了社交媒体用户的沟通交流方式,研究社交网络舆情多模态知识图谱的构建对网络舆情治理具有重要的现实意义。[研究方法]基于多模态数据的语义互补,讨论了实体属性关联、图像(视频)文字描述、图像(视频)属性、图像(视频)关联等多种异构数据融合方式。在此基础上,提出社交网络舆情多模态知识图谱的构建框架,并分析了在多模态语义理解、多模态实体对齐、多模态知识表示等方面存在的问题与挑战。[研究结论]提出基于多模态知识融合的社交网络舆情多模态知识图谱构建框架,为交互方式日趋丰富的社交网络舆情治理提供有益参考。  相似文献   

20.
[目的/意义]丰富的互联网数据为洞悉真实事件提供了多维视角,快速识别突发事件并准确判断其所属类别,有助于各级政府及应急管理部门高效地管理应急情报资源。[方法/过程]文章构建了基于文本—图像增强的突发事件识别及分类的理论模型;通过文本卷积神经网络、视觉几何群网络搭建深度神经网络共同组成Multi-DNN模型;最后以真实的自然灾害类突发事件数据进行实例验证。[结果/结论]通过文本、图像相互增强,多模态特征融合能够提升突发事件识别及分类的准确率,同时在小样本数据的任务处理中仍有良好效果,证明不同模态的数据能够相互补充、相互印证,对其融合处理能够提供比单一模态更为准确和全面的信息分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号