首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 282 毫秒
1.
[目的/意义] 提出利用数字技术来追溯现代精神文明的古典参照,试图探寻我国精神文化建设的可靠历史依据,树立坚定的文化自信。[方法/过程] 以稷下学派为例,收集现代期刊论文和古代史书典籍,利用机器学习和自然语言处理技术构建古今思想文化的对比映射框架。分别通过古今文本的特征表示、主题聚类和思想聚合,实现现代文明对于古典思想的参照,并从治国理政、经济建设、法治思想、教育思想、生态环境等5个方面进行深入分析。[结果/结论] 分析表明,现代精神文明与古典文化意识既相通又存在差异。现代的孝道、德治思想在稷下思想中都有所体现。现代教育体系中的素质教育、思想教育能够追溯到古典精神中品德教化踪迹。古今的法制建设在观念上趋同,但在形式上存在差异。经济建设体系的不同也影响了生态建设观念的差异。本研究的设计与实现初步展示现代数字技术对于映射古今思想对照的可行性,为数字人文中的精神思想挖掘提供新思路,尤其对于追寻我国现代文明建设的历史依据具有重要的现实意义。  相似文献   

2.
[目的/意义] 政府网络问政平台是政府部门知晓民意的重要途径之一,为提高问政留言分类的精度以及处理留言数据质量差、数量少等问题,对比多种基于BERT改进模型与文本增强技术结合的分类效果并探究其差异原因。[方法/过程] 设计网络问政留言分类集成对比模型,文本增强方面采用EDA技术与SimBERT文本增强技术进行对比实验,文本分类模型方面则采用多种基于BERT改进的预训练语言模型(如ALBERT、RoBERTa)进行对比实验。[结果/结论] 实验结果表明,基于RoBERTa与SimBERT文本增强的文本分类模型效果最佳,在测试集上的F1值高达92.05%,相比于未进行文本增强的BERT-base模型高出2.89%。同时,SimBERT文本增强后F1值相比未增强前平均提高0.61%。实验证明了基于RoBERTa与SimBERT文本增强模型能够有效提升多类别文本分类的效果,在解决同类问题时具有较强可借鉴性。  相似文献   

3.
[目的/意义] 针对现有弱信号全自动识别研究尚不完善的问题,提出基于LDA-BERT融合模型的弱信号全自动识别方法。[方法/过程] 基于无监督的LDA主题模型对文本数据集进行主题分类,构建主题和术语双层过滤函数从主题分类的结果中提取早期预警信号,通过紧密中心度、主题权重以及主题自相关性三大度量函数评价主题的弱性,并基于主题内术语的归一化频率和概率提取出弱信号。最后,运用BERT深度学习模型从语义层面对弱信号上下文及其类似词进行扩展。[结果/结论] 以2021年1月初疫情重爆发事件为例,使用爆发前三月的社交媒体新闻数据集对构建的系统模型进行验证。实验结果表明,该方法可有效检测出相关弱信号,并挖掘出弱信号随时间推移逐渐增强的演化特性。此外,该融合模型在实现弱信号全自动识别的同时,也表现出较单一模型更强的结果可解释能力。  相似文献   

4.
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和自定义标注方案,提高人工标注效率。最后,执行训练得到的最优模型,结合链路预测方法,对合成生物技术进行细粒度的技术预测。[结果/结论]实证结果表明RoBERTa-BiLSTM-CRF模型更适用于语义复杂的专利技术实体识别,F1值可达到86.8%,技术识别结果比传统IPC分析方法更精细。同时,细粒度的技术预测结果表明,合成生物学的合成方法在不断改进创新,合成物研究向合成燃料发展。  相似文献   

5.
[目的/意义] 为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程] 通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果/结论] 实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。  相似文献   

6.
[目的/意义] 旨在对大量的中文专利实现快速分类,满足专利审查以及情报分析等工作的要求。[方法/过程] 结合专利文本的固有格式以及存在多个IPC分类号的实际情况,将多示例多标签学习应用于专利自动分类中,在介绍几种经典的多示例多标签模型的基本原理之后,将这些模型运用于中文专利IPC分类号的确定。[结果/结论] 实验证明,多示例多标签模型适合运用在专利的自动分类中,并且从Average precision、Hamming Loss、Ranking Loss、One Error、Coverage、Training time等指标分析可以发现,MIMLRBF模型能快速、准确地运用在中文专利IPC分类号的确定中,为大规模专利的自动分类提供借鉴。  相似文献   

7.
[目的/意义] 针对SAO结构短文本分类时面临的语义特征短缺和领域知识不足问题,提出一种融合语义联想和BERT的SAO分类方法,以期提高短文本分类效果。[方法/过程] 以图情领域SAO短文本为数据源,首先设计了一种包含"扩展-重构-降噪"三环节的语义联想方案,即通过语义扩展和SAO重构延展SAO语义信息,通过语义降噪解决扩展后的噪声干扰问题;然后利用BERT模型对语义联想后的SAO短文本进行训练;最后在分类部分实现自动分类。[结果/结论] 在分别对比了不同联想值、学习率和分类器后,实验结果表明当联想值为10、学习率为4e-5时SAO短文本分类效果达到最优,平均F1值为0.852 2,与SVM、LSTM和单纯的BERT相比,F1值分别提高了0.103 1、0.153 8和0.140 5。  相似文献   

8.
司莉  郭财强 《图书情报工作》2022,66(13):127-137
[目的/意义]对知识组织方法与技术在数字人文领域的应用情况进行系统梳理,以更好地把握其实际应用特点,明确数字人文领域知识组织的价值,并为后续相关研究与实践提供借鉴。[方法/过程]采用文献调研法获取国内外数字人文领域相关研究文献,并基于内容分析法对其进行深入分析。[结果/结论]研究发现:元数据、本体、语义标注、关联数据等知识组织方法与技术贯穿数字人文的始终,是数字人文的有机组成部分;知识组织可为数字人文资源的组织提供解决方案与方法工具,为人们观察文化现象历史演化提供新视角,赋予人们获取新知识、发现新问题的能力;知识组织在数字人文领域发挥了方法价值和中介价值,为数字人文领域资源的组织与利用提供方法工具,充当用户与数字人文领域资源之间的桥梁。  相似文献   

9.
[目的/意义] 在"新冠"疫情这类突发公共卫生事件中,网络社交媒体上迅速产生大量关于疫情的言论,其中包含不少蓄意传播的谣言,不仅危害公众心理健康,而且会影响应对公共卫生事件的方案实施。识别突发公共卫生事件的谣言能够使民众正确面对危机,为社会安定、网络治理起到积极的维护作用。[方法/过程] 首先对采集到的疫情期间已被证实的谣言进行深度分析,提取谣言文本的主要特征,包括上下文特征、话题类别特征、情感程度特征、关键词特征等;然后针对文本分类模型中的文本特征表达较为单一的问题,利用不同的模型对提取的谣言文本特征进行向量化,并对各类文本特征进行加强和融合。其中通过TF-IDF计算的词向量权重在捕获上下文特征的同时,能够加强词粒度的关键词特征信息。最后,使用BiLSTM+DNN模型对融合的特征向量进行分类判别。[结果/结论] 实验结果表明,话题类别、情感程度等特征对谣言识别均有贡献,特别是经过强化后的词向量与其他特征融合后对识别准确率有明显提升,召回率、F1值等指标均达到90%以上,效果超过其他的谣言识别模型,说明笔者所构建的方法能够很好地实现对突发公共卫生事件背景下的谣言识别。  相似文献   

10.
[目的/意义] 基于用户个人的研究兴趣和需求方向,探索实现数字人文信息精准推送的实现路径,以优化我国数字人文平台的功能。[方法/过程] 以上海图书馆的数字人文平台为例,探索知识图谱、用户画像以及热点推送三种服务方式在人文学科领域的应用,以提升现代图书馆服务质量,为用户提供更加高效优质的服务。[结果/结论] 研究显示,将高效的人工智能推荐算法与数字人文服务相结合,能够为用户提供各种精准优质的推介服务,将高价值信息精准地推送到用户面前。  相似文献   

11.
[目的/意义] 构建面向数字人文的开放数据生态系统,可为开放科学、多学科合作、数据驱动时代的数字人文创新发展提供理论参考和实践指引。[方法/过程] 在分析数字人文开放数据内涵与特征的基础上,基于信息生态理论对数字人文开放数据生态系统构成要素进行分析,进而建构数字人文开放数据生态系统的模型框架。[结果/结论] 数字人文开放数据生态系统包括数据人、数据资源、数据环境3个核心构成要素,在内循环和外循环逻辑下,涉及统筹协调机制、协同合作机制、质量控制机制等内容。数字人文开放数据生态系统是一个复杂的系统工程,需要从多方面聚力突破,从"数据供给"层面为人文研究范式转型提供支持。  相似文献   

12.
袁一帆 《图书情报工作》2021,65(13):108-117
[目的/意义] 通过对国外高校数字人文教育现状的调研,为我国高校数字人文教育管理发展提供更为全面和客观的发展建议。[方法/过程] 采取文献调研法、网络调研法和内容分析法,以32所国外高校数字人文课程为样本,从其所属部门、课程设置、教育对象、课程内容、教育形式、培养目标等情况分析国外高校数字人文教育现状,并归纳出其特色。[结果/结论] 借鉴国外高校数字人文教育的经验,我国高校数字人文教育应该立足本土、树立技术思维和人文理念的教学观念,数字人文教育跨界融合,优化数字人文课程体系,强化以课程教学和项目实践为主的多种灵活教学形式互补,重视数字人文个性化能力、项目实践等素养的培养等方面采取措施,以期促进我国高校数字人文教育可持续的发展。  相似文献   

13.
[目的/意义] 基于国家推行文旅结合、共谋发展的大背景,对图书馆将数字人文相关技术与数字人文研究成果运用于构建智慧文旅应用产品的特色功能进行展望和探讨。[方法/过程] 选取八家聚焦人文内容揭示的智慧文旅应用产品(含移动APP、小程序和网站)进行案例调研,着重分析了五种特色功能。随后对目前智慧文旅应用产品的市场以及图书馆构建"数字人文+"智慧文旅应用产品的优劣势进行了相关分析。根据调研和分析结果,提出三项可以运用数字人文相关技术和研究成果的特色功能。[结果/结论] 通过对八家调研对象进行个案调研后,发现特色路线规划与推荐、特色主题分类维度、历史与现代影像对比等五种运用并开发了数字文化资源的特色功能,这些功能建设主要着眼于将景点的历史风貌更加真实地展现在用户眼前并增加用户的互动参与性,对于历史文化内容的挖掘还较为欠缺。笔者建议图书馆行业可以发挥专业优势,将数字人文的相关技术和研究成果应用于智慧文旅的应用产品中,扩大数字人文研究成果的社会效益,同时又有利于构建特色功能,提供以人文内容揭示为核心的智慧文旅服务。  相似文献   

14.
[目的/意义] 从数字人文视角出发,实现敦煌吐鲁番医药文献的数字化及知识组织与可视化,为敦煌吐鲁番医药文献的传承、普及与智能化服务做出贡献。[方法/过程] 采用自顶向下方法,参考BIBFRAME书目模型及中医药学语言系统(TCMLS)构建敦煌吐鲁番医药文献本体模型,利用哈工大语言技术云平台LTP实现词性标注与三元组自动抽取,构建敦煌吐鲁番医药文献知识图谱。[结果/结论] 利用所构建的本体及知识图谱可实现敦煌吐鲁番医药文献知识组织工作,知识图谱能够实现语义查询,为敦煌吐鲁番医药文献的智能化理解奠定基础。  相似文献   

15.
[目的/意义] 从人文学者的角度出发,探讨人文学者如何看待数字人文,他们又如何被数字人文的浪潮所影响。通过对人文学者数字学术认知与数字学术需求的考察,为数字人文服务和系统设计奠定基础。[方法/过程] 采用质性研究方法,对文学、历史、哲学和艺术4个领域展开比较研究,并以访谈素材进行饱和度检验,构建起"认知-预判-担忧-需求与应对"的质性主线。[结果/结论] 研究发现,不同领域人文学者对数字学术的认知并不完全相同,但对其影响的预判也存在共性之处,他们普遍认同数字化对人文的研究素材、研究方法、知识传播和研究问题都会产生一定影响;面对数字化浪潮,人文学者的担忧主要包括对数字学术研究深度的担忧、对学科主体地位的担忧和对技术环境下学术伦理问题的担忧;最后,人文学者在自身能力提升、数据、技术、科研评价体系方面存在许多需求,其中对"基础设施"和"数字项目"的需求最为迫切。  相似文献   

16.
[目的/意义]知识图谱对于重构数字人文资源、促进资源共享重用和深度开发具有重要意义。通过协作智能充分结合人类智慧和机器智能,有助于实现高效、优质的知识图谱构建。[方法/过程]提出基于协作智能构建数字人文领域知识图谱的PDC工作模式,结合数字人文领域知识图谱构建中的核心任务,分析人与AI的分工与协作,并总结在这一过程中协作智能逐渐由人类主导转向AI主导的趋势。[结果/结论]进一步展示基于协作智能的家谱知识图谱构建的可行性和有效性,重点探索家谱知识抽取中的协作智能,并通过定性和定量的评价展示协作智能的优势。协作智能不仅是未来数字人文知识图谱构建的发展趋势,对于其他领域的数字资源组织和知识图谱构建的实践亦具有一定的参考价值。  相似文献   

17.
[目的/意义] 对上海图书馆举办的2020年数字人文年会会议征集的51个汉语语境下数字人文项目进行分析,总结汉语世界关于中华文化主题的数字人文项目概况,为国内数字人文的未来发展提供参考。[方法/过程] 采用网络调查法和数据分析法对51个数字人文项目进行分类研究,根据项目的研究对象、研究方法、基础设施类型和项目成果的现实意义进行分析与讨论以获取有价值的特征。就"数字人文与人文学科""技术手段与方法应用""基础设施建设""服务模式与问题解决"四个维度进行深入探讨。[结果/结论] 51个项目的总结显示出五大特点:在历史学、文学领域蓬勃发展,机器学习与数字人文深度结合,数字资源建设至关重要,综合性数字人文平台的时代已经到来,跨学科、跨机构、跨国家的合作性项目开始显现。本文也针对当前数字人文项目存在的不足提出了促进机构间合作及多学科交叉融合,加强大数据交叉思维和人文素养培养,加强区域协同发展,继续提升学科服务能力和基础资源建设的主要建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号