首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 272 毫秒
1.
[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。  相似文献   

2.
[目的 /意义]古籍引书的计算人文研究视角将带来数字化资源、量化分析内容以及可视化呈现结果。[方法 /过程]以《春秋左传正义》中引书为对象,对其中引书进行标注、组织、计量、可视化及主题挖掘研究。[结果/结论 ]通过古籍引书知识标注和补全,完成引书知识库的构建,以引书、篇章和作者为例进行计量分析,对结果进行可视化形式呈现,并尝试构建其知识图谱。此外,结合LDA主题模型,挖掘引书句子主题内容,得到生产生活、风俗礼仪、宗教祭祀、战争和政治5个主题类型,为古籍引书内容的深入探索提供技术借鉴和数据资源。  相似文献   

3.
[目的/意义] 中医药是中华文化的传承,对现代医学发展具有重要作用,应受到高度重视。利用数字技术组织中医古籍,对其进行保护与重用具有重要意义。[方法/过程] 以简帛医药文献为研究对象,分别构建简帛医药书目本体和内容本体,并通过书目本体和内容本体的连接形成简帛医药文献本体模型;利用命名实体识别模型抽取实体概念,利用依存句法分析和规则的方法抽取实体关系,最终将简帛医药文献数据存入图数据库,实现简帛医药文献知识图谱可视化与检索查询结果呈现。[结果/结论] 利用本体和知识图谱,提出简帛医药知识组织方法,建立具有逻辑关系的简帛医药知识链,形成中医药领域知识的语义网络,在中医古籍的智能化方面做出有益的探索,有助于中药知识的普及与传承。  相似文献   

4.
[目的/意义]典籍是我国传统文化、思想和智慧的载体,结合数字人文的数据获取、标注和分析方法对典籍进行实体自动识别,对于后续应用研究具有重要意义。[方法/过程]基于经过自动分词与人工标注的25本先秦典籍构建古籍语料库,分别基于不同规模的语料库和Bi-LSTM、Bi-LSTM-Attention、Bi-LSTM-CRF、Bi-LSTM-CRF-Attention、Bi-RNN和Bi-RNN-CRF、BERT等7种深度学习模型,从中抽取构成历史事件的相应实体并进行效果对比。[结果/结论]在全部语料上训练得到的Bi-LSTM-Attention与Bi-RNN-CRF模型的准确率分别达到89.79%和89.33%,证实了深度学习应用于大规模文本数据集的可行性。  相似文献   

5.
唐诗知识图谱的构建及其智能知识服务设计   总被引:2,自引:0,他引:2  
[目的/意义]立足于当前大数据环境下的唐诗知识服务需求,以大规模唐诗数据为基础构建唐诗知识图谱并提供智能知识服务,推动人工智能环境下唐诗知识管理和知识服务方式的创新。[方法/过程]本文在对领域知识服务需求调研的基础上,设计领域知识服务驱动的唐诗本体模型,然后利用从Web上爬取的多源异构数据,采用知识抽取、知识融合、知识推理等技术自动构建唐诗知识图谱,统一表示和组织唐诗领域数据,实现对大规模唐诗数据的语义化处理。[结果/结论]本文设计基于唐诗知识图谱的智能知识服务平台KnowPoetry,提供唐诗领域的知识探索、时空轨迹、语义查询等智能化知识服务,推动人工智能环境下唐诗数字人文研究方法的创新转型。  相似文献   

6.
数字人文的兴起为红色文献的保护和传承提供了新的技术与方法。文章引入知识本体与知识图谱,对皖西红色文献进行细粒度关联,进而加快皖西红色文献数字化开发进程,为实现皖西红色文献资源的知识关联、聚合、发现提供新路径。以“书目框架模型”(BIBFRAME)为核心,构建知识本体的核心词表,从“文献”和“内容”两个层次设计实体的语义关联;依据知识本体的结构,抽取皖西红色文献中的实体及其关联,构建红色文献数据库,并自定义检索任务来模拟真实的检索需求;以“六霍起义”、革命英雄“舒传贤”和“红色事件地点分布”为主题,构建知识图谱并基于图谱进行知识发现。结果表明,知识本体可以有效提取皖西红色文献的实体数据并联结知识图谱以协助研究者进行文献检索与知识发现,佐证了以知识本体为代表的数字人文技术方法在红色文献研究中的使用价值与应用价值。  相似文献   

7.
[目的/意义] 随着数字人文的迅速发展,用户对知识服务的需求日益增长,对承载着中国优秀传统文化的古籍进行数字化转型,建设能够支撑起人文计算的古籍文献数据库迫在眉睫。[方法/过程] 数字人文视域下古籍的数据库建设需要依靠先进的计算机技术,在深度调研数据库建设过程中依赖的关键技术基础上,将古籍文献数据库的建设过程划分为数字化、文本化、知识化和图谱化4个阶段,详细论述古籍汉字识别技术、命名实体识别、关联数据以及GIS技术等,深入阐述相关技术细节和指标。[结果/结论] 提出稷下学文献资料数据库建设的整体思路。最后,通过分析与总结,指出古籍数据库建设仍需解决的问题和未来的发展方向。  相似文献   

8.
[目的/意义] 知识图谱已成为公共数字文化资源知识组织的新形态。利用知识图谱技术赋能红色历史人物知识问答服务,提升用户交互体验,对红色历史资源的开发利用具有重要意义。[方法/过程] 在梳理历史人物数字资源组织及知识问答系统相关研究的基础之上,构建了红色历史人物知识图谱Schema与KBQA架构,从数据获取、知识抽取、知识融合、图谱生成和知识问答五个环节搭建了红色历史人物问答模型,并以老上大历史人物数字资源进行实证研究。[结果/结论] 本文设计的知识问答服务架构在红色历史人物数字资源的图谱半自动构建、知识推理与智能交互方面具有优越性,提升了用户知识服务体验。  相似文献   

9.
[目的/意义]古诗是我国古典文学的宝贵遗产,从语义关联的视角对领域信息资源中显性知识(人物、时间、地点等)、隐喻知识(物象、情感等)以及用于解释隐喻文化背景的文化图式进行语义组织,对于新时代下我国文脉的内涵式传承与认知服务具有重要意义。[方法/过程]提出基于知识本体的隐喻知识及其文化图式组织模型。从古诗的物象与情感概念切入,剖析物象与意象隐喻知识的概念内涵与作用机制;对古诗文本进行特征解析以归纳核心的元数据,以构建融合显性与隐喻概念的古诗知识本体;获取领域显性与隐喻知识构建古诗知识图谱进而开展图谱解析。采取语义推理逻辑从图谱三元组数据中发掘古诗隐喻文化图式;将文化图式的图谱数据作为古诗表示特征进行计算,从族性和特性的角度探索古诗分类编目和个性化推荐等知识服务应用。[结果/结论]所构建的古诗知识本体能够从语言层面和诗人心理层面对隐喻知识及其文化图式进行有效知识组织,真正实现从语言、语义、情感及隐喻等层面对古诗进行知识挖掘与数据关联,以提升读者对古诗文化的感知、理解与认知能力。  相似文献   

10.
古籍目录及其分类体系具有重要的学术价值,数字学术的发展为古籍目录的数字化保存和利用以及开展数字工具支持的目录学研究提供了新的契机。本文以时间跨度两千多年的八种史志目录为数据源,以机器预处理与专家校对相结合的人机迭代方式对数据进行记录拆分和字段抽取、数据补全、规范化以及书目认同,最终完成11万余条书目记录的结构化、规范化集成。在此数据集的基础上,从领域专家的研究需求出发,结合统计、可视化、检索等方法,利用人机交互技术构建了一个历代古籍目录可视化分析系统。该系统包括书目统计以及分类演化分析两个主要部分:一方面可对书目数据进行细粒度统计和可视化呈现,以帮助学者清晰地比较、追踪类目的消长;另一方面可对所有典籍在历代目录中的分类演变轨迹以及各类目所收典籍的源流进行可视化分析,以更好地实现类目分合转化的模式识别。本研究为数字学术背景下的目录学研究提供了数据基础和分析工具,不仅为学者省去了大量数据收集、整理的时间,还通过新的技术和视角助力分析、比较等解释性研究。图8。表3。参考文献36。  相似文献   

11.
[目的/意义] 基于古籍数字化和古文智能处理的古籍人文计算研究,是近年来古文信息处理的新焦点,而以数据为基础的量化分析方法能为古籍相关的传统研究问题带来新的视角和思路。[方法/过程] 以《春秋》三传中女性人物为研究对象,以多角度的女性人物知识标注为数据来源,进行了包括女性人物"姓、国、氏"、排行、谥号、尊称和年份分布的女性人物知识量化分析,以及以女性人物知识为线索的以联姻参与度为主的诸侯国联姻关系量化分析。[结果/结论] 对《春秋》三传女性人物进行了新角度的解读,提供了一种可度量、可视化的研究思路,为相关研究提供了可信的数据验证。  相似文献   

12.
艰涩的古汉语文法和线性的内容呈现方式是普通读者从史籍原文获取所需信息的两大障碍。该问题的解决需要实现史书知识重组与形式再造,即支持从时间、人物、地点等多个维度出发获取史书中的知识,并以图结构的方式呈现所返回的结构化知识以及对应的史书原文,从而在降低相关信息的获取与理解难度的同时,拉近读者与史籍原文的距离。然而,目前基于史书原文获取结构化知识的研究较少,已有研究自动化程度较低,且多在可视化呈现上与史书原文相割裂。因此,本研究提出并实现了史书多维知识重组与可视化系统,该系统包括史书多维知识建模、基于古籍智能处理技术的史书多维知识库自动构建与多维知识可视化三部分。最终将该系统应用于我国第一部纪传体史书《史记》,实现了其以人物、时间、地点、社会集团、职官等不同维度为中心的自动重组与可视化。  相似文献   

13.
[目的/意义] 以数字人文需求为牵引,从知识的角度有效组织学术名人资源,为图书馆等公共文化机构开展知识服务提供资源支撑。[方法/过程] 通过分析学术名人特色资源特征和用户使用需求,调研分析4类以人物为核心的特色资源库知识模型,以人物(学术名人)为核心,以资源为载体,构建学术名人描述框架模型和学术名人与其他实体关系模型。[结果/结论] 在学术名人知识模型的基础上链接外部数据,能够对以李政道特色资源为代表的学术名人特色资源从知识颗粒的角度进行有效的组织和展示。  相似文献   

14.
[目的/意义]数据是数字人文研究的基础和核心之一,图书馆人文数据组织与重构不但能提高数字资源的利用率,而且能拓展图书馆人文数据服务,可极大地促进数字人文科学的发展,也是图书馆知识型专业服务的具体体现,有利于提供更高层次领域的服务。[方法/过程]分析数字人文研究中的人文数据特点及人文学者研究对人文数据的需求,认为图书馆需从人文数据的完整性、可计算性、可用性及重用性、可发现以及获得性等角度出发进行人文数据组织与重构。[结果/结论]要克服人文数据碎片化带来的零散、不系统的弊病,必须采用数据复原与重构的方式恢复或重建人文数据所蕴含的知识之间的联系,采用数据化、数据融合、数据关联及发布等手段,最终实现知识单元的精细粒度化、知识组织的语义化、知识呈现的可视化。  相似文献   

15.
注疏文献中蕴含着丰富的知识,为了能够利用计算机分析经典古籍和注疏文献中的信息,实现知识的自动重组和聚类,分析注疏文献中存在的问题,提出使用结构化的知识表示方法组织经典古籍和注疏文献中的知识。并结合经典古籍注疏文献知识网络的基础框架结构,探讨经典古籍注疏文献知识网络中的知识组织方式和应用价值。  相似文献   

16.
��[Purpose/significance] In order to explore the development trend of the research on the digitization of ancient books, it makes a systematic investigation on the research status of the digitization of ancient books in China.[Method/process] By using CiteSpace software, authors and key words of the research on the digitization of ancient books in the past decade were analyzed. Also, it analyzed the main research fields and subject distribution of papers and national social science fund projects. Authors made an investigation and had an experience on the functions of the existing digital products of ancient books.[Result/conclusion] This paper summarizes 3 general characteristics and five main problems of the research of digitization of ancient books in recent ten years, and points out that the knowledge service digitization of ancient books is the inevitable trend in the future under three drives of academic inheritance, user demand and the development of information technology.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号