首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
刘浏  齐月  刘雏菲  李文祺  王东波 《情报学报》2023,(12):1498-1512
古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古籍引书全文本知识库构建的技术现状。本文围绕知识表示、知识标注、知识补全与消歧,描述了古籍引书全文本知识构建的框架流程,并就目录典籍、经学注疏、史书及诗词歌赋四类对象进行了引书知识库的构建尝试,分析了古籍引书知识库的应用前景。  相似文献   

2.
[目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。  相似文献   

3.
[目的/意义] 基于古籍数字化和古文智能处理的古籍人文计算研究,是近年来古文信息处理的新焦点,而以数据为基础的量化分析方法能为古籍相关的传统研究问题带来新的视角和思路。[方法/过程] 以《春秋》三传中女性人物为研究对象,以多角度的女性人物知识标注为数据来源,进行了包括女性人物"姓、国、氏"、排行、谥号、尊称和年份分布的女性人物知识量化分析,以及以女性人物知识为线索的以联姻参与度为主的诸侯国联姻关系量化分析。[结果/结论] 对《春秋》三传女性人物进行了新角度的解读,提供了一种可度量、可视化的研究思路,为相关研究提供了可信的数据验证。  相似文献   

4.
[目的/意义]为改善作者共被引分析(author co-citation analysis,ACA)在识别学科领域知识结构中缺乏内容信息的不足,将文献内容信息(题名、摘要、关键词)引入到作者共被引分析中,提出一种新的作者共被引分析方法,即"内容与ACA融合的方法(content and author co-citation analysis,C-ACA)"。[方法/过程]以"学科服务"主题领域为例,分别建立ACA作者相似矩阵Aij、作者-内容矩阵并转换为作者相似矩阵Bij;通过构建线性融合函数实现作者文献内容与ACA的融合;最后通过提取作者主题因子成分并在NetDraw环境下进行2-模图可视化,挖掘并呈现学科服务研究领域的知识结构。[结果/结论]与传统ACA方法比较,C-ACA方法能够更准确、更细致地挖掘和揭示学科领域知识结构。  相似文献   

5.
传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需求的文本主题内容的方法,以推动数字人文研究的进一步发展。首先,选取本课题组前期标注的古籍语料数据进行主题类别标注和视图分类;其次,构建融合BERT (bidirectional encoder representation from transformers)预训练模型、改进卷积神经网络、循环神经网络和多头注意力机制的语义挖掘模型;最后,融入“主体-关系-客体”多视图的语义增强模型,构建DJ-TextRCNN (DianJi-recurrent convolutional neural networks for text classification)模型实现对典籍文本更细粒度、更深层次、更多维度的语义挖掘。研究结果发现,DJ-TextRCNN模型在不同视图下的古籍主题推荐任务的准确率均为最优。在“主体-关系-客体”视图下,精确率达到88.54%,初步实现了对古籍文本的精准...  相似文献   

6.
[目的/意义]针对社会化标注系统用于数字档案资源组织后带来的资源检索与导航问题,提出依托主题图的数字档案资源聚合模型,以期提高数字档案资源检索效率并建立有序的可视化导航。[方法/过程]在剖析利用主题图实现社会化标注系统资源聚合相关研究现状的基础上,构建数字档案领域基于主题图的资源聚合模型,给出利用社会网络分析和形式概念分析析取数字档案资源主题图的主题类型、关联关系及资源指引三要素的体系化解决方案,从而实现数字档案标注系统资源聚合。[结果/结论]以NARA数字档案标注系统中的"Women at War"话题为例,利用所提方法并结合Ontopia工具实现目标话题的数字档案资源聚合,有效提高系统中数字档案资源的检索效率和导航效果。  相似文献   

7.
陶颖  周莉  宋艳辉 《图书情报工作》2017,61(11):140-148
[目的/意义] 知识域可视化是信息可视化衍生出的一个重要分支。基于图书情报学、科学学的研究方法,对知识域可视化研究成果中的共被引与耦合进行全面梳理,分析共被引与耦合在知识域可视化方法中的具体应用,总结知识域可视化的共被引与耦合新发展,引导和推动知识域可视化研究的深入开展。[方法/过程] 在界定知识域、知识域可视化和构建知识域可视化研究框架的基础上,对知识域可视化方法的共被引与耦合进行了归纳和总结,分析了文献共被引方法、作者共被引、期刊共被引、文献耦合方法、作者耦合方法这5种主要的共被引与耦合方法。[结果/结论] 认为以上5种方法是知识域可视化研究的主要方法,而多元引用方法、融合替代计量学的共被引与耦合代表了知识域可视化的新发展。  相似文献   

8.
大规模中国历代存世典籍知识图谱构建研究   总被引:2,自引:1,他引:1  
[目的/意义]探索构建中国历代存世典籍知识图谱,以为研究者挖掘海量古籍书目数据背后隐藏的知识提供一站式平台,拓展古籍知识服务内涵,同时,大规模的典籍知识图谱也是机器智能的重要基础。[方法/过程]通过知识图谱技术对中国历代存世典籍进行知识组织,从需求层、模型层、应用层3部分构建一个典籍知识图谱框架模型,通过人机协作进行典籍数据抽取及多源数据融合,完成数据的整理,并对典籍知识图谱实体类型及属性、典籍知识图谱实体关系及类型进行分析与定义。[结果/结论]所构建的典籍知识图谱包含649549种古籍实体、221783位典籍责任者、1498383个古籍版本、13960个地名节点,形成了一个立体、多维、多用途的古籍知识关联网络,对全球目前存世的主要中国历代典籍书目信息进行了较全面描述。  相似文献   

9.
[目的/意义]利用自然语言处理技术,研究一种从科技规划文本内容中自动构建研究前沿主题地图方法。[方法/过程]首先,利用自然语言处理领域中的信息抽取、主题识别等技术对科技规划文本进行主题挖掘分析,然后,利用Java语言开发相应挖掘工具,构建科学研究前沿主题地图,并进行可视化展示。[结果/结论]通过对碳纳米管研究领域的实证研究证明,该方法能够全面、快速准确的绘制出该领域科学研究前沿地图。  相似文献   

10.
祝娜  王芳 《图书情报工作》2016,60(5):101-109
[目的/意义]科技创新需要快速发现特定科技领域中关键知识衍生与演化的路径,探索未来的知识创新趋势,为此,有必要对知识演化路径进行动态可视化研究。[方法/过程]从主题关联的角度入手,以3D打印领域为例,基于LDA识别出科技创新主题并进行分阶段细化分析,探测主题集群内部与外部的关联强度,识别出主题不同生命周期的演化能力及其演化类型。[结果/结论]实验结果表明,该方法从主题关联的角度入手,构建了基于时间序列的知识演化路径,丰富了知识管理和信息计量的理论研究方法,在实践上则有助于探测科技创新知识。  相似文献   

11.
[目的/意义] 通过量化计量指标对研究主题的知识扩散进行测度与分析,客观地展现研究主题所包含的知识单元的扩散路径及其扩散规律。[方法/过程] 以Web of Science(SCI-E&SSCI)数据库核心合集为数据来源,通过被引参考文献检索方法,以J.E. Hirsch 2005年首次提出H指数概念的文献为被引文献,检索2005-2015间引用该文献的施引文献,得到样本数据。借助信息可视化分析工具CiteSpace分别进行关键词共现与文献共被引分析。将分析结果通过本文所提出的双阶知识扩散度指标Q算法进行计算,得到指标Q量变情况,并进一步分析H指数研究领域的演化扩散状况。[结果/结论] H指数研究主题的知识扩散的相关性随着流动阶层的增加而降低;H指数研究主题一、二阶知识扩散文献的主要研究方向不同,二阶文献更侧重于应用领域的拓展,这也是该研究邻域知识流动的新增长点;通过对H指数研究主题的分析,证明了本文所提出的双阶知识扩散度指标Q的准确性及科学性。  相似文献   

12.
[目的/意义]非遗图片资源社会化标签是大众对图片内容的意识反映,蕴含丰富的知识价值。研究标签之间的关联关系有助于构建针对标签的非遗图片资源主题导航,并对非遗图片资源的组织和展示提供参考。[方法/过程]从标签关联视角探讨非遗图片资源网站社会化标签之间的关联关系,构建关联标签网络和共标签网络,对其进行社会网络分析和对比,并采用可视化方法对主题特征进行展示。[结果/结论]所分析的非遗图片资源社会化标签存在一定主题特征,便于从用户角度组织和利用非遗图片资源,促进非遗文化的传承。  相似文献   

13.
地方志引书挖掘系统的设计与实现   总被引:2,自引:0,他引:2  
古籍文献普遍存在着引书现象,因而构建一套针对地方志引书的挖掘识别系统,对古籍的研究以及目录学史、藏书史、科技史,都具有重要意义.本文以地方志资料汇编<方志物产>为语料,设计并构建了一个古籍引书挖掘系统.重点讨论了引书的模式提取、N-gram分词识别等功能算法.  相似文献   

14.
[目的/意义]为更好地提升科技文献的语义丰富化效果,对国内外科技文献语篇元素标注模型、技术和方法进行调研总结,为文本挖掘、科技论文知识抽取、语义分析系统研究者提供借鉴。[方法/过程]利用学术网站搜索和相关数据库搜索引擎,对涉及科技论文标注、语篇元素、知识抽取、句子识别和自动文章分类等参考文献以及研究报告进行深入阅读和调研,对语篇元素自动标注模型以及相关工作进展进行研究总结。[结果/结论]科技文献语篇元素标注具有非常重要的实际应用价值,构建标注模型需充分考虑构建思想、标注领域和标注粒度以及标注技术手段等方面。  相似文献   

15.
[目的 /意义]针对历史古籍事件识别问题,对比序列标注方法和文本生成方法,探究两种方法在古汉语上的表现,构建模型实现历史古籍事件识别自动化,以提高面向历史古籍构建知识图谱的效率。[方法 /过程]选取《三国志》为原始语料,序列标注实验对《三国志》事件数据集进行BMES标注,构建BBCN-SG模型,文本生成实验构建T5-SG模型,对比两种方法的表现。接下来,构建RoBERTa-SG、NEZHA-SG模型展开生成模型的对比实验。最后,结合三个文本生成模型,融入Stacking集成学习的思想,构建Stacking-TRN-SG模型。[结果 /结论 ]在历史古籍事件识别建模问题上,文本生成方法的表现明显优于序列标注方法。而在文本生成方法中,RoBERTaSG模型的识别效果综合最好。Stacking集成学习能够大大提高生成模型的识别效果,构建的Stacking-TRN-SG模型达到70.35%的召回率,初步实现历史古籍的自动事件识别。  相似文献   

16.
[目的/意义]非物质文化遗产资源具有重要的社会价值,将主题图技术应用于非物质文化遗产数字资源的整合中,能够更好地实现非物质文化遗产数字资源的传承与保护。[方法/过程]在分析非物质文化遗产数字资源的主题、关联关系和资源标引的基础上,构建非物质文化遗产数字资源主题图并实现其可视化。[结果/结论]研究结果显示,主题图技术的应用可以为非物质文化遗产数字资源提供基于语义的整合,并将主题之间的关联直观地展示给用户,为用户提供可视化导航。  相似文献   

17.
[目的/意义] 以在线社交网络为研究对象,通过文献梳理准确捕捉社区发现的发展态势及研究热点,探究如何在大规模社交网络中挖掘隐藏社区,具有理论和实践意义。[方法/过程] 以中国知网(CNKI)数据库、Web of Science核心合集及相关国际会议文献作为数据来源,应用CiteSpace可视化分析工具从热点关键词、主题演化路径以及共被引文献等方面进行定量研究,并从社区发现方法、算法实现及应用实践3个维度对文献内容详细述评。[结果/结论] 当前研究领域仍有广阔的发展空间,未来应注重算法的优化及创新、应用场景的区分和拓展以及融合跨学科知识、前沿技术方法的交叉研究。  相似文献   

18.
[目的/意义]以文化基因视角解构中国传统诗词文化,对诗词资源进行文化内涵的细粒度挖掘,实现诗词资源的知识重组与形式再造,有助于促进诗词资源在数智化时代的创造性转化与创新性发展。[方法/过程]设计文化基因视域下诗词资源知识重组研究框架,首先基于茶文化维度,在分析文化基因谱系的基础上构建本体模型完成诗词资源的多维语义知识描述。其次,以苏轼茶诗为具体案例,基于知识图谱分别从微观角度和宏观层面提供诗词资源知识的关联展示。[结果/结论 ]通过将诗词文化解构提取其文化基因,将其与诗词资源相融合完成知识重组,利用知识图谱技术可视化分析传统诗词资源微观至基因、宏观到时空的知识特征,为人文学者研究诗词提供新的研究方式与研究视角。  相似文献   

19.
司莉  郭财强 《图书情报工作》2022,66(13):127-137
[目的/意义]对知识组织方法与技术在数字人文领域的应用情况进行系统梳理,以更好地把握其实际应用特点,明确数字人文领域知识组织的价值,并为后续相关研究与实践提供借鉴。[方法/过程]采用文献调研法获取国内外数字人文领域相关研究文献,并基于内容分析法对其进行深入分析。[结果/结论]研究发现:元数据、本体、语义标注、关联数据等知识组织方法与技术贯穿数字人文的始终,是数字人文的有机组成部分;知识组织可为数字人文资源的组织提供解决方案与方法工具,为人们观察文化现象历史演化提供新视角,赋予人们获取新知识、发现新问题的能力;知识组织在数字人文领域发挥了方法价值和中介价值,为数字人文领域资源的组织与利用提供方法工具,充当用户与数字人文领域资源之间的桥梁。  相似文献   

20.
[目的/意义]学术文献影响力评价指标不断推陈出新,但尚缺乏在研究主题层面对文献影响力的评价,为发现不同研究主题内具有高影响力和引用价值的文献,本研究给出一种基于研究主题的文献影响力评价方法。[方法/过程]以Web of Science数据库中2011年-2015年间情报学领域500篇高被引文献为样本,利用LDA模型对样本文献进行主题建模,将主题对文献的支持度与文献被引频次相结合,计算特定主题文献的被引频次(specific topic cited frequency,简称STCF),并根据每篇文献在相应主题内的STCF值对文献进行影响力排序。[结果/结论]结果表明,STCF值能反映文献的主题内容、细粒度体现文献的学术地位、呈现文献研究主题的多元性,能够有效弥补被引频次、Altmetrics指标的不足。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号