首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 71 毫秒
1.
【目的/意义】文物图像资源日益成为数字人文基础设施建设的重要内容,为了克服存在于图像资源内容与 形式上的“语义鸿沟”对其开发利用产生的消极影响,有必要面向文物图像资源底层视觉特征与高层语义特征的精 细化映射与细粒度知识表示进行相关研究。【方法/过程】本文在分析文物图像资源知识表示需求与表示策略的基 础上,提出了基于知识元构造的文物图像资源细粒度知识表示模型。在模型设计的基础上,以著名绘画文物《历代 帝王图卷》为例,阐述了面向文物图像资源细粒度表示需求进行知识元提取、构造与数据发布的具体流程。【结果/ 结论】实验结果表明,本文提出的基于知识元的文物图像资源细粒度知识表示方法能够在图像底层视觉特征与高 层语义特征之间建立有效的语义映射关系,并通过与外部知识库的数据关联实现与开放关联数据网络的深度融 合。【创新/局限】本文从知识元角度出发,提出了文物图像资源的细粒度知识表示方法,在未来的研究中还需对文 物图像知识元的自动提取以及基于知识元的图像资源知识发现方法进行更深入地探索。  相似文献   

2.
徐彤阳  邓颖慧 《情报科学》2018,36(7):158-162
【目的/意义】随着大数据时代的到来,基于关键词的微信检索已不能满足用户的检索需求,如何快速高效 地检索出用户需要的信息是微信检索面临的关键问题。【方法/过程】为解决上述问题,本文采用一种基于语义关联 的微信跨媒体检索框架,利用语义关联图来揭示不同模态数据之间潜在的语义关联,将微信数据构成一个资源群 体。【结果/结论】基于语义关联的微信跨媒体检索框架,实现了语义特征的统一视图,可有效缩小语义鸿沟,提高检 索效率。  相似文献   

3.
【目的/意义】馆藏文物资源知识分散、异构、关联程度较低,本文提出一种馆藏文物资源知识关联的有效方 法,便于关联化的知识服务的开展和馆藏文物信息资源的开发利用。【方法/过程】本文在分析馆藏文物信息资源关 联和智能问答现状的基础上,提出基于关联数据的馆藏文物信息资源知识关联方法,构建了一个基于关联数据的 知识关联模型。通过借助关联数据相关技术、利用SPARQL以及HTML对馆藏文物资源知识进行访问和查询。【结 果/结论】将馆藏绘画类文物知识发布为关联数据形式后,馆藏文物资源知识得到充分的聚合,深度展现文物信息 资源之间的关系,提高了不同需求的用户浏览不同粒度的文物知识、知识实体关系的效率。【创新/局限】从关联数 据角度出发,提出基于多粒度语义查询的智能问答服务框架。下一步研究需要扩展馆藏文物资源的数据采集规 模,对馆藏文物资源的深层次关联发现进行探索。  相似文献   

4.
戎军涛 《情报科学》2019,37(7):30-35
【目的/意义】解决人类知识资源利用的办法是将知识的控制单位由“文献”深化到“知识元”,这被认为是图 书情报学研究取得突破的关键问题。【方法/过程】我们在分析知识元本质、形态的基础上,提出了知识元的语义结 构由知识项、知识资源和属性函数三部分构成。在此基础上我们从内容表达层、语义关联层和文献载体层三个维 度构建了知识元的语义模型,对模型各个要素进行了规范化说明,并给出了语义标注实例。【结果/结论】研究表明, 该模型具有层次性,结构较为合理,语义效果显著,有利于语义揭示深入到知识单元,为细粒度的知识组织与发现 提供了新的视角。  相似文献   

5.
王颖  于改红  谢靖 《情报科学》2021,39(8):67-77
【目的/意义】通过对学术资源进行深度挖掘与语义化组织,实现学术资源及其内部知识之间的关联发现。 【方法/过程】本文提出基于全文知识网络的学术资源关联发现方法,设计了全文知识网络的模型和构建流程,以 Pubmed Central数据库中拟南芥(Arabidopsis)相关的520篇期刊论文全文数据为实验对象,通过全文解析和挖掘将 其分解为细粒度的知识,形成全文知识网络。然后利用SPARQL查询和RelFinder可视化工具从数字资源层、知识 单元层和知识对象层三个层次开展关联发现实验。【结果/结论】本文构建全文知识网络对学术资源进行细粒度组 织和挖掘,有助于发现不同学术资源及其内部知识之间的潜在关联,对学术资源的深度利用具有重要的意义。【创 新/局限】本文创新之处在于通过构建全文知识网络对学术资源进行细粒度揭示和组织并进一步发现潜在关联,局 限在于尚未开展大规模应用实践。  相似文献   

6.
陈金菊 《情报科学》2021,39(1):148-156
【目的/意义】突发事件新闻具有连续性特征,现存的语义模型无法很好地表示这一特征,通过构建突发事 件新闻语义模型可以实现对这些连续性信息的深层次语义描述和利用。【方法/过程】本文根据由表及里的建模思 维,构建了一个突发事件新闻深层次语义描述本体模型。该模型分为元数据和内容语义两部分,内容语义部分以 事件为起点、以连续性情景和动作为核心。在对突发事件新闻案例进行语义描述的基础上,实现了语义检索、语义 推理、语义数据可视化分析等应用。【结果/结论】通过语义标注和应用实验,验证了该模型的可用性。【创新/局限】本 文提出的突发事件新闻本体模型,较好地解决了突发事件新闻连续性信息的语义标注问题。  相似文献   

7.
【目的/意义】针对非物质文化遗产(简称“非遗”)视频资源难以入库与管理的难题,提出了一种非遗视频资 源的管理和语义组织的语义标注方法。【方法/过程】首先对非遗视频采用基于SURF算法和窗口阈值的镜头分割方 法,将非遗视频解构成不同颗粒度的逻辑单元;其次构建了非遗视频语义标注的本体模型;最后通过视频语义标注 过程,实现领域知识概念与视频资源间的语义关联,赋予视频单元丰富的语义信息。【结果/结论】非遗视频综合语 义标注方法可对非遗视频资源实现有效管理,为用户提供结构化、语义化的视频浏览及知识可视化等知识服务,对 非遗数字化保护与传播具有重要的意义和价值。  相似文献   

8.
周伟  孙明  刘晚秋  谭振江 《情报科学》2019,37(8):145-151
【目的/意义】本文根据服务国家特殊需求“满族语言文化”博士人才培养项目需求,构建了满语数字资源语 义关联模式,不仅为满语研究者的研习提供了便捷渠道,解决了大量满文文献的识别与翻译问题,进而促进了满语 人才的培养,推进了实现对世界濒危语言——满语的抢救和保护工作。【方法/过程】本文以满语语义数字资源为研 究对象,针对满文档案翻译的研究,利用云计算等技术,设计构建了满语语义资源体系结构、语义标注子系统、信息 提取子系统等基于智能终端的满语语义数字资源关联模式,并实现了智能终端APP的推广应用。【结果/结论】本文 构建的满语数字资源语义关联模型,助力了各部门满文档案翻译的智能化进程。同时,生成的智能便捷应用成果 推动了满语文化的传承和发展,实现了满语研究数据的价值流动,对于抢救满语文化资源具有重要的意义。  相似文献   

9.
【目的/意义】本文基于颜色、纹理等外部特征与局部视觉特征构成的底层语义特征数据并采用随机森林的 方法对医学图像信息进行语义自动标注,为医务工作者提供临床决策参考,便于普通公众理解医学知识和了解个 人健康情况,也可以在大数据环境下扩展图书情报领域研究人员对信息组织与处理的范围,促进学科交叉与融合, 提升智慧医学的发展,为健康中国战略提供智力与技术支持。【方法/过程】融合图书情报领域知识与医学知识,将 图像语义标注看作为一个多类分类问题,首先,抽取颜色、纹理等外部特征及局部视觉特征等底层语义特征;然后, 运用随机森林的方法,设计了基于随机森林的医学图像自动标注方案。【结果/结论】融合底层语义特征的医学图像 信息自动标注的方案与随机树标注方案相比较,具有较好的效果。【创新/局限】将视觉语义词典作为医学图像的底 层语义特征引入到图像标注中;运用随机森林构建的医学图像标注方案;局限在于仅采用BreaKHis数据集为实验 数据。  相似文献   

10.
科学论文内的科学数据组织和发现研究   总被引:2,自引:0,他引:2  
黄可  梁慧刚  姜山  黄健 《现代情报》2009,29(2):34-43
[目的/意义] 科学论文中的图、表等科学数据(文内数据)蕴含有丰富的知识内容。基于细粒度语义组织的文内数据发现有效聚合文献、科学数据两类科研产出,为未来实现全领域、全维度、全粒度、全类型的深度知识发现奠定基础。[方法/过程] 梳理、对比、分析现有3类文内数据的发现模式,尝试构建面向细粒度内容描述的文内数据本体,揭示文内数据的显性特征、内容特征以及与其他类型科学产出的关联特征。[结果/结论] 从面向应用的角度,提出基于本体的文内数据知识发现技术框架,细化"信息抽取—语义标注—关联应用"技术路线,针对关键点技术进行讨论。文内数据本体为科学论文内科学数据提供语义描述和关联组织依据,人工标注结合机器学习自动标注可以解决文内数据部分特征发现问题。  相似文献   

11.
李枫林  柯佳 《情报科学》2019,37(5):155-165
【目的/意义】词是语言的最小单元,词的向量表示决定了机器学习模型的构建方法。深度学习的神经网络 训练得到的词向量,通过无监督的机器学习方法从海量数据中自动学习词汇的语义特征,无需人工标注和复杂繁 琐的特征工程,端到端的完成各种自然语言处理任务,带来了一种新的研究范式,成为学术界的研究热点。【方法/ 过程】介绍了词向量语义表示及优化方法,存在的问题及解决方法,最后指出了词向量未来的研究方向。【结果/结 论】将句法特征、词形特征、(知识库)先验语义知识融入到神经网络模型能增强词向量的语义表示能力,针对词向 量存在的一词多义、解释性差等问题,总结了最新的研究成果。  相似文献   

12.
【目的/意义】通过构建上海市名人故居知识图谱,可以强化沪上名人故居非结构化数据的知识组织问题,为后续历史名人故居学术资源相关研究提供思路和借鉴方法,也为游客选择名人故居游提供便利。【方法/过程】本文基于沪上名人故居用户需求及旅游领域相关行业标准,首先采用自顶向下的方式设计沪上名人故居知识图谱框架,之后以此框架为基础通过序列标注、机器学习等方法填充图谱的实体、关系及属性为沪上名人故居的知识图谱构建提供数据支撑,最后运用Neo4j图数据库对沪上名人故居知识图谱进行可视化存储。【结果/结论】沪上名人故居知识图谱构建实现了资源的可视化存储及语义检索,能够提供数据浏览与知识展示,数据查询与知识检索、知识关联与信息推荐等功能,为后续智能问答、智能信息推荐的应用研究奠定基础。【创新/局限】本研究结合用户需求及上海市名人故居数据结构特点,建构了沪上名人故居知识图谱框架,为后续名人故居知识组织相关研究提供了思路。本文数据的选取仅限于上海市内的知名名人故居,有关研究数据有待进一步扩充以更好地研究文章方法的适用性。  相似文献   

13.
徐彤阳  邓颖慧 《情报科学》2019,37(1):129-133
【目的/意义】随着微信中多媒体信息资源的增长,传统的微信检索已不能满足用户的检索需求,如何快速 高效地从多媒体数据中检索出用户需要的信息是微信检索面临的关键问题。【方法/过程】为解决上述问题,本文提 出一种基于知识融合的微信多媒体检索框架,利用知识融合技术来揭示不同模态数据之间潜在的关联。【结果/结 论】基于知识融合的微信多媒体检索模型,将多媒体信息构成一个资源群体,可有效消除数据冗余,提高微信检索 效率。  相似文献   

14.
【目的/意义】科技成果信息资源不仅可以反映科研发展的脉搏、揭示科技前沿的动态、还可以在转化过程 中实现创新并创造价值。但大部分科技成果信息还处于闭塞及未完全开发状态。BIBFRAME使书目数据能够融 入万维网并能实现与相关数据集的关联。将BIBFRAME应用于科技成果资源的开放及共享,有利于科技成果资源 价值的发挥。【方法/过程】基于内部特征及外部特征构建科技成果信息资源层级关联关系,并从内容维度、结构维 度和使用维度三个角度对资源进行描述及揭示并构建关联模型。【结果/结论】通过BIBFRAME的映射及编码实现 科技成果信息资源多维度聚合,有效解决了科技成果信息资源的“资源孤岛”问题。【创新/局限】通过手工方式实现 了科技成果元数据与BIBFRAME2.0词汇的映射,并结合URIs及标签揭示资源的隐性知识及展示知识脉络。  相似文献   

15.
[目的/意义]为满足用户多层次、多粒度的知识获取需求,图书馆文献资源组织的对象由文献单元逐步向知识单元转变。[方法/过程]文章在研究单元信息概念和表示模型的基础上,提出基于本体和关联数据的单元信息知识组织框架,并深入探讨了实现单元信息语义组织的核心步骤。以中医养生领域为例,阐述单元信息知识组织语义模型的应用过程。[结果/结论]本文构建的单元信息知识组织模式,是实现单元信息细粒度组织、语义化揭示以及多维度关联的有效途径。该研究可为特定领域单元信息的语义应用提供参考。  相似文献   

16.
牛力  刘慧琳  王保国 《情报科学》2021,39(11):30-37
【 目的/意义】数字环境下典藏资源在利用中遇到瓶颈,因此需要优化或更新资源组织方式,本体与标签作为 网络信息组织的重要手段可以为典藏资源的组织带来借鉴。【方法/过程】从资源组织过程出发,基于本体的设计方 法,构建了面向典藏资源的多维度标签体系分层框架,展现层级序化的组织过程。同时基于典藏资源组织需求,设 计了数字人文视角下标签体系模型,展现标签体系在资源组织与服务中的作用。【结果/结论】以吴宝康老照片资源 为例的实证检验再次印证,数字人文视角下典藏资源多维度标签本体的构建能够帮助建立资源间的关联关系,为 语义检索与导航、知识发现与可视化等提供支持。【创新/局限】借助本体规范标签的知识表示展现了标签体系在典 藏资源立体化、语义化、细粒度组织过程中所发挥的作用,未来可以加强过程的自动化程度,推广研究对象的适应 范围。  相似文献   

17.
李宗俊  范炜 《情报科学》2021,39(7):186-192
【目的/意义】智慧数据是数据资源价值挖掘的承载,其中语义丰富化方法是促成智慧数据的重要手段。语 义丰富化方法及相关实践为智慧数据建设提供参考与借鉴。【方法/过程】从语义丰富化方法的技术角度出发,梳理 语义丰富化与关系型数据库、本体以及关联数据的关系,继而对语义丰富化在医学健康、数字出版、文化遗产等领 域的应用实践展开分析和归纳。【结果/结论】语义丰富化是利用语义网以及文本挖掘、相似度计算等相关技术将数 字资源中隐含的语义关系显性化,并在不同的资源间构建语义链接,促进数字资源的互通、互联与集成。由于数字 资源语义化层次、粒度与面向领域等存在的差异,智慧数据的实现需要语义丰富化诸多方法的有效集成框架。【创 新/局限】本文分析了数据网络中数字资源向数据资源转化的新方法,但仅局限于语义丰富化在部分领域中的应 用,还需丰富和扩展资料,总结语义丰富化的框架和应用分析。  相似文献   

18.
【目的/意义】“江海文化”以国家历史文化名城南通为中心,属于江苏地域文化中一个重要分支区域。采用 语义网与关联数据技术,进一步发掘与利用蕴含在“江海文化”各类资源中的知识。【方法/过程】以“江海文化”特定 资源为研究对象,以“张謇研究特色数据库”为基础,运用本体工程与关联数据技术展开多维语义聚合实证研究,包 括基于BIBFRAME 2.0的“张謇”知识本体设计、从RDB到RDF的数据转换、RDF的数据存储、运用SPARQL语言 实现数据的查询与存取以及可视化展示。【结果/结论】实现对“江海文化”相关资源的语义描述、深度关联、多维度 聚合和有效利用,推动 “江海文化”研究的深化,以及提高相关馆藏机构的知识服务能力。  相似文献   

19.
闫盛枫 《情报科学》2021,39(9):146-154
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出 一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时 序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强 其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法 对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具 有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提 升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单 元和语法结构。  相似文献   

20.
【目的】梳理国内外语义出版的理论研究进展,以厘清下一步语义出版的理论研究方向。【方法】 围绕语义出版的对象范畴、表现形式、实现方法、价值功效等理论要素对中外文献进行统计、对比和综合分析,总结现有理论研究的共性特征及其中存在的问题。【结果】 语义出版的研究对象从以学术期刊为载体的论文资源,扩展至图书、学位论文等形式的文献型学术资源,乃至数据型、媒体型、工具型学术资源;表现形式侧重于不同资料、事件、人物、术语、记录等实体对象的抽取、链接和集成,构建科学知识的语义关系及其构成的知识网络;实现方法涉及语义出版框架模型、语义标准、语义技术、语义工具、语义描述等;具有知识价值、商业价值和产业价值。【结论】 理论研究层面的语义出版在概念界定、方法适用性、服务体系等方面还需进一步探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号