首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
[目的/意义]实体语义关系分类是信息抽取重要任务之一,将非结构化文本转化成结构化知识,是构建领域本体、知识图谱、开发问答系统、信息检索系统的基础工作。[方法/过程]本文详细梳理了实体语义关系分类的发展历程,从技术方法、应用领域两方面回顾和总结了近5年国内外的最新研究成果,并指出了研究的不足及未来的研究方向。[结果/结论]热门的深度学习方法抛弃了传统浅层机器学习方法繁琐的特征工程,自动学习文本特征,实验发现,在神经网络模型中融入词法、句法特征、引入注意力机制能有效提升关系分类性能。  相似文献   

2.
[目的/意义]为满足船舶领域科研或工程人员在知识问答、质量分析等方面的业务分析需求,提升科研工作效率与知识获取便利性、精准性。[方法/过程]围绕结构化、半结构化、非结构化等船舶领域多源异构数据,文章从质和量两方面提出了船舶领域知识图谱构建方法,基于船舶领域概念图谱与实体图谱构建,实现知识图谱“质”的描述;通过对实体间关联关系进行统计分析与建模分析,建立面向业务应用场景的量化分析模型;最终以问答推理为例,展示了从质和量两方面开展面向业务场景知识图谱构建的通用过程。[结果/结论]通过以舰艇涂料失效知识图谱构建为例,验证了在质和量两个方面构建知识图谱的正确性,该方法能够为业务场景分析提供有效支撑。  相似文献   

3.
刘春丽  陈爽 《现代情报》2023,(12):143-163
[目的/意义]科学文献中的知识实体的挖掘、利用与评价对知识发现、构建知识网络、探索知识之间潜在关联均具有重要意义。随着机器学习、深度学习和大语言模型的发展及其应用,相比最早的基于人工标注的知识实体抽取技术,如今已经发生了翻天覆地的变化;此外,近年来,学者对科学文献中知识实体的评价也进行一些探索,取得了较大进展。[方法/过程]在相关文献调研基础上,回顾并比较了基于人工标注的方法、基于规则的方法、传统机器学习、基于深度学习与大语言模型在知识实体抽取方面的优缺点,列举了相关数据集、软件与工具及相关专业会议;从提及频率、替代计量及其影响因素、实体共现网络及实体扩散/引文网络、基于知识实体的同行评议、基于知识实体的论文新颖性和临床转化进展五大方面,对知识实体的评价研究最新进展进行了归纳与整理。[结果/结论]针对目前存在的问题,建议在具体的知识实体抽取任务中,抽取方法选择应权衡多方面因素,再依此选择一个或多个模型完成实体抽取任务;在知识实体评价方面,应重视指标多样化、可靠性、有效性、系统性和规范化研究,关注对知识实体评价指标的影响因素、指标间相关关系与因果关系的实证分析,构建基于知识实体的论文评价...  相似文献   

4.
[目的/意义]当前各学科领域文献增长迅速,迫切需要以面向“问题解决”的思路,从大量科技文献中抽取出研究问题、解决方案及其解决关系,并以此为基础开展领域知识演化研究。[方法/过程]文章提出了可应用于实践的低成本领域实体关系抽取方案:依托词嵌入类比的思想,仅从领域知识资源中提取的少量实体关系对作为基准即可实现关系分类。[结果/结论]在人工智能领域数据集上使用基于词嵌入类比方案的集成模型,抽取解决关系、问题层级关系、方法层级关系的F1值分别为82.33,81.49,74.81。最后,将集成模型应用于全量数据抽取实体关系,从宏观、中观、微观三个层面展示了面向问题解决的人工智能领域知识演化情况。  相似文献   

5.
卢恒  陈章杰  周知 《情报理论与实践》2023,(12):157-166+192
[目的/意义]知识图谱已经成为海量信息资源知识组织的新形态。将知识图谱应用于虚拟学术社区用户生成内容知识组织中,对于虚拟学术社区知识发现及服务具有重要意义。[方法/过程]提出一种基于知识图谱的虚拟学术社区用户生成内容知识共聚框架。首先,运用Word2Vec词向量模型对虚拟学术社区用户生成内容数据集进行词向量表示;其次,基于双向长短记忆神经网络模型与条件随机场识别出虚拟学术社区用户生成内容中的命名实体,基于双向门控循环单元与注意力机制进行实体关系抽取;最后,借助Neo4j图数据库对知识共聚的结果进行可视化展示,并采集丁香园心血管论坛的学术交流帖子,对提出的知识共聚框架进行实证分析。[结果/结论]基于知识图谱的虚拟学术社区用户生成内容知识共聚方法能够有效序化重组虚拟学术社区知识资源,细粒度挖掘和揭示不同类型的知识单元和知识关联,有助于为虚拟学术社区智能知识服务提供语义理解和人工智能的基础。  相似文献   

6.
[研究目的]为提高专利知识图谱构建的自动化水平,并实现知识服务与交易服务的融合,提出了面向供需信息挖掘的供需知识图谱(PSD-KG)的构建思路。[研究方法]知识图谱规划方面,对专利交易涉及实体及关系进行了拓展,规划了共由12类实体和14类关系组成的PSD-KG。知识图谱构建方法上,建立专利领域词典以实现语料自动化标注,并提出了基于BERT-BiLSTM-CRF模型的语义实体识别方法。[研究结论]与传统的CRF、BiLSTM-CRF模型对比发现,该文模型的准确率、召回率和F1指数均高于85%,验证了方法的有效性;以燃料电池领域为例构建PSD-KG,通过技术供需热点识别及演化研究,识别出三类技术热点,包括:持续热门技术点、新兴热门技术点和潜在热点技术;并在交易网络分析、供需信息检索等方面挖掘新应用场景。研究成果也为专利交易推荐提供了知识库。  相似文献   

7.
韩普  叶东宇  陈文祺  顾亮 《现代情报》2023,(10):27-34+151
[目的/意义]随着网络化和数字化的快速发展,线上线下医疗健康活动产生了海量多模态数据,当前迫切需要一种更为完善的知识组织方法,对类型繁多、专业性强的医疗健康多模态数据进行序化和组织。[方法/过程]首先对多模态数据进行预处理以构建多模态医疗健康数据集;接着基于实体对齐和关系抽取实现医疗健康数据的知识单元抽取,并通过知识评估和融合构建多模态知识单元;然后在多模态知识单元和知识图谱基础上提出一种面向多模态医疗健康数据的知识组织模式;最后以文本和图像模态数据为例,以医疗健康问答系统为实践应用进行分析和验证。[结果/结论]针对多模态医疗健康数据的内在特性,基于多模态知识图谱和语义知识组织框架,提出一种面向多模态医疗健康数据的知识组织模式。本研究推进了多模态知识组织的理论深度,可为医疗健康领域知识序化、精准知识服务和深度知识发现提供有效支撑。  相似文献   

8.
[目的/意义]知识图谱作为近年来大数据、人工智能技术飞速发展背景下出现的知识探索、推理发现的新兴技术,对专利检索新业务形态开展,提升业务效率减轻人工负担有着广阔的应用前景。[方法/过程]通过对知识图谱构建流程、技术架构与专利文献业务特点分析结合,对知识图谱语义模型在低质量专利检索和可视化等场景应用进行了探讨。[结果/结论]知识图谱在专利检索场景中适用性较强,相关技术环境/工具成熟,同时其垂直领域多知识体系特点,其语义模型构建还需要高质量文献和专家进行协助和迭代。  相似文献   

9.
[目的/意义]传统知识图谱的构建,通常使用海量数据进行实体和关系的抽取,不具备主题指向性,且难以满足观点深度挖掘,因此提出涉众网络分析理念以提供定题情报服务。[方法/过程]文章结合网络分析法和文本挖掘对涉众网络的概念进行剖析;将涉众网络的理念应用在技术竞争态势分析层面构建了专利技术竞争态势的多层网络分析模型。[结果/结论]选取区块链技术领域作为案例对涉众网络概念进行应用检验,同时对区块链技术竞争态势和技术瓶颈进行探讨,从而对未来技术发展战略给予参考意见。  相似文献   

10.
[目的/意义]从研究成果中抽取数据线索,进而构建针对特定主题的数据索引,有助于提升研究者查找数据的全面性。[方法/过程]以社会科学领域所有学科中文核心期刊中关于“COVID-19”论文的题录信息为例,分三步进行了探索。(1)随机抽取1000篇摘要进行人工标注,然后以此为基础使用自适应增强等模型训练分类器,进而使用分类器识别出使用了数据的论文。(2)从使用数据的论文摘要中标注出数据线索实体,进而使用隐马尔可夫、长短期记忆网络等模型进行实体识别。(3)使用Neo4j数据库,基于抽取出的数据线索与题录中的其他信息构建知识图谱。[结果/结论]在判断论文是否使用了数据的任务中,自适应增强模型的F1值最高,达到0.869。在数据线索实体识别任务中,隐马尔可夫模型的F1值最高,达到0.805。由抽取出的数据线索与论文关键词、作者、期刊等信息融合构建的知识图谱能够实现基于主题词查找数据线索、基于数据线索查找其他信息等应用。  相似文献   

11.
张娟  王向辉  付然  孙晓琳 《现代情报》2017,37(10):49-52
[目的]为了实现海量数据中信息的知识组织,促进单元信息和文献信息内容的知识关联和知识发现,构建单元信息知识组织体系;[方法]以养生领域内的领域本体、文献信息等知识资源为基础,构建养生单元信息知识服务系统;[结果/结论]"养生单元信息知识服务系统"(以下简称"养生知识服务平台")是单元信息知识组织体系建设的重要应用示范,提供语义检索、知识浏览、知识推理和知识发现等服务,实现大数据环境下"单元信息知识组织体系"的有效利用;[局限]文献资源的单元信息抽取及分析涉及人工智能、计算机处理等相关技术,技术实现有较大难度。  相似文献   

12.
利用CiteSpace软件,梳理CNKI中相关文献,探究人工智能在国内图书情报领域的发文力量及主题演进、研究热点及未来趋势,并进行对比及可视化。结果表明相关研究数量持续增加,但尚未成熟,具有发文力量分散、主题联系紧密且交叉等特点。人工智能在国内图书情报领域的8类研究主题中,智慧图书馆、智能数据服务、知识工程等是研究热点及趋势。机器学习、知识图谱、语义网络等人工智能技术推动国内图书情报领域的发展。  相似文献   

13.
李叶叶  李贺  沈旺  曹阳  涂敏 《情报科学》2022,39(2):65-73
【目的/意义】随着网络购物的普及,在线评论成为影响消费者、销售者和生产者决策的重要数据。大数据 时代,在线评论呈现出多源异构、爆发式增长的特点,难以为用户的购买决策和商家竞争提供有力的情报支撑。【方 法/过程】本文利用多源异构的在线评论数据构建知识图谱,提出了一种基于多源异构数据构建知识图谱的框架, 模式层构建围绕在线评论的信源、内容以及形式构建,最终形成知识图谱的概念框架,并运用word2vec从多源异构 文本中获取实体、关系和属性,并进行数据融合与知识图谱分析。【结果/结论】实验部分以手机商品在线评论为例, 验证了本文所构建的知识图谱对在线评论相关研究及挖掘的有效性,研究结果揭示了多源异构在线评论数据的特 点,为大数据环境下在线评论信息组织、展示和挖掘提供了新的研究视角。【创新/局限】运用知识图谱对在线评论 进行描述,有效解决信息过载、多源异构信息融合等问题。本文采用半自动化的方式构建知识图谱,未来考虑引入 无监督的方法提高构建效率。  相似文献   

14.
[目的/意义]研究智能情报分析模式特点、发展方向及研究建设策略。[方法/过程]在分析神经网络、知识工程两类人工智能核心技术演变过程及发展趋势的基础上,提出支撑智能情报分析服务的大数据资源体系框架结构及建设原则,并分析数据驱动和知识驱动方法在情报分析中的单独应用与融合发展问题。[结果/结论]认为数据和知识双轮驱动是智能情报分析未来发展的一个方向;而实现智能情报分析的关键,一是加强一次数据资源和二次数据资源建设,二是加强深度学习技术与知识图谱技术在科技情报分析中应用的研究,三是建立数据驱动与知识驱动相融合的分析模式。  相似文献   

15.
张明宝  秦琪 《情报杂志》2022,41(2):29-34
[研究目的]将大数据技术引入构建服务于中小规模组织的情报系统时面临技术难度大、资源获取困难以及用户使用门槛高等困难。因此,提出一种大数据环境下基于分工协作的情报系统构建方法,该方法可以有效解决中小规模组织构建情报系统时所面临的这些问题。[研究方法]通过对基于第三方的大数据环境下情报系统构建的三层模型和基于分工协作构建大数据情报系统的典型场景的阐述,提供了一种初步的可行技术解决方案,最后对基于分工协作构建大数据环境下的情报系统所面临的管理困难进行了探讨。[研究结论]基于分工协作构建情报系统是大数据环境下情报学研究的一个重要方向,通过建立技术参考模型和典型应用场景可以为相关技术标准和实现方法的进一步确立提供参考。  相似文献   

16.
【目的/意义】我国自1979年开始以五年为一周期对全国学生进行体质健康检测,积累了丰富的数据。但长 期以来对这些数据资源的分析和利用严重不足,难以满足个性化健康服务的需求。如何利用体测大数据进行知识 组织与挖掘,实现个性化健康促进服务已经成为信息资源管理领域的重要问题。【方法/过程】提出了外部知识库增 强的多模异构体测案例知识组织方法,建立了基于灰色案例推理的健康知识推理架构和案例自适应知识更新机 制,以及“监(健康监测)—评(体质评估)—防(预防为主)—知(知识推荐)—保(健康保障)”的一体化闭环学生体质 健康促进知识服务方法。【结果/结论】该方法为学生健康体测大数据管理和主动健康服务提供了重要的知识工具 支撑。【创新/局限】创建了外部知识库增强的多模异构体测案例知识组织方法,提出了人机协同和群体智能的案例 学习机制;体测健康大数据知识服务的信息安全和用户隐私保护机制尚需进一步研究和构建。  相似文献   

17.
张雪  陈秀娟  张志强 《现代情报》2018,38(12):151-163
[目的/意义]梳理近年来国际上医学信息学研究动态和发展趋势,为科研人员提供相关的文献信息,为科研课题的选择及信息研究提供有力的依据,为我国未来医学信息学发展提供建议。[方法/过程]以Web of Science中10种医学信息学核心期刊近十年的文献为信息源,利用BICOMB、TDA、SPSS、UCINET等统计分析工具,并结合文献计量方法,对检索出来的文献数量、国家、机构、核心作者、关键词等进行统计并可视化分析。[结果/结论]2008-2017年Web of Science数据库中十种医学信息学核心期刊总收录相关文献11 823篇,文献量逐年持续增长,美国在该方面的研究处于领导地位,哈佛大学在该领域的研究产出占比最高,核心作者之间联系密切,形成一定规模的小团体。研究发现,近十年国际医学信息学研究重点体现在4个方面:卫生信息系统的开发与管理,卫生信息分析方法的对象与实际应用,人工智能、数据挖掘技术在临床诊疗中的应用与挑战及医学信息学新技术的应用与发展。  相似文献   

18.
科技情报大数据业务平台设计   总被引:1,自引:0,他引:1  
[目的/意义]本文分析了目前大数据时代科技情报工作面临的问题和机遇,针对情报服务领域大数据服务模式进行了分析。[方法/过程]该论文结合信息技术领域的虚拟化技术、云平台技术、高性能技术和人工智能技术,设计了科技情报大数据业务平台架构,详细阐述了硬件层、虚拟层、支撑层和业务层主要功能和所需技术;并对大数据处理首要任务存储进行了探索,搭建了基于hadoop和hbase的大数据存储平台。[结果/结论]本文提出的大数据情报业务平台从整体架构进行了设计,并实现了存储模块,下一步实现分析和可视化部门,可以为情报的收集和处理提供大数据支撑服务。  相似文献   

19.
[目的/意义] 提出一种基于在线产品评论的竞争情报挖掘框架,为企业改进产品设计和制定竞争策略提供参考。[方法/过程] 利用Word2vec技术构建产品特征词集合,识别用户评论主题特征。然后使用情感分析方法对评论文本进行分类,得到特征维度的评论情感。最后从产品主题特征和情感态度特征两方面进行数据分析,并以可视化结果呈现。[结果/结论] 以汽车行业的评论数据为例进行实验,结果表明该方法能够有效提取产品情报信息,帮助企业有效识别自身品牌及竞争对手的优势和劣势,为大数据环境下的竞争情报挖掘提供方法指导。  相似文献   

20.
【目的/意义】从学者的合作网络中进行社区发现及主题分布研究是具有十分重要的意义点。本文从社区 结构及其主题分布演化的角度分析并归纳情报学领域的研究现状和预测未来发展趋势。【方法/过程】本文通过构 建动态社区-主题模型,拟研究情报学文献中合著社区及其研究主题演变过程。【结果/结论】2000-2017年间,合著 网络社区演化呈现松散到聚合的趋势,在2012-2017年间基本形成三个大型的社区,每个社区的主题演化路径有不 同的模式:分裂融合模式、主干聚集模式和主干分解细化模式。不同社区的主题变化影响着社区演化路径。每个 社区的主题分布具有逐步多样化的特点,并且与数据挖掘、大数据分析、人工智能的研究日益紧密。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号