首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 15 毫秒
1.
谭荧  唐亦非 《情报科学》2020,38(4):23-27
【目的/意义】将知识抽取的粒度细化到知识构成的最小单元--知识元,能提高知识获取的效率和精准度。【方法/过程】本文利用命名实体识别和事件抽取技术,探索了在科学文献中自动抽取事实知识元的方法。【结果/结论】实验结果表明,该方法能有效识别科学文献中的事实知识元,自动抽取效果出色。  相似文献   

2.
【目的/意义】基于知识元挖掘科技文献中的科学知识,建立科学知识之间的联系,构建细粒度知识图谱,旨 在打通知识之间的壁垒,满足用户细粒度的知识需求。【方法/过程】首先,本文构建基于图的知识元表示框架,并以 知识元为核心构建细粒度知识组织模型;其次,设计面向科技文献知识元的知识图谱,并探究知识图谱构建流程, 以实现知识图谱的自动化构建;最后以科技文献中的摘要和引言为实验数据,进行实证研究,构建面向科技文献知 识元的知识图谱。【结果/结论】本文所构建的知识图谱不仅能直观地展现学术论文所需要探究的问题、所提出的方 法和模型等,还能够揭示科学知识之间的内在关联。【创新/局限】本文探究了细粒度知识组织模型,构建了面向科 技文献知识元的知识图谱。在未来的研究中,将不断完善知识图谱构建流程,并探索知识图谱的应用领域。  相似文献   

3.
彭玉芳  陈将浩 《情报科学》2022,39(1):141-147
【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科 研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度 学习方法从大量的学术文献中抽取目标数据。其次使用NER和TF-IDF抽取目标数据的“5W”规则,接着对目标 数据做第二层需求规则过滤,凡是满足“5W”规则的数据,被鉴定为目标数据。最后对目标数据做第三层人工校 验,最终生成学术文献“目标数据”。【结果/结论】本文构建的学术文献“目标数据”抽取模型的准确率可达0.88,再融 合“5W”规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献 数据库机构的检索工作。【创新/局限】深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息 层面到进入学术文献内容的数据层面。  相似文献   

4.
【目的/意义】论文学术价值识别是科技成果评价的重要内容,利用论文内容贡献度和加权平均被引量指标 能够实现论文学术价值的早期识别,推动科技成果价值的早发现早实现。【方法/过程】本文首先基于模式匹配和共 现分析方法抽取了论文问题知识元关系和方法知识元关系;其次按照问题与方法知识元关系进行检索,构建问题 与方法相关文献集;然后基于相关文献集提出论文学术价值指标计算方法,并通过归一化贡献度-加权平均被引量 矩阵,实现了论文学术价值早期识别;最后采用图书情报领域期刊论文数据进行了实验研究。【结果/结论】实验结 果表明,本文提出的方法能够实现论文学术价值的早期识别,有利于推进高质量、高水平科技成果的推广与应用。 【创新/局限】后续研究将把更多论文知识元纳入计算,进一步提高论文学术价值早期识别效果。  相似文献   

5.
【目的/意义】文物图像资源日益成为数字人文基础设施建设的重要内容,为了克服存在于图像资源内容与 形式上的“语义鸿沟”对其开发利用产生的消极影响,有必要面向文物图像资源底层视觉特征与高层语义特征的精 细化映射与细粒度知识表示进行相关研究。【方法/过程】本文在分析文物图像资源知识表示需求与表示策略的基 础上,提出了基于知识元构造的文物图像资源细粒度知识表示模型。在模型设计的基础上,以著名绘画文物《历代 帝王图卷》为例,阐述了面向文物图像资源细粒度表示需求进行知识元提取、构造与数据发布的具体流程。【结果/ 结论】实验结果表明,本文提出的基于知识元的文物图像资源细粒度知识表示方法能够在图像底层视觉特征与高 层语义特征之间建立有效的语义映射关系,并通过与外部知识库的数据关联实现与开放关联数据网络的深度融 合。【创新/局限】本文从知识元角度出发,提出了文物图像资源的细粒度知识表示方法,在未来的研究中还需对文 物图像知识元的自动提取以及基于知识元的图像资源知识发现方法进行更深入地探索。  相似文献   

6.
周萌  陈果 《情报科学》2019,37(3):81-87
【目的/意义】传统共现分析方法应用于文本挖掘时,因关系粒度过粗导致难以有效利用文本内容中的语义 关系。本文以武器装备简氏文本为例,提出基于文本内容的细粒度关系抽取和可视化分析方法。【方法/过程】首 先,对原始简氏文本进行解析以提取武器装备名称,然后进行共现句子的提取,再扫描这些共现句子中的高频动名 词作为候选特征词;随后结合领域专家给出的武器装备细粒度关系词并根据在线同义词典进行特征词的归类和扩 展,以确立武器装备细粒度共现关系类型(包括替换、升级改造、配备安装、相似四种)和相应的特征词,并构建具有 多种类型边的武器装备细粒度共现网络。【结果/结论】最后,对该网络进行可视化分析,包括:按边类型划分子网 络、以节点为中心的武器多维关联分析和武器装备演化分析。细粒度共现网络的构建和分析有助于更全面、具体 地揭示该领域的整体、微观知识结构和知识演化情况。  相似文献   

7.
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。  相似文献   

8.
【目的/意义】从海量论文元数据中抽取算法术语并构建它们之间的创新演化关系,有利于对算法的有效管 理和运用,以帮助科研工作者提升研究效率、采纳前沿成果。【方法/过程】首先,以GAN算法论文摘要为语料,通过 人工标注与规则抽取相结合的方式进行算法术语标注,并利用BERT-BiLSTM-CRF模型实现算法术语的自动抽 取。然后,将建立的模型应用于LDA算法论文的被引文献元数据中抽取算法术语,依据规则判断和引文关系,从被 引内容中抽取LDA算法的创新演化路径并构建。【结果/结论】以GAN论文为实例的算法术语实验中,精确率、召回 率与F1分数分别达到了0.81、0.63与0.71,并应用关系抽取方法成功构建了LDA算法的创新演化路径,该方法可以 有效推动算法进化网络构建和算法检索与追踪等方面的工作,丰富创新扩散理论的相关研究。【创新/局限】拓展了 命名实体识别技术的应用领域,为计算机算法管理提供了良好的思路。后续可优化创新演化路径的构建方法。  相似文献   

9.
戎军涛 《情报科学》2019,37(7):30-35
【目的/意义】解决人类知识资源利用的办法是将知识的控制单位由“文献”深化到“知识元”,这被认为是图 书情报学研究取得突破的关键问题。【方法/过程】我们在分析知识元本质、形态的基础上,提出了知识元的语义结 构由知识项、知识资源和属性函数三部分构成。在此基础上我们从内容表达层、语义关联层和文献载体层三个维 度构建了知识元的语义模型,对模型各个要素进行了规范化说明,并给出了语义标注实例。【结果/结论】研究表明, 该模型具有层次性,结构较为合理,语义效果显著,有利于语义揭示深入到知识单元,为细粒度的知识组织与发现 提供了新的视角。  相似文献   

10.
廖建军 《情报科学》2018,36(7):123-129
【目的/意义】为给数字出版知识服务系统提供高质量的文本语料以供知识抽取,本文提出了基于标签样式 和密度模型来抽取网页正文的方法。【方法/过程】该方法先根据标签样式将网页文本进行分块,再根据各块文本内 容的文本密度、标点密度、非超链接密度计算出综合密度,最后通过阈值判断抽取出网页中信息含量高的正文。【结 果/结论】该方法简单高效无需人工编写规则或训练,能完整地抽取出网页正文。通过随机选取新闻网页进行实 验,结果表明该方法能有效地自动抽取网页正文,适用于不同设计风格的网站,而且准确率和召回率优于基于统计 的 CEPR抽取方法。  相似文献   

11.
田亚丹 《情报科学》2021,39(6):123-133
【目的/意义】针对现有主题演化方法难以满足预测目的的需求,本文从知识动态发展的角度出发,构建知 识主题演化预测模型,为探究科学领域发展脉络与研究趋势提供方法。【方法/过程】通过Lda模型抽取知识主题,利 用马尔可夫和隐马尔可夫构建主题稳态与主题热度的演化预测模型。【结果/结论】以云计算领域的科学文献作为 实证分析对象,结果表明本模型可以根据历史数据来预测知识主题稳态分布情况与未来热度趋势,且在热度预测 精度上较灰色模型更高。【创新/局限】本文只考虑了横向主题内部的热度高低变化,没有进行纵向维度上各知识主 题间的对比。  相似文献   

12.
王颖  于改红  谢靖 《情报科学》2021,39(8):67-77
【目的/意义】通过对学术资源进行深度挖掘与语义化组织,实现学术资源及其内部知识之间的关联发现。 【方法/过程】本文提出基于全文知识网络的学术资源关联发现方法,设计了全文知识网络的模型和构建流程,以 Pubmed Central数据库中拟南芥(Arabidopsis)相关的520篇期刊论文全文数据为实验对象,通过全文解析和挖掘将 其分解为细粒度的知识,形成全文知识网络。然后利用SPARQL查询和RelFinder可视化工具从数字资源层、知识 单元层和知识对象层三个层次开展关联发现实验。【结果/结论】本文构建全文知识网络对学术资源进行细粒度组 织和挖掘,有助于发现不同学术资源及其内部知识之间的潜在关联,对学术资源的深度利用具有重要的意义。【创 新/局限】本文创新之处在于通过构建全文知识网络对学术资源进行细粒度揭示和组织并进一步发现潜在关联,局 限在于尚未开展大规模应用实践。  相似文献   

13.
辛本禄  穆思宇 《情报科学》2023,41(1):174-181
【目的/意义】为适应大数据时代知识创新的需要,在动态服务创新能力视域下探究大数据驱动下的企业知 识创新实现路径。【方法/过程】首先对数据、信息与知识之间的关系进行分析,然后探究动态服务创新能力的5个维 度对企业的大数据驱动下的知识创新各个阶段的影响以及在实现知识创新路径中的作用。【结果/结论】企业通过 大数据驱动和动态服务创新能力构建知识创新资源库、提出知识创新方案,从而实现知识创新。【创新/局限】将大 数据驱动与动态服务创新视角同时融入知识管理研究;不足之处在于仅在理论上探讨了企业知识创新实现路径。  相似文献   

14.
宋建欣  崔立伟 《情报科学》2022,40(11):26-32
【目的/意义】利用新一代数字技术创新基层党建工作,有效推动大数据时代科技力量与执政力量的有机结 合,全面提升基层党组织服务和管理的效能。【方法/过程】依据理论与实践相结合的研究方法,对基层党建呈现的 由传统向信息化再向数字化转变的发展趋势进行总结,深刻剖析出党在基层数字化建设的核心影响因素,进而构 建出基层数字党建的科学体系。【结果/结论】在分析大数据时代基层党建数字化发展现状的基础上,检视出统筹管 理能力、投入保障力度、数字技术条件以及思维认知水平是影响基层党建数字化发展的核心要素。【创新/局限】以 影响因素为主要考量,从顶层设计、投入机制、服务平台以及运行体系四个维度建构了较为系统、立体的基层党建 数字化体系,用以推进党在基层的数字化发展进程。但囿于数据样本不够充足,本研究尚存细化的空间。  相似文献   

15.
【目的/意义】对影响科研人员间科研合作意愿的因素及其机理进行探讨,有助于更好地了解科研工作者们 的合作现状,促进科研合作的顺利实现。【方法/过程】运用文本分析提取出13个影响因素,并使用专家评分法选出6 个前因变量,分别是社会报酬因素、合作氛围因素、地域因素、技术因素、科研产出能力因素以及学术与人际网络因 素;然后通过发放调查问卷收集数据,最后运用模糊集定性比较分析方法,按照一定的流程探究了科研人员间科研 合作意愿影响因素的组态。【结果/结论】通过fsQCA软件测算,结果表明,并不存在单一的核心条件来促使科研人 员合作,而是由多种条件要素共同作用产生的,并形成由前因变量构成的3种影响结果变量的组态,分别是以人际 网络驱动型、社会报酬驱动型、科研产出能力及合作氛围驱动型为主导的组态。【创新/局限】明确了科研人员间科 研合作意愿并不受单一因素的影响,并确定了核心因素;但因受问卷量的限制,可能导致“有限多样性”问题。  相似文献   

16.
【目的/意义】深度学习是近几年来人工智能领域的研究热点之一,了解深度学习在信息组织与检索方面的研究现状,能为信息组织与检索的深入研究提供参考和借鉴。【方法/内容】通过对国内基于深度学习的信息组织与检索方向的相关文献进行梳理,剖析深度学习相关模型、阐述深度学习在信息组织与检索中的研究热点主题,并结合深度学习技术的特点和信息组织与检索的研究内容,对深度学习在信息组织与检索方向的应用前景进行预测。【结果/结论】研究表明,当前深度学习在信息组织与检索中的研究热点主要集中在智能信息抽取、自动文本分类、情感分析和文本聚类这四个主题,预测未来深度学习在信息组织与检索方向会朝着对异构信息处理、智能信息检索、个性化信息推荐等方向发展。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号