首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
[目的/意义]面向专利文本进行更细粒度的技术实体识别和技术预测,利于更详细地把握专利技术布局与趋势。[方法/过程]首先利用深度学习方法自动识别专利技术术语类实体,通过实验对比多组深度学习算法的优劣。其次,提出新的半监督标注和自定义标注方案,提高人工标注效率。最后,执行训练得到的最优模型,结合链路预测方法,对合成生物技术进行细粒度的技术预测。[结果/结论]实证结果表明RoBERTa-BiLSTM-CRF模型更适用于语义复杂的专利技术实体识别,F1值可达到86.8%,技术识别结果比传统IPC分析方法更精细。同时,细粒度的技术预测结果表明,合成生物学的合成方法在不断改进创新,合成物研究向合成燃料发展。  相似文献   

2.
[目的/意义] 针对本文作者为了对敦煌壁画图像蕴含的信息进行语义描述、揭示与标注而提出的层次性图像语义描述框架(SDFDI),采用内容分析法验证其合理性。[方法/过程] 以中国知网、维普数据库和万方数据库中的237篇敦煌壁画图像研究文献为样本,借助人工编码,统计非语义A类信息、基本语义B类和C类信息、复杂语义D类信息的分布情况以及其与SDFDI框架的匹配率。[结果/结论] 统计结果显示,在敦煌壁画研究文献中,这4类信息呈现正态分布,匹配率也说明SDFDI框架可以作为图像深度语义标注的参照基准。  相似文献   

3.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

4.
孙海生 《图书情报工作》2016,60(10):123-129
[目的/意义] 传统共词分析的聚类算法存在以下不足:①关键词只能被划归一个聚类;②聚类过程对分类数目的确定缺乏严格判断标准。针对以上问题,采用复杂网络理论进行改进研究。[方法/过程] 采用连边社团检测算法对关键词进行聚类,以科学计量学为例进行实证研究。[结果/结论] 分析结果表明:算法对关键词的聚类结果有较好的改进效果,能够把核心度高的关键词同时划分到不同的研究主题之中,克服传统聚类算法的不足,而且划分密度可为聚类数目的确定提供客观判断依据。  相似文献   

5.
[目的/意义] 针对SAO结构短文本分类时面临的语义特征短缺和领域知识不足问题,提出一种融合语义联想和BERT的SAO分类方法,以期提高短文本分类效果。[方法/过程] 以图情领域SAO短文本为数据源,首先设计了一种包含"扩展-重构-降噪"三环节的语义联想方案,即通过语义扩展和SAO重构延展SAO语义信息,通过语义降噪解决扩展后的噪声干扰问题;然后利用BERT模型对语义联想后的SAO短文本进行训练;最后在分类部分实现自动分类。[结果/结论] 在分别对比了不同联想值、学习率和分类器后,实验结果表明当联想值为10、学习率为4e-5时SAO短文本分类效果达到最优,平均F1值为0.852 2,与SVM、LSTM和单纯的BERT相比,F1值分别提高了0.103 1、0.153 8和0.140 5。  相似文献   

6.
[目的/意义] 在大数据时代面对海量的数据用户有时会束手无策。因此,越来越多的学者们开始关注互联网热点话题发现的算法,帮助用户快速获取热点话题。[方法/过程] 基于DBSCAN算法,通过动态调整参数来优化算法,实现热点话题发现。根据句法结构与句间关系分析构建热点话题过滤模型,过滤包含热点词项的一般话题。[结果/结论] 采用主流网站新闻数据集进行实验,利用错检率、漏检率等评价指标对算法的有效性进行检验,实验结果证明改进算法性能有所提升,能够为信息用户提供科学研究网络数据的高效途径。  相似文献   

7.
[目的/意义] 为简化已发表论文从文献数据库到机构知识库的数据转移过程,减少机构知识库建设人员工作量,开发一款基于机构知识库软件CSpace的浏览器存缴插件。[方法/过程] 基于JQuery技术和Chromium Extension机制,实现插件的网页信息提取、用户身份验证、专题和查重设置以及远程存缴/发布等功能。[结果/结论] 在浏览CNKI、CSCD以及WOS文献数据库时,可通过本插件快速提取网页中的文献元数据,并存缴至目标机构知识库。  相似文献   

8.
张晗  赵玉虹 《图书情报工作》2016,60(11):135-142
[目的/意义]针对共词分析存在的普遍问题,提出一种基于细粒度语义分析的共词网络构建与分析方法。[方法/过程]借助SemRep实现源文本主题概念及其语义关系的规范化抽取并由此构建语义共词网络,然后以节点的中心度和边的频次为指标对内容特征词进行抽取,利用UMLS语义网络规定的语义搭配模式,通过概念-语义类型-语义类型组的两级映射,对语义述谓项进行类团划分。[结果/结论]通过与常规共词分析方法比较,发现基于细粒度语义关系的共词分析能有效地揭示文本主题内容,利用UMLS语义网络资源能从语义学角度清晰准确地对语义共词网络进行类团划分。  相似文献   

9.
[目的/意义]探索设计并实施长期保存系统起源信息封装策略。[方法/过程]首先分析OAIS信息模型的详细组成,然后分析长期保存系统起源封装的特定服务需求,总结国际主流起源封装策略的基本特点,提出基于OAIS信息模型的起源信息封装策略,并利用Fedora仓储系统的内容模型FOXML进行封装实现。[结果/结论]该策略遵循OAIS及PREMIS标准,全面记录起源信息,具有灵活可扩展的特点,但同时管理和使用相对比较复杂。  相似文献   

10.
[目的/意义] 政府网络问政平台是政府部门知晓民意的重要途径之一,为提高问政留言分类的精度以及处理留言数据质量差、数量少等问题,对比多种基于BERT改进模型与文本增强技术结合的分类效果并探究其差异原因。[方法/过程] 设计网络问政留言分类集成对比模型,文本增强方面采用EDA技术与SimBERT文本增强技术进行对比实验,文本分类模型方面则采用多种基于BERT改进的预训练语言模型(如ALBERT、RoBERTa)进行对比实验。[结果/结论] 实验结果表明,基于RoBERTa与SimBERT文本增强的文本分类模型效果最佳,在测试集上的F1值高达92.05%,相比于未进行文本增强的BERT-base模型高出2.89%。同时,SimBERT文本增强后F1值相比未增强前平均提高0.61%。实验证明了基于RoBERTa与SimBERT文本增强模型能够有效提升多类别文本分类的效果,在解决同类问题时具有较强可借鉴性。  相似文献   

11.
科学数据语义描述研究述评   总被引:1,自引:0,他引:1  
周宇  廖思琴 《图书情报工作》2017,61(12):136-144
[目的/意义] 对国内外科学数据语义描述相关研究成果进行调研分析,归纳研究热点、研究特征和研究框架,总结研究中存在的不足,提出发展建议,为今后国内科学数据组织和服务提供参考和借鉴。[方法/过程] 从多个权威数据库采集国内外2007年1月至2016年12月发表的有关科学数据语义描述的期刊论文和学位论文,采用比较法和归纳法分析并揭示研究热点,并对相关研究成果进行述评。[结果/结论] 研究结果表明:①国内外科学数据语义描述研究很不均衡,主要研究成果集中在自然科学领域;②基于描述深度、加工层次和表现形式的分析维度更方便洞悉各种语义描述方法的本质特征和区别;③当前科学数据语义描述研究还存在不足,需要在描述对象选择、可视化检索、数据集成、知识发现等方面进行深入研究。  相似文献   

12.
[目的/意义] 针对现有弱信号全自动识别研究尚不完善的问题,提出基于LDA-BERT融合模型的弱信号全自动识别方法。[方法/过程] 基于无监督的LDA主题模型对文本数据集进行主题分类,构建主题和术语双层过滤函数从主题分类的结果中提取早期预警信号,通过紧密中心度、主题权重以及主题自相关性三大度量函数评价主题的弱性,并基于主题内术语的归一化频率和概率提取出弱信号。最后,运用BERT深度学习模型从语义层面对弱信号上下文及其类似词进行扩展。[结果/结论] 以2021年1月初疫情重爆发事件为例,使用爆发前三月的社交媒体新闻数据集对构建的系统模型进行验证。实验结果表明,该方法可有效检测出相关弱信号,并挖掘出弱信号随时间推移逐渐增强的演化特性。此外,该融合模型在实现弱信号全自动识别的同时,也表现出较单一模型更强的结果可解释能力。  相似文献   

13.
[目的 /意义]现有研究进行技术融合差异度测度时仅在分类号层面开展、尚未涉及到分类号背后的技术语义内涵层面,且泰对测度方法的效果进行对比,对此,本研究从揭示技术语义的角度进行技术融合差异度测度方法研究和效果比较研究,助力其方法论的完善.[方法/过程]表示学习技术能够利用海量先验知识计算研究对象的语义差异,因此,提出基于...  相似文献   

14.
[目的/意义] 研究建立长期保存系统起源管理框架,通过有效管理起源信息,确保长期保存系统所存档数据的真实可靠可用。[方法/过程] 基于数字对象保存周期进行起源事件定义,基于OAIS保存流程进行起源管理框架设计,以事件为核心进行起源管理功能模型和起源信息模型设计。[结果/结论] 初步完成基于事件的保存系统起源管理框架的设计,既遵循保存领域的相关标准,同时兼顾实践需求,对长期保存系统具有很好的普适性和可行性,但其在有效性和实用性方面还有待进一步验证。  相似文献   

15.
[目的/意义] 快速、准确地从突发网络舆情文本中识别事件。[方法/过程] 提出一种融合句法特征和句法相似度的网络舆情突发事件识别方法。结合句法特征提出面向事件的句法特征提取方法,利用事件语义标注和句法特征提取方法构造事件句法特征库,通过计算待测文本与句法库的句法相似度来识别网络舆情突发事件。[结果/结论] 以新型冠状病毒肺炎疫情为例,所提出网络舆情突发事件识别方法在该舆情下的最优相似度为0.93,在此相似度下从一段新的文本中识别出160个事件和30个非事件,F1值达到了0.848。通过方法测评证明网络舆情突发事件识别方法在利用句法相似度识别事件和进行相同相邻词性合并等方面创新的有效性。  相似文献   

16.
[目的/意义] 历史地图在人文历史研究中有举足轻重的地位,然而受制于图像的表现形式以及文字注释的不确定性,在实际参考使用中给研究者和负责标引归纳的收藏单位带来一定障碍和困难。[方法/过程] 从不同角度研究现有发展比较成熟的海外图书馆历史地图地理参照平台案例,分析其运营模式、技术应用等特征,并对比现有国内相关项目情况,归纳得出地理参照项目本土化发展的启示与建议。[结果/结论] 以上海图书馆历史地图馆藏为对象,探索适用于本土的地理参考平台模式,以期通过地理参照平台的构建,在进行历史文献数字化的同时,提升文献使用体验及效率。  相似文献   

17.
[目的/意义]针对当前我国高校机构知识库研究与应用离真正的开放互连、知识集成、知识检索还有较大差距的问题,提出一种面向关联数据的机构知识库构建方法,该方法覆盖机构知识库构建的整个过程,并支持机构知识的资源整合、语义检索、知识推理和关联数据发布,为各高校机构知识库建设提供参考。[方法/过程]调研和剖析国内外典型的机构知识库,将机构知识库构建方法分为5个步骤,包括:①评价和选择有价值的信息资源;②建立机构知识库概念模型;③进行语义描述和关联设置;④发现并创建关联化数据环境下的语义推理规则;⑤设计系统架构,并通过西南科技大学机构知识库构建实例来验证该方法的有效性。[结果/结论]实例验证表明,面向关联数据的机构知识库构建方法具有合理性和有效性,起到了降低机构知识库开发难度和缩短开发周期的作用,对于其他机构知识库的建设具有参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号