期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈金菊欧石燕《图书情报工作》2018,62(6):116-124

[目的/意义]图像语义标注的基础是图像语义标注模型的构建,对当前主流图像语义标注模型进行梳理和总结,剖析其在图像语义标注中的优缺点,可为后续相关研究提供借鉴和参考。[方法/过程]采用文献调研法,总结出4类主要的图像语义标注模型,即Eakins模型、Jaimes&Chang模型、Kong模型、Panofsky模型。其后采用比较法和归纳法,从语义层次、可扩展性以及应用范围和方式3个方面对前三类模型进行比较分析。[结果/结论]Eakins模型语义层次最全面,语义表达能力最强,应用范围最广;Kong模型的可扩展性最强,适应性最好。相似文献

2.

智能搜索引擎关键技术及应用研究

刘耀郑德举潘希阳黄毅《图书情报工作》2015,59(5):113-118

[目的/意义]技术创新服务平台的建设中需要智能搜索引擎技术,智能搜索引擎技术的内涵或者说重点在于自动语义标注.技术创新服务平台上对搜索引擎的要求,与大众的搜索引擎的需求还是不同的,处理的对象主要是专业领域的文本,通过语义标注技术,能快速对企业文档进行语义化和结构化组织,从而为企业提供精准的知识服务.[方法/过程]针对专业领域语义标注的相关问题,在进行深入研究与探讨的基础上,将语义标注理解为是对一组文档资源进行组织语义化的过程,提出利用结构化语义概念资源或集合对数字化文本进行自动标引的方法,并根据概念实体出现频次、位置和关系等因素,自动抽取相关语义概念集合,实现相关文本的语义内容的自动标注.[结果/结论]评价语义标注相关实验的效果,展示语义标注的具体应用场景.同时,体现领域本体与语义标注语料不断更新、进化、形成互动的过程,旨在为专业领域的语义自动标注及智能搜索引擎的构建提供有益的参考. 相似文献

3.

面向科技文献的混合语义信息抽取方法研究 总被引：1，自引：0，他引：1

冷伏海白如江祝清松《图书情报工作》2013,57(11):112-119

针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。相似文献

4.

基于LDA的科技创新主题语义识别研究

祝娜王效岳杨京白如江《图书情报工作》2015,59(14):126-134

[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。相似文献

5.

基于条件随机场的学术期刊中理论的自动识别方法

陈锋翟羽佳王芳《图书情报工作》2016,60(2):122-128

[目的/意义]从学术期刊中抽取其中的理论是对文献进行内容分析的前提,实现理论名称识别的自动化可以提高内容分析的效率。[方法/过程]将理论识别视为一类命名实体识别问题,总结现有的命名实体识别的常用方法,提出一个基于语义泛化思想的命名实体识别方法,选取词性、知网义原等外部知识,采用CRF模型对《情报学报》1822篇论文的标题和摘要进行实验。[结果/结论]实验表明,识别准确率最高达到95.38%,但召回率较低;训练语料规模对性能影响较大,不同程度的语义泛化方法对准确率和召回率有复杂影响。如何选择语义特征、语义标注和语义消歧是需要解决的新问题。相似文献

6.

一种基于序列标注的概念短语抽取方法

李雪思张智雄刘欢《图书情报工作》2022,66(11):121-128

［目的/意义］ 科技文献中的概念是对文献中知识高度凝练的表达,通常以定义句的形式出现在科技文献中。自动从概念定义句中抽取概念,能够进一步挖掘科技文献中蕴含的重要知识。［方法/过程］ 通过分析概念定义句的结构、句式等模式特征,提出以WCL数据集为基础的语料构建方案,并采用BERT+BiLSTM+CRF模型学习概念定义句的模式,从而实现概念短语抽取。［结果/结论］ 结合以往对概念定义句模式特征的研究,创新性地提出一种基于序列标注学习概念定义句的组成模式,从而实现概念短语抽取。通过BERT+BiLSTM+CRF模型,有效学习了概念定义句中的上下文语义、句式结构、组成项分布等模式特征,实现了句子中概念短语的抽取。相似文献

7.

基于多特征知识的先秦典籍词性自动标注研究

王东波黄水清何琳《图书情报工作》2017,61(12):64-70

[目的/意义] 先秦典籍在古代典籍中的地位极为重要。本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识。[方法/过程] 通过条件随机场模型,结合统计方法确定组合特征模板,并最终得到针对先秦典籍的词性自动标注算法模型。[结果/结论] 在先秦典籍自动分词的整个流程基础上,得到简单特征模板、组合特征模板下的词性自动标注模型,基于组合特征模板的词性标注模型调和平均值F达到94.79%,具有较强的推广和应用价值。在构建词性自动标注模型的过程中,通过融入字词结构、词语拼音和字词长度的特征知识,使得模型的精确率和召回率得到有效提升。相似文献

8.

基于语义角色标注的专利主题提取研究

孟令恩李颖何彦青屈鹏王惠临《图书情报工作》2014,58(19):19-24

主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值。相似文献

9.

敦煌壁画图像语义描述层次模型实证研究

王晓光江彦彧张璐《图书情报工作》2015,59(19):122-129

[目的/意义] 针对本文作者为了对敦煌壁画图像蕴含的信息进行语义描述、揭示与标注而提出的层次性图像语义描述框架(SDFDI),采用内容分析法验证其合理性。[方法/过程] 以中国知网、维普数据库和万方数据库中的237篇敦煌壁画图像研究文献为样本,借助人工编码,统计非语义A类信息、基本语义B类和C类信息、复杂语义D类信息的分布情况以及其与SDFDI框架的匹配率。[结果/结论] 统计结果显示,在敦煌壁画研究文献中,这4类信息呈现正态分布,匹配率也说明SDFDI框架可以作为图像深度语义标注的参照基准。相似文献

10.

基于深度学习的数据科学招聘实体自动抽取及分析研究

王东波胡昊天周鑫朱丹浩《图书情报工作》2018,62(13):64-73

[目的/意义]数据科学作为一个融合诸多领域的新兴交叉学科正在快速形成。从数据科学招聘的公告信息中,抽取出相应的实体知识不仅有助于从市场的角度了解数据科学的发展动态,而且有助于改进数据科学教学的内容。[方法/过程]基于各大招聘网站职位招聘公告,结合情报学的数据获取、标注和组织方法,构建数据科学招聘语料库并从中抽取相应的实体进行分析与研究。[结果/结论]在搜集到的11 000篇经过标注的职位招聘公告语料的基础上,基于Bi-LSTM-CRF、CRF和Bi-LSTM模型,对数据科学招聘实体的抽取任务进行性能的对比,确定最终的数据科学招聘实体自动抽取模型,设计数据科学招聘实体自动抽取平台,并构建数据科学招聘实体网络。相似文献

11.

科学数据语义描述研究述评 总被引：1，自引：0，他引：1

周宇廖思琴《图书情报工作》2017,61(12):136-144

[目的/意义] 对国内外科学数据语义描述相关研究成果进行调研分析,归纳研究热点、研究特征和研究框架,总结研究中存在的不足,提出发展建议,为今后国内科学数据组织和服务提供参考和借鉴。[方法/过程] 从多个权威数据库采集国内外2007年1月至2016年12月发表的有关科学数据语义描述的期刊论文和学位论文,采用比较法和归纳法分析并揭示研究热点,并对相关研究成果进行述评。[结果/结论] 研究结果表明：①国内外科学数据语义描述研究很不均衡,主要研究成果集中在自然科学领域;②基于描述深度、加工层次和表现形式的分析维度更方便洞悉各种语义描述方法的本质特征和区别;③当前科学数据语义描述研究还存在不足,需要在描述对象选择、可视化检索、数据集成、知识发现等方面进行深入研究。相似文献

12.

项目申请书摘要文本的语步识别语料构建

赵旸张智雄李婕《图书情报工作》2022,66(21):97-106

[目的/意义] 自动识别项目申请书摘要中的科学要素,对于揭示科技项目中的科学知识具有重要的研究意义。这些科学要素的识别依赖于结构化项目摘要文本,然而目前结构化项目摘要语料资源匮乏,严重制约着相关研究的进一步发展。拟构建项目申请书摘要文本的语步语料集,为相关研究提供数据支撑。[方法/过程] 首先将项目摘要内容归纳为背景及问题、目标及任务、方法内容、价值意义4种语步类型,总结每个语步结构中出现的标志性特征并制定语步标注规范;其次相继利用基于规则和基于深度学习的方法辅助人工进行项目摘要的语步结构标注,并对每轮标注后的语料进行质量评估。[结果/结论] 两种方法共计标注近25 000条语句,语料标注的一致性系数达到0.983 9,表明该语料集基本能够区分项目摘要内的不同语步结构,初步达到了语料库建设的基本要求。相似文献

13.

基于内容分析的数字人文领域中知识组织价值体现研究综述

司莉郭财强《图书情报工作》2022,66(13):127-137

[目的/意义]对知识组织方法与技术在数字人文领域的应用情况进行系统梳理,以更好地把握其实际应用特点,明确数字人文领域知识组织的价值,并为后续相关研究与实践提供借鉴。[方法/过程]采用文献调研法获取国内外数字人文领域相关研究文献,并基于内容分析法对其进行深入分析。[结果/结论]研究发现:元数据、本体、语义标注、关联数据等知识组织方法与技术贯穿数字人文的始终,是数字人文的有机组成部分;知识组织可为数字人文资源的组织提供解决方案与方法工具,为人们观察文化现象历史演化提供新视角,赋予人们获取新知识、发现新问题的能力;知识组织在数字人文领域发挥了方法价值和中介价值,为数字人文领域资源的组织与利用提供方法工具,充当用户与数字人文领域资源之间的桥梁。相似文献

14.

科学论文语义增强的研究进展与趋势研判

宋宁远裴雷王春迎《图书情报工作》2021,65(1):82-90

[目的/意义] 随着科学交流体系向电子媒介迁移,传统的科学论文内容组织及呈现方式带来了诸多弊端。科学论文语义增强能够创新科学论文内容的组织与呈现方式,是解决这些问题的关键,得到了来自科研机构与学术出版商的重视,形成了一系列理论与实践成果。对这些成果进行梳理、归纳,发现其中的优势与不足,能够为后续推动科学论文语义增强的进一步发展起到指导作用。[方法/过程] 从语义增强的概念入手,着重分析科学论文语义增强的核心目标、实现路径与关键问题,随后,梳理对科学论文中正文本与副文本内容进行语义增强的理论与实践成果,并围绕科学论文语义增强路径上的三个阶段：语义标注、语义组织与可视化呈现进行对比分析。[结果/结论] 研究进一步归纳总结现阶段科学论文语义增强的特点,并对科学论文语义增强的未来发展及研究提出4点意见。相似文献

15.

面向中国专利文献的零形回指消解规则研究

靳玮乔晓东刘耀齐晓亚《图书情报工作》2015,59(9):73

[目的/意义]面对海量专利文献,如何使用户快速、精准地掌握知识,是优化专利服务的关键课题.中文专利文献中大量存在的零形回指现象,严重影响了知识的自动识别与提取,但由于专利文献零形回指识别与消解涉及到众多文本分析技术及特定资源建设,因此,目前尚未发现针对性研究.[方法/过程]在物性结构理论、语义角色及修辞结构关系理论的指导下,展开相关规则的研究,开发句法及语义角色标注工具和篇章标注工具两种工具,并构建了4个资源库:①"专利动词物性角色库",将专利的动词归纳为4类;②"专利知识论元结构库",用于自动标注专利动词物性角色及其论元结构;③"专利动词论元结构规则库",用于分析零形回指的先行语;④"零形回指修辞结构类型库",用于分析当零形回指搭配"功能角色"和"部件角色"的情况.[结果/结论]通过资源库的建设,得出5条消解规则.初步成果已成功应用于机械领域专利文献的自动处理工作. 相似文献

16.

基于SKOS的学术期刊文本资源多粒度语义标注方法研究

夏立新郑路张玉晨翟姗姗孙晶琼《图书情报工作》2018,62(9):123-133

[目的/意义] 针对学术期刊文本资源语义标注仍存在的通用本体难以构建、标注粒度单一两大问题,提出基于SKOS的学术期刊多粒度语义标注方法,从而进一步推进语义标注的应用发展,更好满足用户的多粒度学术信息需求。[方法/过程] 在对《中国汉语主题词表》进行SKOS描述的基础上,以学术期刊文本资源为对象,实现其多粒度语义标注,并通过实证研究验证该方法的可行性。[结果/结论] 利用SKOS实现对学术期刊文本资源进行多粒度语义标注,较之当前学术检索系统中的标注结果,在"查全"查准"内部特征检索入口"检索结果反馈形式"4个方面具有一定优势。相似文献