首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
[目的/意义] 采用hLDA从专利语料库中抽取层次主题,以描述隐藏在专利文本中的技术结构,并基于层次主题随时间变化情况进行技术演化分析。[方法/过程] 从专利术语中获取闭频繁项集,并基于此建立关联规则网络来度量术语的重要性和术语间语义关系强弱,进而对语料库进行重构,并对不同时间片段的专利集合进行层次主题结构抽取。[结果/结论] 将本方法应用于硬盘驱动器磁头领域的专利数据分析,实证结果表明该方法是一种可行和有效的技术演化分析方法。  相似文献   

2.
中文叙词表的语义化转换   总被引:1,自引:0,他引:1  
欧石燕 《图书情报工作》2015,59(16):110-118
[目的/意义]随着语义网与关联数据的兴起与发展,采用SKOS语言对叙词表进行语义化描述成为主流,这为叙词表在网络上的发布、共享以及在网络环境下的应用提供新的契机。[方法/过程]以《汉语主题词表》为例,对中文叙词表的语义化表示、验证和关联数据发布进行探索。首先,制定基于SKOS、SKOS-XL和SKOS扩展的叙词表语义化表示方案, 实现对叙词表的无损语义描述, 开发基于N-Triples格式的词表语义化转换程序, 使大规模词表的语义化转换更加简单高效;其次,采用新兴的SPIN框架对语义化词表的完整性进行验证, 为SKOS词表的正确性与合法性提供保证;最后,采用“Jena TDB+Fuseki+Pubby”的组合将SKOS/RDF词表数据在网络上发布为关联数据,并开发词表关联数据检索界面。[结果/结论]实验结果表明,采用本文的方法能够实现整个《汉语主题词表》的高效语义化转换、验证与发布,促进中文叙词表在网络上的共享与应用。  相似文献   

3.
叙词表中词间关系分为等同关系(EquivaLence Relationship)、等级关系(Hierarchical Relationship)和相关关系(Associative Relationship),词间关系的控制是叙词表编制的关键技术,文章主要针对叙词表词间的等级关系和相关关系,比较国际标准ISO2788、中国标准GB13190—91以及关国标准NISO Z39.19—2005对其的规定,分析异同,总结联系,从三个标准的实用性、检索效率等方面予以分析,并为中国叙词表编制标准提出改进建议。  相似文献   

4.
[目的/意义] 叙词表相关关系在标引和检索中具有重要作用,相关关系的分类与关系属性定义在信息组织中有重要研究意义。[方法/过程] 分析生态学种间关系与叙词表相关关系的特征,建立二者的联系,通过不同特征的组合实现相关关系到种间关系的分类,并从种间关系角度探讨相关关系的构建。[结果/结论] 相关关系可以唯一地分类到捕食、竞争、寄生、共生四类种间关系中,不同类别相关关系具有不同的特征,能够为相关关系的构建提供新的思路。  相似文献   

5.
熊霞  常春 《图书情报工作》2010,54(12):50-108
通过调查总结叙词表在文献数据库中的应用现状,在此基础上设计一个基于叙词表的文献数据库知识单元检索系统。该系统首先将数据库中的文献分解为知识单元,检索时用叙词表中的正式叙词对用户输入的检索词进行规范化处理,并将该正式叙词作为中心词,利用叙词表中的词间关系查找出该词的等同词、上下位词和相关词作为扩展检索词,对知识单元进行加权检索,按权值之和以及检索词的密集程度排序输出。经实例分析,具有可行性。  相似文献   

6.
[目的/意义] 针对虚拟品牌社区顾客信息获取和价值共创问题,探讨顾客在虚拟品牌社区中多种信息获取对社区价值共创的影响机理,可提出管理启示,为虚拟品牌社区信息管理提供参考。[方法/过程] 结合价值共创和品牌关系相关理论,引入描述社区关系质量状况的3个维度要素,建立虚拟品牌社区顾客信息获取对价值共创影响的分析框架,并对各因素间影响机理进行详细分析。[结果/结论] 在虚拟品牌社区中,顾客企业信息获取、引导信息获取和关系信息获取,能够积极影响其社区沉浸、社区依恋和社区互动状态,有利于改善社区中顾客-社区之间的关系质量,进而促进虚拟品牌社区价值共创行为的产生。  相似文献   

7.
雷晓  常春  刘伟 《图书情报工作》2019,63(20):121-128
[目的/意义]为增强叙词表实用性,需要不断地将领域中出现的新术语更新到叙词表中,更新维护过程中,从时间及词频等角度对新术语分布特征进行探索研究,可以为新术语发现方法提供参考。[方法/过程]基于新术语相关特征,结合对应文档频率在时间点和时间段上的发展分布,通过相关统计分析,研究术语在不同成长时期的分布特征,尤其界定术语在开始期与成长期的分布差异。[结果/结论]实证分析表明新术语一般处于术语发展的成长期,当候选新术语保持正向增长趋势超过一定年限,可以认为该术语同时具有新颖性、时间持续性及术语性特征。基于该分布特征进行领域新术语的识别,结合词表编制专家的判断,该方法在新术语收录判断中具有较高的准确率,且能有效识别实际应用中占比较多的低频词。  相似文献   

8.
叙词表已有的参照系统及几种图形显示形式在网络环境中显然不能动态地、全面地显示词间关系,不便于浏览和检索。在分析本体编辑工具Protg实现叙词表可视化的必要性基础上,以《汉语主题词表》为例,利用Protg的可视化插件TGVizTab,进行叙词表等同关系、等级关系和相关关系的可视化实验,并讨论了整部关系和例举关系的可视化。  相似文献   

9.
网络环境中汉语叙词表的自动构建研究   总被引:2,自引:0,他引:2  
为解决网络信息检索效率低的问题,需要把叙词表等控制机制引入到网络检索系统中,但传统词表编制方式已经不能满足网络信息检索的需要.本文制定了一种汉语叙词表自动构建方案,以财税领域为例,采用模式识别、词聚类、同现分析等自然语言处理技术实现自动识别词间等同关系、等级关系和相关关系,从而构建一部财税领域叙词表,最后对所构建的叙词表进行测评.相比传统叙词表编制方法,自动构建叙词表能降低编表专家的智力负担,而且编表时间短,费用低,时效性强,符合普通用户的检索习惯.但对词间关系的识别不如人工编表时精当可靠,所以需要人工辅助判定.  相似文献   

10.
[目的/意义] 在大数据时代面对海量的数据用户有时会束手无策。因此,越来越多的学者们开始关注互联网热点话题发现的算法,帮助用户快速获取热点话题。[方法/过程] 基于DBSCAN算法,通过动态调整参数来优化算法,实现热点话题发现。根据句法结构与句间关系分析构建热点话题过滤模型,过滤包含热点词项的一般话题。[结果/结论] 采用主流网站新闻数据集进行实验,利用错检率、漏检率等评价指标对算法的有效性进行检验,实验结果证明改进算法性能有所提升,能够为信息用户提供科学研究网络数据的高效途径。  相似文献   

11.
[目的/意义] 提出三重耦合概念,以期通过改变传统耦合的作者频次计算方法,改进因偶然因素产生的过耦合现象,提高领域知识谱图绘制的准确度。[方法/过程] 将原始矩阵构建从二重耦合计数改进为三重耦合计数,转化为相关矩阵后,对三维矩阵进行降维处理,通过Gephi软件绘制科学知识图谱并进行数据揭示与分析。[结果/结论] 实证研究结果显示,三重耦合一方面保留了二重耦合的领域分析能力,另一方面提高了聚类结果的准确性,更为有效地进行作者可视化分析,有利于领域图谱绘制和子领域发现,挖掘出科学共同体的更多细节。  相似文献   

12.
[目的/意义] 科技文献中的概念是对文献中知识高度凝练的表达,通常以定义句的形式出现在科技文献中。自动从概念定义句中抽取概念,能够进一步挖掘科技文献中蕴含的重要知识。[方法/过程] 通过分析概念定义句的结构、句式等模式特征,提出以WCL数据集为基础的语料构建方案,并采用BERT+BiLSTM+CRF模型学习概念定义句的模式,从而实现概念短语抽取。[结果/结论] 结合以往对概念定义句模式特征的研究,创新性地提出一种基于序列标注学习概念定义句的组成模式,从而实现概念短语抽取。通过BERT+BiLSTM+CRF模型,有效学习了概念定义句中的上下文语义、句式结构、组成项分布等模式特征,实现了句子中概念短语的抽取。  相似文献   

13.
[目的/意义] 什么是情报?什么是智库?它们的区别与联系是什么?这些问题看似简单但又常常令人倍感困惑,本文力图从基本概念、基本研究对象、基本指导理论和基本方法论体系入手,对二者之间的区别与联系进行辨析。[方法/过程] 通过大量历史文献调研和实际相关机构案例调查,在此基础上进行细致的总结、对比分析,并对二者之间的共性及差异性进行深入细致的揭示。[结果/结论] 通过梳理发现,无论是从基本概念、研究对象、指导理论还是方法论体系上来看,无不体现出二者作为处在同一决策咨询流程链条两端的两个"工种",虽然在价值理念、关注侧重点上差异甚大,但彼此依赖又相互转化。  相似文献   

14.
[目的/意义] 探索从科技论文中挖掘出作者研究思路的可能性和技术手段,从而高效地获得新的研究创意。[方法/过程] 提出一种从单篇科技论文中抽取概念地图的方法,通过构建其微观概念地图(MCM)来形象地描述作者在研究中重视并运用的知识结构,通过对概念及其关系的定量分析来推测作者的研究重点和创新思路。[结果/结论] 选取一篇发表在2014年Science期刊上的关于聚类方法的论文,展示其MCM的抽取及论文研究思路的挖掘过程,验证所提方法的有效性。  相似文献   

15.
[目的/意义]通过对国内外多语本体领域映射技术相关研究成果的总结和EuroWordNet案例分析,为国内跨语言信息检索系统映射机制的建立提供借鉴和参考。[方法/过程]选取目前发展较为成熟的多语本体库EuroWordNet作为案例,分别从数据库设计、本体构建、概念存储和多语文化差异的映射处理4个方面对其中间语言索引机制(Inter-Lingual-Index,ILI)进行分析。[结果/结论]嵌入式的数据库结构设计、概念抽取及同义词集对应关系的界定、概念存储的细粒度化和复杂等价关系的建立是建立跨语言信息检索映射机制的关键。  相似文献   

16.
[目的/意义] 针对当前个人数据安全问题频发现状,通过研究个人数据的概念范畴和基本类型,进一步推动个人数据的理论研究与立法保护。[方法/过程] 综合运用文献调研和网络调研法,对学术文献和政策法律中的个人数据定义进行梳理,并使用比较分析法,归纳出个人数据的14种基本类型。[结果/结论] 定义了个人数据的概念,指出可以从完成程度、技术时代、基本属性、产生平台、社会职业、功能价值、重要程度、年龄特点、存储地点、存在形式、产生条件、自愿与否、保护状态和使用场景14个角度,梳理个人数据的基本类型。  相似文献   

17.
[目的 /意义]面向语义信息以层次渐进的方式识别技术演化轨迹,有助于加强对技术细节的理解并提升轨迹识别的准确性.[方法/过程]首先,提取专利和科技论文的SAO结构,依据语义信息确定研究主题,并利用S曲线分析技术生命周期.其次,借助机器学习算法与社会网络分析指标,分不同周期,通过多层次提取,筛选技术演化轨迹.最后,以造血...  相似文献   

18.
[目的/意义] 评价《替代计量学理论、方法与应用》一书在完善与发展"五计学"学科体系方面的重要学术贡献。[方法/过程] 从Altmetrics理论、工具、方法和应用四个层面剖析该书在"五计学"学科体系的完善与新发展方面的核心价值。[结果/结论] 该书作为计量学研究丛书之一,论证了Altmetrics与"五计学"的紧密联系,对推进Altmetrics的未来应用与发展具有特殊的学术价值与意义。  相似文献   

19.
[目的/意义] 利用社会化标签对电影资源进行标注已成为新网络环境下电影资源组织的新方式,构建电影资源本体对规范电影标签语义、提高电影资源检索效率具有重要现实意义。[方法/过程] 针对目前电影资源本体构建方法及构建过程存在的问题,提出利用社会化标签构建电影资源本体的思路,在深入剖析电影标签与电影资源本体映射关系的基础上,揭示一种基于社会化标签的电影资源本体构建方法,并给出利用该法构建电影资源本体的详细流程。[结果/结论] 利用豆瓣电影中的标签数据集构建一个电影资源本体,并分析基于社会化标签电影资源本体构建方法的科学性和优越性。  相似文献   

20.
[目的/意义] 综述若干国外竞争情报服务流程和技术竞争情报服务流程,强调情报流程在情报工作中的重要性。对比分析已有情报流程的特征。[方法/过程] 从竞争情报服务和技术竞争情报服务两个方面,分别阐述各代表性服务流程的特点和效果,对比分析各流程的关键要素。[结果/结论] 指出已有的情报服务流程忽视了关键情报课题的作用,提出建立以关键情报为轴心的服务流程。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号