首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
随着关联数据应用的不断深入,已有众多的数据集发布在网上,但目前已发布的关联数据集之间关联很少,为数据的共享使用带来不便。本研究提出一种基于统计学习方法进行关联数据集间实体识别及链接构建的方法。首先进行数据集间的实体匹配,采用基于K中心点聚类算法实现属性的聚合及关系发现,对具有高相关度的属性进行匹配关系描述,降低实体匹配时的属性匹配计算次数;其次对已匹配的属性进行实体属性值的相似度比较计算,实现实体间相似度的比较,在SILK框架下实现实体的链接构建工作,以达到实体链接发现的目的;最后通过实验验证,这一方法能降低数据集间实体匹配计算次数,提高实体链接的正确率,具有可行性及实用性。图12。表4。参考文献19。  相似文献   

2.
关系型数据库和关联数据的概念模型都基于现实世界的实体、属性及其关系而构建,具备建立映射和实现转换的可能性。两者语义模式映射的重点是关联关系的构建与表达。开源软件D2R的映射语言,通过核心要素ClassMap、PropertyBridge及其属性,支持关系数据库的SQL实现,支持将关系数据库不同实体之间、同一实体内部及与外部数据的关联关系构建为RDF链接。  相似文献   

3.
面向馆藏数据库的关联数据发布研究   总被引:2,自引:0,他引:2  
D2R Server关联数据发布工具能够基于关系型数据库与关联数据在概念与数据层面的映射机制,利用D2R服务器、D2RQ引擎与D2RQ映射文件,构建数据库关系模型与关联数据RDF模型之间的语义映射规则。基于此,图书馆可以分别针对文献管理与馆藏书目数据库,利用D2RQ映射文件编制、主外键转换、关联映射定义、书目本体构建将馆藏元数据转换为RDF文档并实现多重客户端访问查询,从而为图书馆关联数据应用提供一种现实选择。  相似文献   

4.
早期针对语义网的自动问答主要是面向单一RDF数据集,随着网络上相互关联数据集的急速增加,迫切需要将自动问答扩展到多个RDF数据集,但同时在语义标注、答案整合方面也带来了更大的难度与挑战。本文提出了一种面向图书馆关联数据的自动问答新方法,通过将自然语言提问转换为结构化的SPARQL查询,从图书馆领域相互关联的五个RDF数据集中提取特定答案。该方法的创新点在于,将问句分为涉及一个数据集的简单句和涉及多个数据集的复杂句分别进行处理,又将简单句分为查询属性和查询实例两种类别分别制定SPARQL查询构建规则,将复杂句分解成若干个简单句进行处理,有利于SPARQL查询的构建和答案的整合。 通过实验测评,100个问句的回答精确率达到91%,表明这是一种行之有效的问答方法,对于促进关联数据在图书馆中的应用具有重要意义。图5。表5。  相似文献   

5.
关联数据的动态链接维护研究   总被引:2,自引:1,他引:1  
郭少友 《图书情报工作》2011,55(17):112-116
分析关联数据集之间链接的动态性,在此基础上探讨三种动态链接维护方法。基于WODLMP协议的方法要求链接双方都遵守WODLMP协议。基于更新通知的方法适用于目标数据集具有数据更新通知机制的情况,需要针对目标数据集的数据更新通知机制采取相应的更新数据获取方法。基于主动监测机制的方法对目标数据集的要求较低,只需要提供SPARQL查询接口或支持RDF堆下载即可。   相似文献   

6.
利用实体解析的跨社交媒体同一用户识别   总被引:1,自引:0,他引:1  
[目的/意义] 跨领域关联实体一直是实体解析研究的主题,本文旨在不同的社交媒体(跨社交媒体)中找到属于同一用户的账户。[方法/过程] 在传统近似字符串匹配技术的基础上,提出使用属性值结合社交媒体中的链接和文本内容的方法,比较两个不同社交媒体账户的属性相似度、邻域相似度和关键词相似度这三个匹配函数,以此提高识别这两个账户是否是同一个人的精确度。并利用社交媒体Facebook和Twitter数据作为实验数据集,针对匹配函数的不同组合进行试验。[结果/结论] 结果表明,三个匹配函数的组合能够得到更多的账户匹配为同一用户,同时精确度也很高,达到0.923。本文提出的方法在Facebook和Twitter上的成功运用,给其他社交媒体平台或者其他领域的实体关联的研究提供了一条新的路径。  相似文献   

7.
国家叙词库是我国叙词表资源集成与服务系统,体系结构包括三层:数据获取与转换层、存储与语义集成层、服务与应用层。数据获取与转换层实现叙词表数据的采集、规范描述和格式转换;语义集成采用中心词表集成模式,顶层为分类表和本体,中间为概念层,底层为基础词库;服务方面,采用渐进服务思路,提供不同颗粒度和不同语义层次的数据服务。叙词表宏观结构方面,将叙词表及其各组成部分作为独立概念体系,通过描述概念体系间的关联,表达叙词表宏观结构;微观结构方面,将概念和词汇分别作为描述对象,词汇作为概念标签,在概念层面描述语义属性,在词汇层面描述非语义属性。基于DC元数据框架设计叙词表元数据方案,基于SKOS+XL设计概念和词汇描述的元数据方案。图3。表3。参考文献19。  相似文献   

8.
林杰  苗润生 《情报学报》2020,39(1):68-80
专业社交媒体中主题图谱的内容包括论坛中的主题及主题之间的关系,其具有挖掘专业产品创新方向、构建专业知识索引等重要应用价值。本文基于深度学习技术与文本挖掘技术,提出了专业社交媒体中的主题图谱构建方法。首先,使用专业社交媒体中的文本训练Skip-Gram模型,利用该模型的隐藏层权重与模型输出的预测结果,分别获取词语间的语义相似度与上下文关联度。其次,基于该语义相似度与上下文关联度,对已有领域种子本体词汇进行扩充,将语义相似或上下文相邻近的词汇纳入本体词汇,为主题抽取提供高质量的领域词汇。然后,基于扩充的专业本体词汇,使用结合本体词汇的LDA主题模型从专业社交媒体文本中抽取主题与主题词。最后,利用语义相似度与上下文关联度,定义关联度权重,通过图模型与谱聚类,获取主题间与主题词的关联关系与层次结构。本文使用汽车论坛语料进行主题图谱生成实验。实验结果表明,本文方法获取的主题词纯净度相比单独使用LDA模型提升了20.2%,且能够清晰合理地展现主题之间的关系。  相似文献   

9.
基于领域本体的语义知识检索研究   总被引:1,自引:0,他引:1  
针对传统知识检索效率低、精度不高等问题,引入本体技术,构建基于领域本体的语义知识检索系统架构,提出综合语义相似度的知识检索算法。算法综合考虑概念间的关系类型、概念所处的层次深度、概念密度、概念间连接的强度以及概念的属性等因素计算语义相似度,避免传统检索中存在的检索精度不高等问题。该模型为构建语义知识检索系统以及解决系统构建中的关键问题提供了理论指导。  相似文献   

10.
BIBFRAME可以实现书目数据的关联数据化以及图书馆数据与外部资源的链接,为智慧图书馆建设提供书目的数据化支持。在BIBFRAME模型特点及词表重用方式的基础上,利用采集到的国家图书馆书目数据,着重探讨了基于BIBFRAME中文书目关联数据化的映射设计过程,并归纳相应的映射处理方式;同时利用拟定义URI,分析书目数据内外部实体资源链接方式,以完善关联数据发布过程。通过此研究路径,提出了书目数据映射过程中的相关问题,构建了书目数据实体资源关联模型,为实现中文书目数据CNMARC语义关联数据化提供借鉴。  相似文献   

11.
提出一种结合语义检索和多属性决策方法的商品信息检索模型。通过构建语义向量空间进行语义相似度计算,以实现检索结果与顾客查询关键词的语义匹配;同时该模型也采用TOPSIS多属性决策方法对检索到的商品进行效用值计算,从而建立商品内容的比较机制。最后,从准确率、顾客接受度等指标通过实验证实该模型的有效性,能够提高商品信息检索的精准度。  相似文献   

12.
针对传统的信息抽取方法在提取卷期目录链接时精度不高的问题,本文提出一种基于网页分块和链接特征的卷期目录链接提取方法.首先,以网页标签树的布局标签为最小粒度,提出一种原子网页分块算法,将网页分割为若干个相互独立、互不包含的内容块;其次,根据内容块的子树结构,提出一种原子内容块聚类算法,通过合并相似内容块对网页进行语义块划分;最后,提出一种卷期目录链接块的识别算法,通过融合链接文本相似度和基于Bayes的语义分析方法识别出卷期目录链接区域,从而实现链接的提取.实验结果表明,本文提出的方法能够有效提取卷期目录链接.  相似文献   

13.
从关联数据的链接机制入手,探讨采用关联数据技术构建知识链接的优势、构建模式和具体构建方法;根据知识链接的不同功能,将基于关联数据的知识链接划分为三种类型:等同链接、相关性链接、词汇性链接;最后从应用角度建立基于关联数据的知识链接的4层应用框架,包括描述层、链接层、整合层、应用层,同时展望基于关联数据的知识链接的应用。  相似文献   

14.
传统的Web文本分类方法将文本中关键词的相似度作为分类的依据,丢失了很多重要的语义信息,导致分类结果不够准确且计算量大。基于此,文章提出了一种基于语义相似度的Web文本分类方法,利用领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量集,定义Web文本相似度的计算公式,设计并实现基于语义相似度的KNN算法。实验结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少了计算量,提高了分类精确度。  相似文献   

15.
文本分类是网络主题舆情分析中的关键技术,传统Web文本分类将文本关键词的相似度作为分类依据,丢失许多重要的语义信息,导致分类结果不够准确且计算量大.本文提出一种基于语义相似度的Web文本分类方法,利用特定的领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量,给出Web文本相似度的计算公式并实现基于语义相似度的KNN算法.结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少计算量并提高了分类精确度.  相似文献   

16.
指出如何对海量的RDF数据进行存储、查询、获取和推理是RDF 数据管理研究领域最关心的问题之一。分析语义仓储Virtuoso的系统架构,在同其他语义仓储存储模式对比的基础上,剖析基于扩展三元组表存储模式的Virtuoso的RDF数据存储模式和索引机制;对Virtuoso扩展的SPARQL查询语言SPARUL的优点及采用后向推理引擎的方法进行研究;利用Virtuoso和Solr构建基于图模式的UKAT的术语服务原型系统,讨论系统存在的不足及未来的工作方向。  相似文献   

17.
如何利用具有本体标注的结构化文档中的语义信息组织P2P网络,提供对基于语义的信息共享与查询的P2P网络支持,是当前P2P网络的研究热点之一.本文提出采用Peer所存储文档中的加权本体概念向量作为Peer的特征向量,通过相似度计算将Peer聚成Peer组,从而构造基于语义的半结构化P2P网络.用户的查询请求由各Peer组内的组服务器负责路由转发,组服务器计算查询请求与各路由表项之间的相似度,将查询向最有可能包含查询目标的Peer组转发.文中较全面地阐述了本体概念局部和全局权重的计算方法.由于P2P网络拓扑的建立过程和查询路由过程均基于语义信息,使得网络的各项性能与基于关键字处理的P2P网络相比,得到了较大的提高.  相似文献   

18.
在对概念语义相似度方法调研的基础上,本文提出基于概念向量的文本语义相似度测度方法,借助MetaMap工具抽取文本中的概念术语,将概念术语通过词表层级结构转化为概念向量,通过计算两文本中概念向量的语义相似度来测度两文本的语义相似度。为验证基于概念向量文本语义相似度方法的准确性,选取TREC-05 genomics track数据进行实验,实验结果表明,本文提出的方法较常用的余弦方法更优,与专家评估方法更接近,在测度文本语义相似度上具有一定的可行性和有效性。  相似文献   

19.
敏捷供应链中知识服务检索的语义相似度问题研究   总被引:1,自引:0,他引:1  
针对钢铁行业敏捷供应链本体,通过分析传统的语义相似度计算方法,改进其不足,综合考虑概念、属性和概念间关系这三个影响因素,构建一个语义相似度计算模型,可以有效提高知识服务检索的质量和效率,得到满足知识服务用户需求的信息。  相似文献   

20.
为了构建情报学资源本体,文章探索一种新的构建本体的方法,并为本体自动构建技术提供参考。数据来源为CSSCI中2001—2010年情报学的8290篇文献,利用统计分析、共现分析和语义相似度计算等方法,依照本体构建原则与常用的本体构建步骤,构建情报学资源本体。构建过程与成果表明:自动构建技术尚须完善;资源本体是本体研究中新的突破点;语义相似度与共现分析的结合定量化描述概念间关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号