共查询到20条相似文献,搜索用时 375 毫秒
1.
【目的/意义】突发事件新闻具有连续性特征,现存的语义模型无法很好地表示这一特征,通过构建突发事
件新闻语义模型可以实现对这些连续性信息的深层次语义描述和利用。【方法/过程】本文根据由表及里的建模思
维,构建了一个突发事件新闻深层次语义描述本体模型。该模型分为元数据和内容语义两部分,内容语义部分以
事件为起点、以连续性情景和动作为核心。在对突发事件新闻案例进行语义描述的基础上,实现了语义检索、语义
推理、语义数据可视化分析等应用。【结果/结论】通过语义标注和应用实验,验证了该模型的可用性。【创新/局限】本
文提出的突发事件新闻本体模型,较好地解决了突发事件新闻连续性信息的语义标注问题。 相似文献
2.
【目的/意义】随着网络信息技术的发展及国家对技术转移的政策支持,大量的在线技术交易需求产生。在
线技术转移服务平台作为技术供需交易的媒介,供需双方可以在平台上发布大量的技术供需文本信息,提高技术
供需文本匹配效率,有助于提高技术交易成功率,促进技术转移。【方法/过程】在分析传统文本匹配方法的基础上,
从基于关键词的匹配方法、基于句法分析和文本结构的匹配方法、基于深度学习的匹配方法和基于多维度视角的
匹配方法四个方向对目前在线技术供需文本匹配方法现状进行梳理。【结果/结论】大多数研究都融合了多种匹配
方法,从多维度视角进行匹配是研究发展趋势。在技术供需文本匹配未来研究中,除了继续将深度学习方法融合
到已有的各种方法中,还应该从多维度、跨模态和可解释性方向来提高技术供需文本匹配效率。【创新/局限】本文
将技术文本匹配方法进行归纳总结,能对技术文本的匹配方法提供参考,但现实中技术匹配还应该考虑其他影响
技术转移的因素。 相似文献
3.
【目的/意义】全面分析中外科技文献可以把握当前某个领域或主题的研究热点和研究趋势,为了应对机器 翻译在分析海量外文科技文献时存在的科技术语翻译“领域不一致”问题,需要对科技术语信息匹配进行研究。【方 法/过程】提出了一种基于领域知识库的科技术语信息匹配模型,通过利用领域知识库构建领域多义术语词典,为 科技术语匹配更多翻译候选,并结合语言学特征、领域信息以及LSTM语言模型来挑选最合适译文。【结果/结论】用 化工领域的数据进行测试,验证模型的有效性,为深入分析外文文献中的技术理论提供了可靠又便捷的方法。 相似文献
4.
【目的/意义】案例库是以规范化方式存储记录网络舆情应对的知识及经验。作为整个案例推理的前提,案 例库构建关系到推理过程整体运行效率以及决策支持的正确性。【方法/过程】通过集合突发事件网络舆情案例信 息,提取案例公共属性特征,以自然语言描述案例属性,运用本体技术构建出突发事件网络舆情案例库表示模型。 【结果/结论】案例库本体模型的构建不仅为案例表达提供语义表示的正式方法,而且阐明了本体内部组织建构模 式,在案例结构规范化的基础上,增加了案例知识的重用频率,促进了其共享。 相似文献
5.
【目的/意义】传统的信息检索技术主要是基于关键词匹配的信息推送,该方法容易出现漏检和误检的情 况。语义检索通过语义分析获得用户真正的检索意图,实现精准检索。【方法/过程】本文在对语义检索的原理和模 型进行描述的基础上,提出了基于本体概念树模型的词元扩展算法,通过对词元的语义相似性、语义相关性进行计 算,得出词元的语义关联度,关联度超过一定阈值的词元的集合即为扩展后的词元集。【结果/结论】该方法既考虑 了具有继承关系的词元间的语义相似性,也考虑了具有相同属性词元间的语义关联度,结论更具参考价值。 相似文献
6.
7.
8.
【目的/意义】如何识别文本中的知识片段进行标引,使检索系统能检索文本知识内容是提高用户信息利 用效率的关键。【方法/过程】在文献调查的基础上,文章基于本体概念模型和Word2Vec词向量模型阐述了文本片 段语义标引的流程框架,并对本体语义扩展、神经网络模型训练、文本片段标引、文本片段权重获取四个部分的关 键环节及技术做了详细说明。最后通过实验验证了该流程框架。【结果/结论】实验结果显示该方法在文本知识片 段识别上是有效的,知识识别的准确率达到80%,能够实现对文本知识内容进行标引。该方法为自动化实现基于知 识的文本信息组织提供了有益的参考。 相似文献
9.
【目的/意义】为了提高图书情报的实时检索能力,需要进行图书情报共引数据整合模型设计。【方法/过程】
提出一种基于文献计量共引分析的图书情报数据的整合方法,构建图书情报文献计量共引数据整合的射频标签识
别模型,采用RFID标签技术进行图书情报文献计量共引数据的自动采样,对采样的大数据采用语义相似度特征提
取方法进行信息融合;结合文献计量共引分析方法进行图书情报数据的自适应聚类分析和整合分类,构建反映图
书情报归类的语义本体模型。通过自相关特征匹配方法实现对图书情报文献计量共引数据的优化分类检索和整
合。【结果/结论】测试结果表明,采用该模型进行图书情报文献计量共引数据整合的分类性能较好,数据检索的查
全率和查准率较高,提高了图书情报的检索效率。 相似文献
10.
【目的/意义】随着我国农民信息困境向信息不及时、信息识别困难的转变,以及农村精准信息服务有效供给的缺乏,从供需视角研究农村精准信息服务扩散成为促进三农信息化发展的重要议题。【方法/过程】本研究基于双边市场理论,以技术接受模型为基础,从供需视角建立农村精准信息服务扩散影响因素模型;以西北五省地区的农民和信息提供方为研究样本,通过结构方程方法进行实证分析。【结果/结论】数据结果表明,在需求方,农村精准信息服务扩散主要受农民对提供方的信任、精准信息服务的有用性、平台易用性以及成本的驱动;在提供方,农村精准信息服务扩散主要受提供方的技术易用性感知、自我效能和收益感知的影响。 相似文献
11.
【目的/意义】随着广大微博用户对微博信息推荐要求的提高,如何提升微博信息推荐的精准度,实现内容 的个性化推荐成为了研究者们亟待解决的热点问题。【方法/过程】笔者利用本体构建技术构建微博信息微本体,提 出了一种基于微本体架构的微博信息内容推荐方法,使用SJ-Tree将微本体图匹配算法进行改良,完善主题微本体 和用户微博信息微本体的匹配,实现微博信息的推荐。【结果/结论】仿真实验结果证实了微本体图匹配算法可以提 高微博信息推荐的效率及精准度,为实现微博信息内容的定制化推荐打下了坚实的基础。 相似文献
12.
【目的/意义】当前全球信息化时代下信息过载问题日趋严峻,在深度挖掘信息的基础上,结合用户行为特
征进行智能匹配显得尤为重要。【方法/过程】本文在基于潜在因子模型的个性化推荐算法的基础上,构建了结合时
间序列的语义信息挖掘及匹配模型。通过引入用户历史行为的时间序列语义信息,提高已有模型预测用户偏好的
准确性,结合因子分解机的思想实现对扩展模型的构建,并通过 movielens数据集对该方法的有效性进行验证。【结
果/结论】实验结果表明,新模型能够有效提高已有推荐模型预测用户偏好的准确性,从而实现了良好的数据挖掘
及匹配效果。 相似文献
13.
【目的/意义】实体关系抽取是构建领域本体、知识图谱、开发问答系统的基础工作。远程监督方法将大规
模非结构化文本与已有的知识库实体对齐,自动标注训练样本,解决了有监督机器学习方法人工标注训练语料耗
时费力的问题,但也带来了数据噪声。【方法/过程】本文详细梳理了近些年远程监督结合深度学习技术,降低训练
样本噪声,提升实体关系抽取性能的方法。【结果/结论】卷积神经网络能更好的捕获句子局部、关键特征、长短时记
忆网络能更好的处理句子实体对远距离依赖关系,模型自动抽取句子词法、句法特征,注意力机制给予句子关键上
下文、单词更大的权重,在神经网络模型中融入先验知识能丰富句子实体对的语义信息,显著提升关系抽取性能。
【创新/局限】下一步的研究应考虑实体对重叠关系、实体对长尾语义关系的处理方法,更加全面的解决实体对关系
噪声问题。 相似文献
14.
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出
一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时
序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强
其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法
对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具
有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提
升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单
元和语法结构。 相似文献
15.
【目的/意义】实现对领域本体分类关系的自动学习识别,解决领域本体知识框架结构体系的自动化构建问
题。【方法/过程】通过对领域本体分类关系自动识别的国内外研究现状及存在问题进行分析总结,以当前开源的先
进的深度学习文本预训练模型BERT为基础,研究构建了基于BERT的领域本体分类关系自动识别模型,并以资源
环境学科领域为例进行了实验研究和评估分析。【结果/结论】基于BERT构建的分类模型能够实现对领域本体分类
关系的自动识别,识别方法和流程具有极大地通用性和可移植性,识别精度比传统方法有了较大提升。【创新/局
限】微调与泛化了BERT,提高了领域本体分类关系识别模型的通用性和精度。但由于受分类标注语料的质量限
制,模型精度尚未达到峰值,有待进一步优化提升。 相似文献
16.
【目的/意义】为配合汉语主题词表(生物医学农业卷)编研项目的开展,适应生物、医学、农业领域术语系统
的发展趋势,满足学科应用的实际需要。【方法/过程】本研究参考 UMLS、MeSH、SNOMED CT、AGROVOC、
CABi、中国中医药学主题词表等国内外权威术语系统构建了生物、医学、农业领域《汉表》的顶层本体语义类型框
架。【结果/结论】该框架共包括62种语义类型及其属性,并通过实证检验验证了该语义类型框架的可用性。【创新/
局限】构建的顶层本体语义类型框架能够为生物、医学、农业领域主题概念提供语义背景,在汉语主题词表(生物医
学农业卷)实际编制过程中可根据需要进一步调整。 相似文献
17.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分,
为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇
章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者
用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度
矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层
次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】
本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标
签确定的方法比较简单,可以进一步探究。 相似文献
18.
19.
【目的/意义】本文基于颜色、纹理等外部特征与局部视觉特征构成的底层语义特征数据并采用随机森林的
方法对医学图像信息进行语义自动标注,为医务工作者提供临床决策参考,便于普通公众理解医学知识和了解个
人健康情况,也可以在大数据环境下扩展图书情报领域研究人员对信息组织与处理的范围,促进学科交叉与融合,
提升智慧医学的发展,为健康中国战略提供智力与技术支持。【方法/过程】融合图书情报领域知识与医学知识,将
图像语义标注看作为一个多类分类问题,首先,抽取颜色、纹理等外部特征及局部视觉特征等底层语义特征;然后,
运用随机森林的方法,设计了基于随机森林的医学图像自动标注方案。【结果/结论】融合底层语义特征的医学图像
信息自动标注的方案与随机树标注方案相比较,具有较好的效果。【创新/局限】将视觉语义词典作为医学图像的底
层语义特征引入到图像标注中;运用随机森林构建的医学图像标注方案;局限在于仅采用BreaKHis数据集为实验
数据。 相似文献