首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
陈金菊 《情报科学》2021,39(1):148-156
【目的/意义】突发事件新闻具有连续性特征,现存的语义模型无法很好地表示这一特征,通过构建突发事 件新闻语义模型可以实现对这些连续性信息的深层次语义描述和利用。【方法/过程】本文根据由表及里的建模思 维,构建了一个突发事件新闻深层次语义描述本体模型。该模型分为元数据和内容语义两部分,内容语义部分以 事件为起点、以连续性情景和动作为核心。在对突发事件新闻案例进行语义描述的基础上,实现了语义检索、语义 推理、语义数据可视化分析等应用。【结果/结论】通过语义标注和应用实验,验证了该模型的可用性。【创新/局限】本 文提出的突发事件新闻本体模型,较好地解决了突发事件新闻连续性信息的语义标注问题。  相似文献   

2.
【目的/意义】案例库是以规范化方式存储记录网络舆情应对的知识及经验。作为整个案例推理的前提,案 例库构建关系到推理过程整体运行效率以及决策支持的正确性。【方法/过程】通过集合突发事件网络舆情案例信 息,提取案例公共属性特征,以自然语言描述案例属性,运用本体技术构建出突发事件网络舆情案例库表示模型。 【结果/结论】案例库本体模型的构建不仅为案例表达提供语义表示的正式方法,而且阐明了本体内部组织建构模 式,在案例结构规范化的基础上,增加了案例知识的重用频率,促进了其共享。  相似文献   

3.
李枫林  柯佳 《情报科学》2019,37(1):156-164
【目的/意义】文本表示是自然语言处理的基础工作,是信息检索、文本分类、问答系统的关键问题。【方法/ 过程】论文介绍了传统的文本表示方法,按照文本不同的粒度,回顾了近五年国内外基于神经网络模型的词表示、 句子表示、篇章(段落)表示的方法,并提出了未来的研究方向。【结果/结论】实验发现,通过在神经网络模型中融入 更多的特征能得到更优的词向量,但词向量还缺乏统一的评价标准,句子向量表示通常根据具体NLP任务建模,不 同结构的模型在特征表示、运算速度上各有优劣势,篇章表示通常使用层次组合模型。  相似文献   

4.
【目的/意义】馆藏文物资源知识分散、异构、关联程度较低,本文提出一种馆藏文物资源知识关联的有效方 法,便于关联化的知识服务的开展和馆藏文物信息资源的开发利用。【方法/过程】本文在分析馆藏文物信息资源关 联和智能问答现状的基础上,提出基于关联数据的馆藏文物信息资源知识关联方法,构建了一个基于关联数据的 知识关联模型。通过借助关联数据相关技术、利用SPARQL以及HTML对馆藏文物资源知识进行访问和查询。【结 果/结论】将馆藏绘画类文物知识发布为关联数据形式后,馆藏文物资源知识得到充分的聚合,深度展现文物信息 资源之间的关系,提高了不同需求的用户浏览不同粒度的文物知识、知识实体关系的效率。【创新/局限】从关联数 据角度出发,提出基于多粒度语义查询的智能问答服务框架。下一步研究需要扩展馆藏文物资源的数据采集规 模,对馆藏文物资源的深层次关联发现进行探索。  相似文献   

5.
【目的/意义】文物图像资源日益成为数字人文基础设施建设的重要内容,为了克服存在于图像资源内容与 形式上的“语义鸿沟”对其开发利用产生的消极影响,有必要面向文物图像资源底层视觉特征与高层语义特征的精 细化映射与细粒度知识表示进行相关研究。【方法/过程】本文在分析文物图像资源知识表示需求与表示策略的基 础上,提出了基于知识元构造的文物图像资源细粒度知识表示模型。在模型设计的基础上,以著名绘画文物《历代 帝王图卷》为例,阐述了面向文物图像资源细粒度表示需求进行知识元提取、构造与数据发布的具体流程。【结果/ 结论】实验结果表明,本文提出的基于知识元的文物图像资源细粒度知识表示方法能够在图像底层视觉特征与高 层语义特征之间建立有效的语义映射关系,并通过与外部知识库的数据关联实现与开放关联数据网络的深度融 合。【创新/局限】本文从知识元角度出发,提出了文物图像资源的细粒度知识表示方法,在未来的研究中还需对文 物图像知识元的自动提取以及基于知识元的图像资源知识发现方法进行更深入地探索。  相似文献   

6.
【目的/意义】文献的向量表示方法对文献主题聚合、聚类和分类等研究具有重要意义。基于二元共现信息 的潜在语义向量空间模型(CLSVSM)挖掘了文本信息中词与词之间的潜在语义关系,与文本向量表示的基本模型- 向量空间模型(VSM)相比很大程度上提高了文本聚类的精度。【方法/过程】为使CLSVSM能更优的提取文献的潜 在语义信息,本文在二元CLSVSM基础上进一步引入了三元共现信息,以深度挖掘文献的潜在语义,通过研究三元 共现矩阵的表示,三元共现频次和相对共现强度的计算方法,最终建立了加权共现潜在语义向量空间模型(加权 CLSVSM)。最后我们分别利用中、英文献数据对二元CLSVSM和加权CLSVSM两类模型进行了实验比较。【结果/ 结论】结果显示:新模型对英文文献的聚类效果与二元CLSVSM相当,但对中文文献主题聚类效果明显要优于二元 CLSVSM。  相似文献   

7.
李宗俊  范炜 《情报科学》2021,39(7):186-192
【目的/意义】智慧数据是数据资源价值挖掘的承载,其中语义丰富化方法是促成智慧数据的重要手段。语 义丰富化方法及相关实践为智慧数据建设提供参考与借鉴。【方法/过程】从语义丰富化方法的技术角度出发,梳理 语义丰富化与关系型数据库、本体以及关联数据的关系,继而对语义丰富化在医学健康、数字出版、文化遗产等领 域的应用实践展开分析和归纳。【结果/结论】语义丰富化是利用语义网以及文本挖掘、相似度计算等相关技术将数 字资源中隐含的语义关系显性化,并在不同的资源间构建语义链接,促进数字资源的互通、互联与集成。由于数字 资源语义化层次、粒度与面向领域等存在的差异,智慧数据的实现需要语义丰富化诸多方法的有效集成框架。【创 新/局限】本文分析了数据网络中数字资源向数据资源转化的新方法,但仅局限于语义丰富化在部分领域中的应 用,还需丰富和扩展资料,总结语义丰富化的框架和应用分析。  相似文献   

8.
[目的/意义]为满足用户多层次、多粒度的知识获取需求,图书馆文献资源组织的对象由文献单元逐步向知识单元转变。[方法/过程]文章在研究单元信息概念和表示模型的基础上,提出基于本体和关联数据的单元信息知识组织框架,并深入探讨了实现单元信息语义组织的核心步骤。以中医养生领域为例,阐述单元信息知识组织语义模型的应用过程。[结果/结论]本文构建的单元信息知识组织模式,是实现单元信息细粒度组织、语义化揭示以及多维度关联的有效途径。该研究可为特定领域单元信息的语义应用提供参考。  相似文献   

9.
【目的/意义】基于互联网海量评论数据进行情报分析,挖掘出影响客户服务评价和满意度的关键因素,了 解客户差评背后的原因,对提升企业客户关系管理水平具有重要意义。【方法/过程】通过词云图、语义网络特征关 联分析、LDA主题模型的特征分析以及基于语义的情感词典方法,基于百度口碑中十家快递企业的客户评论数据 进行了情感计算与分析。【结果/结论】影响客户情感倾向的主要因素为:物流速度、服务态度、电话服务、投诉处理、 物流信息更新、时效性以及收费价格。基于上述结果提出了对策与建议。【创新/局限】基于现实世界真实数据,采 用数据挖掘方法分析客户情感倾向,为客户情感关键影响因素识别提供了数据科学的研究范式。  相似文献   

10.
陆泉  闫佳奇  沈雨田  陈静 《情报科学》2023,(5):26-33+41
【目的/意义】探究健康信息替代搜寻行为中用户对于不同替代对象的时间价值感知差异现象,为完善在线健康信息服务提供依据。【方法/过程】基于心理账户理论设计情景实验,通过探索性因子分析、描述性统计和显著性检验揭示健康信息替代搜寻行为中用户时间价值感知差异现象的成因、变化规律及行为影响。【结果/结论】用户为不同替代对象搜寻健康信息时存在时间价值感知差异,这种非理性现象的成因在于人们在心理上将为不同替代对象搜寻信息的时间设置了不同账户(亲人或非亲人账户),亲人账户的时间价值感知程度显著高于非亲人账户;两类账户中的时间价值感知程度均随损失时间增长表现出敏感性递减规律;节省时间的后续分配行为受到账户类别的显著影响。【创新/局限】从时间感知与分配角度研究健康信息替代搜寻行为中的非理性时间决策行为,揭示实际感知与理性认知之间的差异,为健康信息替代搜寻行为领域开展后续研究提供了新的参考;可帮助健康信息服务平台及用户认识健康信息替代搜寻中的非理性行为,引导用户避免非理性时间分配行为,指导平台完善信息服务。  相似文献   

11.
齐虹 《情报科学》2021,39(6):177-184
【目的/意义】电子健康记录信息作为医学健康信息资源的重要组成部分,其共享整合问题一直是当前克服 医疗信息资源“孤岛化”现象、实现医学知识服务的重点和难点,对国外电子健康记录语义整合研究进展进行分析 综述,旨在为我国后续研究提供借鉴和参考。【方法/过程】本文运用文献调查法,以电子健康记录信息资源转化为 知识资源为主线,梳理出电子健康记录语义整合的主题框架及发展态势。【结果/结论】电子健康记录语义整合是 一个集专业性和社会性高度融合的动态知识组织过程,未来研究可能关注的问题有:医学细分专业的互操作标准 建设、语义关联方式的开放透明问题、按需提供知识服务的模式研究以及开放获取与隐私保护的利益平衡问题 等。【创新/局限】对国外近期EHR语义整合研究主题进行分析和评述,并提出研究进展中的重点和趋势。  相似文献   

12.
陈晨  侯景瑞  吴任力  王平 《情报科学》2019,37(7):139-145
【目的/意义】社会化问答社区现已成为网络用户共享、传播及获取知识的重要平台,但其开放性和交互性 也给其问题推荐工作带来了巨大的挑战。本文提出的基于多源混合标签的方法能够有效提高社会化问答社区的 问题推荐质量,以促使问题得到及时有效地解决。【方法/过程】利用自动标签标注系统从问答文本中提取关键词, 将语义扩展后的关键词作为基本标签,并建立多源混合标签库;利用标签表示用户的兴趣偏好与权威度,并建立用 户特征模型;最终通过协同过滤的方式进行匹配推荐。【结果/结论】实验结果表明,本文提出的基于多源混合标签 的问题推荐方法在检全率、检准率以及F值等指标方面均不同程度地优于基于文本相似度的基准方法。  相似文献   

13.
【目的】 科学出版物的语义化过程中产生了大量的语义数据,分析这些语义数据的特征可以为语义出版实践提供参考和借鉴。【方法】 通过收集目前常用的典型科学出版物语义数据,多角度分析这些数据集的类型、组成要素、生成流程及其支持的应用系统功能,总结这些语义数据在开发、开放、发布中的共性。【结果】 目前主流的科学出版物语义数据集具有相似的数据开发与组织流程,偏向于自然科学领域,具有不同的组织粒度及应用特点。【结论】 科学出版物语义数据的生产与应用仍面临诸多挑战,需要在数据的规范使用、数据本身的质量以及基于这些数据的服务上予以重视。  相似文献   

14.
何喜军  马珊  武玉英 《情报科学》2018,36(11):95-100
【目的/意义】为应对线上技术供需信息超载导致的检索难、信息非结构化导致的供需文本匹配难的问题, 开展技术供需信息语义匹配研究。【方法/过程】构建技术领域本体,利用SAO结构分析提取技术供需信息中多维 语义结构特征,表征供给技术的创新特征及技术需求的问题特征。应用基于本体信息内容与语义距离相似算法, 结合词向量与熵值分析,提出技术供需多维语义结构匹配模型。【结果/结论】对线上新能源领域技术供需数据进行 测试,验证模型有效性,为提高技术供需主体信息检索效率、促进供需对接提供思路,并为考虑供需信息匹配的科 技主体推荐提供决策。  相似文献   

15.
李旭晖  周怡 《情报科学》2022,40(3):99-108
【目的/意义】关键词抽取的本质是找到能够表达文档核心语义信息的关键词汇,因此使用语义代替词语进行分析更加符合实际需求。本文基于TextRank词图模型,利用语义代替词语进行分析,提出了一种基于语义聚类的关键词抽取方法。【方法/过程】首先,将融合知网(HowNet)义原信息训练的词向量聚类,把词义相近的词语聚集在一起,为各个词语获取相应的语义类别。然后,将词语所属语义类别的窗口共现频率作为词语间的转移概率计算节点得分。最后,将TF-IDF值与节点得分进行加权求和,对关键词抽取结果进行修正。【结果/结论】从整体的关键词抽取结果看,本文提出的关键词抽取方法在抽取效果上有一定提升,相比于TextRank算法在准确率P,召回率R以及F值上分别提升了12.66%、13.77%、13.16%。【创新/局限】本文的创新性在于使用语义代替词语,从语义层面对相关性网络进行分析。同时,首次引入融合知网义原信息的词向量用于关键词抽取工作。局限性在于抽取方法依赖知网信息,只适用于中文文本抽取。  相似文献   

16.
闫永君 《情报科学》2021,39(8):126-131
【目的/意义】当前的信息用户行为特征挖掘方法无法将数据统一整合,且无法准确计算出时间序列内滑动 窗口内的数据均值,导致特征挖掘精度偏低。为此,提出了基于时间特性的信息用户行为特征挖掘方法。【方法/过 程】计算时间序列内滑动窗口内的数据均值,得出起始序列向量,再将用户行为划分成若干等值的时间片,通过取 样统计各种用户群体,得出用户的行为状态定性。以平均查询频率作为标准,观察用户的查询行为特征,输出信息 挖掘结果。【结果/结论】实验结果表明:所提方法挖掘出夜晚用户行为信息多于白天,休息日比工作日多,且在网络 波动下,虽然耗时增加,不过处于合理范围内。与传统方法相比,所提方法具有更低的挖掘误差,应用性较强。以 上实验结果证明了基于时间特性的信息用户行为特征挖掘研究能获取更准确的用户行为意向,提高用户兴趣预测 准确度,优化网络服务效果。【创新/局限】为进一步提高网络信息特征挖掘的效率,后续将重点研究多个网络用户 行为的并行分析,使该方法更适用于网络海量信息处理。  相似文献   

17.
吕建新  郑伟  马林  李明  谷翠梅 《情报科学》2019,37(12):47-51
【目的/意义】现有特征选择方法可以计算特征所携带的类别信息量,但却不能计算出与主题相关的语义信 息。针对其不足,为了提高分类准确率,提出一种基于词向量语义扩展的特征选择方法。【方法/过程】该方法引入 了词向量进行主题语义计算,筛选出具有类别语义信息的词条实现特征候选集的特征扩展,并采用K近邻分类方 法进行分类实验。【结果/结论】实验结果显示新方法能够有效提取主题语义特征并提高分类准确率。  相似文献   

18.
【目的/意义】本文基于颜色、纹理等外部特征与局部视觉特征构成的底层语义特征数据并采用随机森林的方法对医学图像信息进行语义自动标注,为医务工作者提供临床决策参考,便于普通公众理解医学知识和了解个人健康情况,也可以在大数据环境下扩展图书情报领域研究人员对信息组织与处理的范围,促进学科交叉与融合,提升智慧医学的发展,为健康中国战略提供智力与技术支持。【方法/过程】融合图书情报领域知识与医学知识,将图像语义标注看作为一个多类分类问题,首先,抽取颜色、纹理等外部特征及局部视觉特征等底层语义特征;然后,运用随机森林的方法,设计了基于随机森林的医学图像自动标注方案。【结果/结论】融合底层语义特征的医学图像信息自动标注的方案与随机树标注方案相比较,具有较好的效果。【创新/局限】将视觉语义词典作为医学图像的底层语义特征引入到图像标注中;运用随机森林构建的医学图像标注方案;局限在于仅采用BreaKHis数据集为实验数据。  相似文献   

19.
闫盛枫 《情报科学》2021,39(9):146-154
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出 一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时 序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强 其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法 对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具 有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提 升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单 元和语法结构。  相似文献   

20.
占泚  熊回香  蒋武轩  李琰 《情报科学》2022,39(1):121-129
【目的/意义】在线健康信息的有效组织对提升全民身体素质具有重要的社会价值。【方法/过程】在分析健 康信息主题、关联关系和资源标引的基础上,构建基于主题图的在线健康信息标签语义挖掘模型,从而构建了健康 信息标签主题图并实现了其可视化导航、浏览和检索等功能。【结果/结论】基于主题图的在线健康信息标签语义挖 掘模型能够准确的发现在线健康信息与信息标签间的深层关系,可以更好地揭示在线健康信息标签的语义关联, 为用户提供信息的可视化浏览和导航功能、提升健康信息的组织效果,帮助用户健康信息获取。【创新/局限】本文 将主题图与健康信息标签相结合,提高了健康信息的检索效率和利用效率,但本文也存在着不足,例如标签样本量 和样本范围较小,缺乏专业医学研究者的参与。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号