首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
徐彤阳  尹凯 《情报科学》2019,37(10):13-19
【目的/意义】引入人工智能领域中的深度学习方法来解决数字图书馆中传统文本分类的缺陷,这既是人工 智能领域研究的重点,也是图书馆领域关注的热点问题。【方法/过程】在对数字图书馆传统文本分类进行系统梳理 的基础上,提出基于深度学习的数字图书馆文本分类模型,利用词向量的方法对文本特征进行表示,采用深度学习 模型中的卷积神经网络提取文本信息的本质特征,并进行了实验验证。【结果/结论】实验测试表明,基于深度学习 的文本分类模型可以有效地提高数字图书馆文本分类的准确率和召回率,不仅可以提高数字图书馆内部业务的智 能化程度,还可以提高数字图书馆信息服务的效率和质量。  相似文献   

2.
刘家益  邹益民 《情报科学》2017,35(7):154-161
【目的/意义】文本自动摘要能快速获取文本主要内容,极大提高信息使用效率,帮助人们从信息海洋中解 放出来。随着互联网大数据日益深入发展,文本信息的数量已经远远超出人工处理极限,文本自动摘要研究显得 越发迫切和重要。【方法/内容】本文通过对过去70年国内外文本自动摘要经典文献重要文献进行收集、整理和分 析,总结归纳出六类主要文本自动摘要方法及其理念和具体做法,对比评析其优势不足,并对未来研究方向进行展 望,绘制出该研究领域的一个发展全景图。【结果/结论】自动摘要方法所使用的特征经历了由简单到复杂、由个体 到联系、由表层到深层的发展路径;如何深入利用深度学习方法,以及如何将传统方法与深度学习方法更好结合起 来将是下一步研究的热点和重点。  相似文献   

3.
闫盛枫 《情报科学》2021,39(9):146-154
【目的/意义】探测特定领域政策文本语义主题,揭示我国政策部署领域与未来发展趋势。【方法/过程】提出 一种融合词向量语义增强和DTM模型的公共政策文本时序建模与可视化方法,采用DTM模型实现政策文本的时 序切割和主题建模,利用深度学习Word2vec算法中Skip-gram词嵌入技术可以对上下文词汇进行有效预测,增强 其语义表达性和政策解释性,以更为准确地揭示我国公共政策的部署重点。【结果/结论】实验表明本文提出的方法 对于公共政策主题识别和政策文本量化具有更好的知识抽取和语义表达能力,对我国公共政策挖掘和信息揭示具 有良好的揭示。【创新/局限】提出融合词向量语义增强和DTM模型的公共政策文本时序建模方法,一定程度上提 升了政策文本的主题语义表达,未来考虑利用深度学习技术如LSTM算法、BERT模型等识别政策中的领域知识单 元和语法结构。  相似文献   

4.
【目的/意义】为了探索未来信息集成研究的发展趋势与研究方向,本文从文献计量视角出发,全面分析该 领域的发展现状与研究热点。【方法/过程】本文通过检索式在 Web of Science数据库中获取到 1969-2017年信息集 成领域相关文献 5725篇,通过利用文献计量、信息可视化等方法,借助于 CiteSpace、HistCite、Excel等分析工具,从 发文时序变化、研究主体分布、发文期刊分布以及研究主题演化等方面对信息集成研究的相关文献进行计量分析 与可视化展示。【结果/结论】本文结果揭示了目前信息集成领域研究的发展现状,探索并讨论了该领域的热点趋势 及未来发展方向,可为未来信息集成方面开展进一步的研究提供有价值的参考信息。  相似文献   

5.
【 目的/意义】为探析研究前沿与发展趋向,突破现有跨学科科研协作研究在主题识别预测中的不足,本文提 出跨学科科研协作新兴主题识别及预测研究框架,实现新兴主题识别及未来发展趋势预测。【方法/过程】以时间切 片的形式对 SciTS 会议文本进行主题抽取,提出新兴主题测量指标,探测领域内新兴主题并构建新兴主题时间序 列;而后分别采取BP神经网络和SVR两种经典机器学习算法对新兴主题未来三年发展趋势进行预测分析。【结果/ 结论】根据历史数据对跨学科科研协作新兴主题进行识别及预测有较好的效果,在识别出的五个新兴主题中,跨学 科交流与对话、跨学科协作社区搭建、跨学科教育与培训等主题未来发展状态将趋热。【创新/局限】选取美国SciTS 会议文本为典型案例展开探索性分析,丰富当前跨学科科研协作研究内容的层次性和多样性。  相似文献   

6.
王曦  陈铎 《情报科学》2022,40(7):55-60
【目的/意义】为把握招生考试过程中网络舆论的基本特点和发展规律,及时发现潜在舆情隐患,本研究对 考研复试期间国内主流网络社交平台的相关话题讨论文本进行了主题演化研究。【方法/过程】使用 Python采集数 据,BTM模型对数据中的词对建模来进行主题挖掘和聚类,对各主题强度和内容随时间的演化进行分析。【结果/结 论】主题强度和内容演化结果显示,公众的关注点与招生录取进程密切相关,并呈现一定的周期和规律性,能够做 为网络舆情预测的依据。【创新/局限】BTM模型克服了短文本语料中的数据稀疏问题,能够有效进行主题挖掘,但 同时也存在语义理解不足,需要人工辅助解读的问题,需要在后续研究中进一步改进。  相似文献   

7.
黄微  卢国强  赵旭 《情报科学》2022,40(7):177-185
【 目的/意义】虚拟学术社区用户交互行为是图书情报领域的热点研究内容,通过对虚拟学术社区用户交互 行为的研究体系进行梳理分析,为促进国内虚拟学术社区用户交互行为研究提供借鉴。【方法/过程】文章利用主题 并含检索在知网及 Wos数据库获取相关文献,通过热点关键词统计对检索文献进行可视化分析,总结归纳为用户 交互行为的机制模型、特征、影响因素、效果评价以及反向行为五个热点研究主题。【结果/结论】在理清当前学术研 究脉络基础上提出虚拟学术社区用户交互行为具有前瞻性的方向,即继续深入用户会话交互行为的数据挖掘;探 索反向行为与超越价值中心逻辑行为的机理;构建获取信息过程中知识筛选体系。【创新/局限】总结国内外虚拟学 术社区用户交互行为研究的基础理论与实践应用,针对现有研究的不足提出促进该领域发展的建议。  相似文献   

8.
邢云菲  王晰巍 《情报科学》2022,40(9):176-184
【目的/意义】社交媒体中网络舆情在演化过程中可能出现意见分化、对立或集聚,进而产生网络声讨或网络 对峙的群体极化现象。研究旨在通过梳理国外社交媒体中群体极化的发展脉络与研究主题,为我国相关研究发展 提供参考。【方法/过程】本文将国外社交媒体群体极化研究分为主题发现阶段、主题发展阶段以及主题成熟阶段, 并深入剖析在各个阶段下的发展脉络。【结果/结论】本文通过对该主题的整理和分析,总结了五项国外社交媒体中 群体极化研究热点,包括群体极化的动力机制、群体情感或观点极化、群体极化的仿真预测、群体极化的影响因素 以及群体极化的管理策略。最后,提出未来可从网络谣言传播中的群体极化、内生极化与外生极化以及群体去极 化等内容展开进一步研究工作。【创新/局限】系统性梳理社交媒体群体极化的国外发展脉络和研究现状,结合信息 管理学科研究主题提出了未来的研究方向。  相似文献   

9.
杨奕  张毅  李梅  邓雯 《情报科学》2019,37(1):86-93
【目的/意义】通过数据挖掘、文本分析法整合公众分散的反馈意见,对比研究出台政策,对政府部门吸纳公 众意见,制定科学合理的公共政策具有重要意义。【方法/过程】基于大数据技术深度挖掘公众对共享单车政策征求 意见稿的反馈内容,采用LDA模型从公众反馈意见中发现并提取低维主题集合,汇总、组织、分析大规模文本信息, 以主题领域和隶属概率值两维度,对比公众意见与政策修订的差异。【结果/结论】从制度体系、政府治理、企业经营、 产品完善、用户规范五个分类主题及其概率值,评估政策制定中的公众参与度以及政府对公众反馈意见的采纳效 果,以期为政府出台政策的科学性提供理论依据和决策建议。  相似文献   

10.
王静茹  陈震 《情报科学》2018,36(1):102-107
【目的/意义】目前LDA模型在文本数据挖掘方法中占有重要的地位,已成为数据挖掘领域的研究热点。 为了进一步提高LDA模型在文本挖掘中的应用效果,有必要对LDA模型文本主题提取效果进行对比研究。【方法/ 过程】本文提出了一种基于LDA模型的不同类型文本数据主题提取效果对比评价方法,先通过LDA模型对文本数 据进行主题挖掘;再通过定量的主题提取效果评价方法进行对比研究。【结果/结论】本文以期刊论文、网络舆情事 件话题、微博文本、调查问卷为文本数据源,实验结果表明LDA模型在处理语义信息明确逻辑关系合理的长文本数 据时,主题提取效果较好。这为提高LDA模型的挖掘效率提供了一定的理论依据。  相似文献   

11.
【目的/意义】学术论文的结构功能是学术论文篇章结构和语义内容的集中体现,目前针对学术论文结构功 能的研究主要集中在对学术论文不同层次的识别以及从学科差异性视角探讨模型算法的适用性两方面,缺少模 型、学科、层次之间内在联系的比较研究。【方法/过程】选择中医学、图书情报、计算机、环境科学、植物学等学科中 文权威刊物发表的学术论文作为实验语料集,在引入CNN、LSTM、BERT等深度学习模型的基础上,分别从句子、 段落、章节内容等层次对学术论文进行结构功能识别。【结果/结论】实验结果表明,BERT模型对于不同学科学术论 文以及学术论文的不同层次的结构功能识别效果最优,各个模型对于不同学科学术论文篇章内容层次的识别效果 均最优,中医学较之其他学科的学术论文结构功能识别效果最优。此外,利用混淆矩阵给出不同学科学术论文结 构功能误识的具体情形并分析了误识原因。【创新/局限】本文研究为学术论文结构功能识别研究提供了第一手的 实证资料。  相似文献   

12.
【目的/意义】随着互联网时代的到来,网络用户信息检索行为呈多样化、复杂化的趋势,及时了解网络用户信息检索行为的研究进展,有助于对该领域进一步研究主题及研究方向的确定提供参考。【方法/过程】以中国知网CNKI数据库和Web of Science数据库中1995-2018年中英文网络用户信息检索行为的相关文献为对象,通过Citespace绘制研究机构及其核心研究者、研究热点与研究主题演化发展的知识图谱,对网络环境下不同场景、不同用户群体的信息检索行为及其影响因素和模型研究这四大方面进行了对比分析。【结果/结论】结合国内的研究现状,探究未来可能出现的发展趋势,并针对目前国内研究中所存在的问题提出建议,为该领域未来的研究规划提供一定的参考依据。  相似文献   

13.
【目的/意义】评价科学是哲学社会科学体系的重要组成部分,其方法体系的构建需要依赖现代技术的支 撑,科学的评价方法体系能够极大地提升评价活动的效率。深度学习技术的发展为评价科学方法体系的构建带来 了前所未有的机遇。【方法/过程】本文通过文献计量、文本分析等方法,运用ITGInsight科学计量工具,对深度学习 技术及其应用于图书情报学科和评价科学的发展现状进行整体的梳理,并对基于深度学习的评价科学方法研究进 行了系统的总结与分析。【结果/结论】最终分析得出了深度学习及其应用于图情学科和评价科学的主要研究情况, 以及深度学习技术给构建评价科学方法体系带来的主要影响和潜在的发展机遇,并创造性地构建了一个基于深度 学习技术的评价科学方法体系框架。【创新/局限】本文对于基于深度学习的评价科学方法研究具有框架层面的指 导作用,但未曾就具体的方法过程进行讨论和实证研究,这将是相关研究接下来需要关注的内容。  相似文献   

14.
余辉  梁镇涛  谢豪 《情报科学》2021,39(7):177-185
【目的/意义】随着网络信息技术的发展及国家对技术转移的政策支持,大量的在线技术交易需求产生。在 线技术转移服务平台作为技术供需交易的媒介,供需双方可以在平台上发布大量的技术供需文本信息,提高技术 供需文本匹配效率,有助于提高技术交易成功率,促进技术转移。【方法/过程】在分析传统文本匹配方法的基础上, 从基于关键词的匹配方法、基于句法分析和文本结构的匹配方法、基于深度学习的匹配方法和基于多维度视角的 匹配方法四个方向对目前在线技术供需文本匹配方法现状进行梳理。【结果/结论】大多数研究都融合了多种匹配 方法,从多维度视角进行匹配是研究发展趋势。在技术供需文本匹配未来研究中,除了继续将深度学习方法融合 到已有的各种方法中,还应该从多维度、跨模态和可解释性方向来提高技术供需文本匹配效率。【创新/局限】本文 将技术文本匹配方法进行归纳总结,能对技术文本的匹配方法提供参考,但现实中技术匹配还应该考虑其他影响 技术转移的因素。  相似文献   

15.
【目的/意义】文本情感分类是近年来情报学领域的研究热点之一。已有研究大多关注针对目标文本的单 一情感分类。本文旨在探索基于深度学习的电商评论信息多刻面情感分类方法。【方法/过程】提出一种基于Atten⁃ tion-BiGRU-CNN的多刻面情感分类模型,通过BiGRU和CNN获取上下文信息和局部特征,利用Attention机制 优化隐层权重,以深度挖掘文本内隐语义和有效刻画多刻面情感。【结果/结论】在中文电商评论信息语料上的实验 表明,相较于其他神经网络模型,本文方法可有效提高多刻面情感分类的准确度。【创新/局限】进一步丰富多刻面 情感分类的方法途径,为深度挖掘电商评论信息以及优化产品和营销策略提供参考。本文语料主要基于单一类别 电商评论信息,聚焦可归纳刻面的情感分类,进一步的研究可面向类别多元化、需通过深度学习提取刻面信息的更 大规模语料展开。  相似文献   

16.
【目的/意义】引用动机不同会导致一篇论文在多次被引用时的引用主题和重点产生差异,识别这些被引主题并分析其变化,有助于引用动机分析,提高文献推荐效果。【方法/过程】本文首先抽取被引文献的上下文语境信息,根据文本长度界定多种引用内容的划分范围;然后结合多种文本聚类方法,识别被引主题并比较其异同;最后通过时序比较,分析被引主题的演化路径和过程。【结果/结论】选取人工智能研究领域中的代表性高被引论文进行分析,发现前后句是对当前引用句的重要补充,引用句及其前后句组合能够更好地揭示被引主题;基于引用内容的被引主题呈现出多样化的特征,揭示了原文内容的扩展和引用动机的差异;被引主题演化分析能够有效地揭示原文内容被应用或改进的方向、主题、方法和技术。【创新/局限】形成基于引用内容聚类的文献被引主题识别及其演化分析框架,证明被引主题的差异化以及对原文的补充作用,同时揭示引用内容的主题时序变化的特征与现实意义,后续有必要扩大研究样本,使得研究结果具有更好的通用性。  相似文献   

17.
【目的/意义】研究在线医疗社区医生主页中的医生文本信息与图片信息对患者择医行为的影响,期望为患 者在线择医行为的研究提供更深入的多源信息融合方面的理论依据,并为提高在线问诊的服务质量提供参考意 见。【方法/过程】本文以信任源理论为基础,从影响信任的声誉可信度、能力可信度和面孔可信度三个维度出发构 建患者在线择医模型,收集春雨医生网站文本、图片和其他相关信息,基于深度学习,识别医生照片中的面孔特征, 并基于多源信息,通过回归分析验证理论模型。【结果/结论】医生的声誉可信度对患者择医行为有显著的正向影 响,而医生的能力可信度负向影响着患者的择医行为。照片信息方面,严肃、不出众的医生外观形象能够促进患者 对医生的信任,进而正向影响患者的择医行为,照片的面孔吸引力可以削弱医院等级带来的负面影响。【创新/局 限】本文将图片信息加入患者择医决策行为研究中,充分考虑了患者生成信息与系统生成信息对患者择医行为的 影响。  相似文献   

18.
【目的/意义】梳理国内外认知计算的研究现状,分析其在图书情报领域应用状况,为后续认知计算在图情 领域应用提供借鉴。【方法/过程】首先利用CiteSpace可视化软件,基于文献计量和比较分析的视角综合梳理了国内 外认知计算的学科分布与研究热点,然后分析了认知计算在图书情报领域应用现状,最后提出认知计算在图情领 域未来实践应用的相关建议。【结果/结论】国内外认知计算研究的学科分布呈现跨学科和多学科形态,国内外共同 关注的研究热点有人工智能、机器学习、大数据与粒计算。国内形成了认知计算与图情领域相结合的热门研究方 向,主要应用于情报检索与分析、大数据处理与知识发现、智能人机交互以及学术论文评价等方面。【创新/局限】借 助科学计量工具系统性梳理了认知计算的国内外研究与在图情领域的应用现状,提出了未来的应用场景和用途。  相似文献   

19.
彭玉芳  陈将浩 《情报科学》2022,39(1):141-147
【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科 研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度 学习方法从大量的学术文献中抽取目标数据。其次使用NER和TF-IDF抽取目标数据的“5W”规则,接着对目标 数据做第二层需求规则过滤,凡是满足“5W”规则的数据,被鉴定为目标数据。最后对目标数据做第三层人工校 验,最终生成学术文献“目标数据”。【结果/结论】本文构建的学术文献“目标数据”抽取模型的准确率可达0.88,再融 合“5W”规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献 数据库机构的检索工作。【创新/局限】深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息 层面到进入学术文献内容的数据层面。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号