首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
曲靖野 《情报科学》2017,35(10):120-124
【目的/意义】从时间分布、期刊分布、学科分布、研究机构分布、核心作者、高频作者合著网络以及高频关键 词共现网络等多个维度对国内“主题模型”研究领域的相关文献进行了可视化分析。【方法/过程】以国内CNKI数据 库收录的从2000年到2017年7月间有关主题模型的相关文献作为数据源,基于社会网络分析法,使用SATI软件 — —科技文本题录信息统计工具来构建共词矩阵,利用Ucinet 工具实现知识图谱的绘制。【结果/结论】通过对国内 主题模型研究领域的合作网络和研究热点的揭示,促进相关领域的理论创新和实践融合。  相似文献   

2.
【目的/意义】基于Rao-Stirling 指数和LDA模型进行领域学科交叉主题识别,并以纳米科技为例验证将 Rao-Stirling 指数和LDA模型用于领域学科交叉主题识别的有效性和适用性。【方法/过程】基于Rao-Stirling 指数 测度领域文献学科交叉程度,设定阈值发现高度学科交叉文献。基于LDA模型对筛选出的学科交叉文献进行主题 识别,发现学科交叉点和学科交叉研究主题。【结果/结论】基于Rao-Stirling 指数从引文的角度进行领域文献学科 交叉测度可以有效地发现与某领域相关的学科交叉文献,且有利于大数据集的学科交叉文献发现研究的实现。基 于LDA模型进行学科交叉主题识别可以有效地发现学科交叉主题。两方法的组合应用为发现某领域学科交叉主 题研究提供一种新视角。  相似文献   

3.
丁亮  何彦青 《情报科学》2017,35(10):125-132
【目的/意义】无论是统计机器翻译,还是神经机器翻译,训练数据通常来源复杂,主题多样,文体不一,与待 翻译目标文本的领域不能保证完全一致,导致领域自适应问题。目前机器翻译的领域自适应方法大多用主题模型 得到主题信息,将数据粗略划分为领域内(in-domain)和领域外(out-domain),缺乏更为明确的领域标签。【方法/过 程】本研究采用中图分类号作为领域标签,采用两种方法对汉语句子进行自动领域标注领域: 利用论文关键词和科 技词系统等知识组织构建领域知识库的领域标注方法;训练卷积神经网络的深度学习的领域标注方法,通过神经 网络深度融合模型将这两种方法融合起来得到效果更佳的领域标注器,利用机器翻译的测试集获取领域标签集合 筛选其训练数据。【结果/结论】经过在神经机器翻译系统上进行测试,针对两个特定领域测试集,仅利用部分训练 数据就获取了比原始训练数据高约1.3BLEU得分(相对5.4%)的翻译结果,证明了本研究方法的有效性和可行性。  相似文献   

4.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分, 为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇 章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者 用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度 矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层 次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】 本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标 签确定的方法比较简单,可以进一步探究。  相似文献   

5.
何喜军  马珊  武玉英 《情报科学》2018,36(11):95-100
【目的/意义】为应对线上技术供需信息超载导致的检索难、信息非结构化导致的供需文本匹配难的问题, 开展技术供需信息语义匹配研究。【方法/过程】构建技术领域本体,利用SAO结构分析提取技术供需信息中多维 语义结构特征,表征供给技术的创新特征及技术需求的问题特征。应用基于本体信息内容与语义距离相似算法, 结合词向量与熵值分析,提出技术供需多维语义结构匹配模型。【结果/结论】对线上新能源领域技术供需数据进行 测试,验证模型有效性,为提高技术供需主体信息检索效率、促进供需对接提供思路,并为考虑供需信息匹配的科 技主体推荐提供决策。  相似文献   

6.
杨波  李中乾 《情报科学》2021,39(9):35-41
【目的/意义】对中文学术论文中的外文文献引用特征的充分挖掘和系统分析是了解国内学者的外文文献 资源使用规律,从而促进外文资源合理利用的有效手段,也是完善论文质量评价体系和制订文献保障战略的重要 研究课题之一。【方法/过程】从论文审稿人和指标评价角度,对外文文献利用的主观意愿、期刊质量相关性、研究主 题特征等要素进行了深入分析。【结果/结论】实证研究结果显示,期刊审稿人对外文文献的价值一致持肯定态度, 期刊外文引文率和影响因子之间存在显著的正相关关系。不同的研究主题因国际化程度不同,外文引文率有较大 差异。【创新/局限】通过定量方法发现和解释了中文学术论文中外文参考文献的引用模式。  相似文献   

7.
潘颖  孙瑜峥  刘岩 《情报科学》2019,37(12):123-127
【目的/意义】科技文献阅读是了解国内外科技信息的重要途径和必要手段,而语素意识与科技文献阅读 能力密切相关,因此了解该领域的研究状况与前沿对提高科技文献阅读能力的研究具有重要的意义。【方法/过程】 本文以Web of Science数据库中收录的2006年到2017年间404篇有关语素意识的文献为语料,利用CiteSpace软件 进行可视化分析并绘制知识图谱,分类整理语素意识的相关研究结果,从共被引文献和施引文献两个角度对语素 意识的研究前沿和焦点进行分析。【结果/结论】CiteSpace软件的可视化分析能够清晰地展示语素意识研究的时间 分布。文章对该领域不同阶段的研究热点以及前沿问题进行了全面梳理,从新的视角为今后深入研究提供了重要 的依据和借鉴。  相似文献   

8.
龚凯乐  谢娟  成颖 《情报科学》2019,37(3):127-135
【目的/意义】引文国际化能够帮助本土学者以国际视野、国际思维和国际通用的学术范式、理念、方法从事 学术研究,提高研究水平,进而更好地在国际上发出中国声音、讲好中国故事。【方法/过程】以图书情报与档案管理 (LIS)学科为例,选取中文社会科学引文索引(CSSCI)建库以来每年均收录的16本LIS期刊作为数据源,通过对中 文期刊论文引用外文文献的语种、文献类型、来源期刊、学科领域、学术质量、时效性进行多维分析,揭示本土学者 在外文文献选择与内化的过程中经历的发展与变化。基于上述指标对施引文献聚类,进一步发掘出引文国际化的 主要模式。【结果/结论】被引文献中,外文占比逐年上升且英语占主导地位;被引外文文献中期刊论文占比最高,其 次是网络资源、会议论文、图书和学位论文;被引频次较高的外文期刊中,多数来自LIS领域,但也有其他学科的期 刊,较少数期刊获得了大多数引用;除本学科外,信息系统、计算机科学、管理科学与商学的外文文献被引较多,跨 学科程度稳中有升;被引外文文献的学术质量呈上升趋势;被引外文文献的年龄呈增长趋势。此外,本研究还发现 了五种各具特点的引文国际化模式。  相似文献   

9.
【目的/意义】对大数据知识领域的研究前沿及未来发展趋势进行预测。【方法/过程】利用引文网络结构变 换模型方法,通过 CiteSpace信息可视化软件工具,对下载于 Web of Science检索平台的大数据研究领域文献进行分 析,绘制文献共被引和引文结构变换知识图谱,分别从共被引文献和施引文献的视角,对大数据领域的研究前沿和 未来发展趋势进行预测。【结果/结论】预测出了对学科发展具有潜在影响力、交叉属性最强、对中心度影响最大的 文献以及相关研究主题。这种分析方法,避免了从施引文献或被引文献的单一角度分析知识领域研究前沿的不 足,对系统地分析知识领域的前沿,预测未来潜在变化趋势具有一定的参考价值。  相似文献   

10.
【目的/意义】本文通过对近三年国际图书情报学主流研究领域的分析与比较,深入分析了热点主题、高被 引论文和热点论文之间的关联与差异,为探索我国图书情报学领域研究的发展提供参考。【方法/过程】以Web of Science收录的 17种图书情报学领域高影响力外文源刊近三年间所刊载的论文为研究对象,对热点主题、高被引论 文及热点论文等进行了多视角的计量分析和对比研究。【结果/结论】研究发现国际图书情报学领域研究主要呈现 出三个热点主题;领域高被引论文主要体现在四个方面;领域热点论文侧重于信息计量学方面的研究。  相似文献   

11.
昌宁  窦永香  徐薇 《情报科学》2021,39(6):108-116
【目的/意义】本文利用多源数据,通过对科技文献作者的名称进行消歧,使作者与科技文献呈一一对应的 关系。【方法/过程】本文提出首先将采集的多源数据进行预处理,形成了同一姓名作者文献组成的待消解的重名数 据集,通过合作关系构建学术圈以发现歧义,最后通过机构和领域进行消歧。【结果/结论】实验采集了各级教育、自 动化及计算机技术、信息与知识传播、数理科学和化学、无线电电子学、中国医学等6个不同的学科的文献题录数 据,本文提出的基于规则的消歧具有良好的消歧效果。通过多源数据融合、机构和领域多指标消歧,能够达到较高 的消歧效果。【创新/局限】解决了同机构同领域消歧的难题,并考虑了增量问题,构建了完整的消歧模型。  相似文献   

12.
康美娟 《情报科学》2023,(11):162-169
【目的/意义】构建集成创新驱动的企业知识库服务机理模型,完善企业知识库服务模式和方法,提升企业的集成创新优势。【方法/过程】基于市场需求,集成企业外部和内部知识,构建集成创新驱动的企业知识库服务机理模型,以实现员工知识能力和企业创新能力的提高。【结果/结论】知识库服务机理模型推动企业知识库服务理论的深入发展,使企业知识服务更加智能化、个性化,为面向集成创新驱动的企业知识库服务提供了理论支撑。【创新/局限】仅从理论上探讨企业知识库机理模型的构建,未实现企业知识库的具体功能。  相似文献   

13.
陈大阳  邹长满 《情报科学》2019,37(12):172-176
【目的/意义】音乐信息搜寻行为作为信息行为研究领域的一个独特视角,对于丰富信息行为研究理论,指 导音乐信息服务具有重要意义。分析国内外该主题的研究现状,梳理音乐创作与音乐信息行为间的关系,总结研 究重点和值得关注的方向,以期为相关科研人员提供参考。【方法/过程】选取Web of science等7个外文数据库, CNKI等3个中文数据库作为文献来源,通过制定检索规则、人工判读等操作筛选密切相关文献集合,基于音乐创 作的3个基本活动(作曲、表演和即兴表演、聆听和分析)对用户的信息搜寻行为进行分析。【结果/结论】通过内容分 析,梳理出音乐创作活动中的用户信息需求与信息来源,构建音乐信息搜寻行为基本概念框架。  相似文献   

14.
温浩 《情报科学》2018,36(11):78-82
【目的/意义】目前的科技查新模式由于没有挖掘文献内容和关联发现机制,因此难以解决查新项目技术要 点的定位及查新周期过长问题。【方法/过程】本文提出一种基于创新点关联发现的自助查新模式。该模式包括三 个部分:挖掘科技文摘的创新点,将创新点分解为问题、方法、结果实体;将实体进一步分解为主谓宾语义关系;建 立创新点语义知识库,实现在创新点语义知识库中自助查新。【结果/结论】实验结果表明,该模式易于定位查新点, 具有了隐含关系发现,提高了查新的质量和查新速度。  相似文献   

15.
信息行为研究领域热点演化路径分析   总被引:1,自引:0,他引:1       下载免费PDF全文
王珅  曹锦丹  冯佳 《情报科学》2020,38(6):96-102
【目的/意义】系统分析了2009-2018 年信息行为研究领域的学科分布、高被引文献、关键词共现、关键词聚 类以及突发词,全面呈现了信息行为研究领域热点演化路径。【方法/过程】运用Citespace V知识图谱软件对通过 Web of Science 核心数据库检索出的2137 篇信息行为研究文献进行了可视化分析。【结果/结论】通过对学科分布 分析,发现图书情报学学科在信息行为研究领域中占据主导地位;通过对关键词的共现分析,可以发现,信息搜寻 行为在整个信息的生命周期中是比较重要的一个环节。而健康信息行为目前是信息行为领域中最热门的研究话 题,“微博”“社会化媒体”“互联网使用”等研究主题则是目前及未来一段时间内信息行为研究领域的前沿性话题。  相似文献   

16.
【目的/意义】基于知识元挖掘科技文献中的科学知识,建立科学知识之间的联系,构建细粒度知识图谱,旨 在打通知识之间的壁垒,满足用户细粒度的知识需求。【方法/过程】首先,本文构建基于图的知识元表示框架,并以 知识元为核心构建细粒度知识组织模型;其次,设计面向科技文献知识元的知识图谱,并探究知识图谱构建流程, 以实现知识图谱的自动化构建;最后以科技文献中的摘要和引言为实验数据,进行实证研究,构建面向科技文献知 识元的知识图谱。【结果/结论】本文所构建的知识图谱不仅能直观地展现学术论文所需要探究的问题、所提出的方 法和模型等,还能够揭示科学知识之间的内在关联。【创新/局限】本文探究了细粒度知识组织模型,构建了面向科 技文献知识元的知识图谱。在未来的研究中,将不断完善知识图谱构建流程,并探索知识图谱的应用领域。  相似文献   

17.
【目的/意义】为了探索未来信息集成研究的发展趋势与研究方向,本文从文献计量视角出发,全面分析该 领域的发展现状与研究热点。【方法/过程】本文通过检索式在 Web of Science数据库中获取到 1969-2017年信息集 成领域相关文献 5725篇,通过利用文献计量、信息可视化等方法,借助于 CiteSpace、HistCite、Excel等分析工具,从 发文时序变化、研究主体分布、发文期刊分布以及研究主题演化等方面对信息集成研究的相关文献进行计量分析 与可视化展示。【结果/结论】本文结果揭示了目前信息集成领域研究的发展现状,探索并讨论了该领域的热点趋势 及未来发展方向,可为未来信息集成方面开展进一步的研究提供有价值的参考信息。  相似文献   

18.
朱光  潘高枝  李凤景 《情报科学》2022,40(4):127-137
【目的/意义】识别信息隐私研究领域的热点主题,梳理主题演化路径。【方法/过程】针对主题识别语义杂乱 等问题,提出时序关联与结构表征视角下的主题演化分析方法。首先利用LDA(Latent Dirichlet Allocation)模型识 别多时间窗口下的文献主题,进一步运用共词分析绘制语义更为独立的主题凝聚子群。在此基础上,从时序关联 维度计算相邻窗口下主题间的相似度,梳理演化路径;从结构表征维度,设计主题新颖度、中心性、影响力等计量指 标,探寻信息隐私前沿和热点主题的演化变迁。【结果/结论】实证分析结果表明,本文方法可以深度挖掘信息隐私 领域研究主题,从宏微观两个维度全面梳理主题的演化路径。研究有利于探测信息隐私研究的前沿。【创新/局限】 综合运用LDA主题模型与共词分析方法绘制主题凝聚子群,从时序演化和结构表征两个维度探寻主题演化路径。 未来研究中有待于引入多种数据源以对比主题差异,有待于引入多元组术语改善主题识别效果。  相似文献   

19.
【目的/意义】海量科技文献中存在大量潜在“精品”文献,如何识别并利用此类文献是目前较具现实意义的 研究问题。【方法/过程】本文以Web of Science数据库中人工智能领域1990-2010年期间的文献原文及引文数据为 样本,构建该领域文献原文-引文特征向量空间,融合决策树和逻辑回归模型对文献特征向量空间进行模型训练和 潜在“精品”论文识别的测试应用。【结果/结论】实验结果表明,“发表五年后被引量”特征变量的加入能够显著提升 决策树和逻辑回归模型的识别分类效果,使得两类模型的识别准确率分别达到 84%和 89%以上,提升幅度达到 20 多个百分点。逻辑回归模型的识别效果始终优于决策树模型,通过调整两种模型的超参数,能够使得模型获得更 理想的识别效果。此外,早期人工智能领域科学研究仍处于小团队协作阶段,领域文献的基金支持和开放获取程 度较低。【创新/局限】尽管论文创新性引入机器学习方法实现潜在“精品”文献识别模型的建模与应用,然而仍需将 模型拓展到更多学科领域。  相似文献   

20.
李欣颖  徐恺英 《情报科学》2022,40(6):185-193
【目的/意义】通过对近 5年我国信息行为研究动态及发展趋势进行分析,掌握国内研究前沿及发展方向。 【方法/过程】运用文献分析和CiteSpace软件,对近5年我国信息行为研究动态及未来研究趋势进行分析。【结果/结 论】总结出医疗健康情境、生活情境、工作情境及社交媒体情境四个情境下的研究热点;归纳出扩充及细化研究群 体、注重研究理论与模型、注重研究方法、关注医疗健康领域及关注社交媒体的应用 5个未来研究趋势。【创新/局 限】未来将对国外信息行为研究动态及发展趋势进行研究,并与国内进行对比。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号