首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
李锋 《情报科学》2017,35(8):68-71
【目的/意义】反思共词分析中存在的问题,提出核心关键词人工聚类分析的研究方法。【方法/过程】梳理 了共词分析的一般方法和存在的问题,并以图书情报界阅读研究文献为例证实了共词聚类效果确实不是很理想。 提出了在计算机统计关键词频次之后,选择具备一定频次的表意性较强的核心关键词进行人工聚类分析的研究方 法。【结果/结论】实践证明这种研究方法能避免共词分析的弱点,有效揭示研究领域的主题结构。  相似文献   

2.
魏伟  郭崇慧  唐琳  陈静锋 《情报科学》2017,35(6):138-144
【目的/意义】文献挖掘是文本挖掘领域中的重要研究方向,文献挖掘技术在信息化时代发挥着越来越重要 的作用。【方法/过程】首先在文献挖掘过程中引入知识元概念,提出了一套基于知识元的文献挖掘处理模式。其次 针对海关贸易档案文献资料,提出了一种五元组结构的知识元表示方法,并用领域知识元本体进行领域知识元间 的组合链接。同时针对期刊文献资料,提出了五类知识元共同表示一篇期刊文献的知识元表示方法。最后以“粤 海关”相关贸易档案文献资料和中文期刊文献资料为例,运用所提方法进行知识元的抽取和表示,在知识元的基础 上进行知识元间的组合链接进而实现快速精确的领域知识挖掘。【结果/结论】基于知识元的文献挖掘模型,能够增 强文献挖掘过程的可重复操作性并提高挖掘成果的可重复利用性。  相似文献   

3.
【目的/意义】针对我国网络舆论引导研究进行可视化分析,能够揭示这一研究领域的前沿热点及演进趋 势,为进一步发展该领域的学术研究提供理论支持,为提升我国网络舆论引导工作水平找到着力点。【方法/过程】 将中国学术文献网络出版总库(CNKI)中以“网络舆论引导”为主题的文献作为数据来源,使用文献题录工具SATI 进行数据预处理,基于共词矩阵联合可视化技术,对高频词共现矩阵进行网络关系研究和聚类分析。【结果/结论】 最终得出我国网络舆论引导研究领域的热点主要集中于:网络舆论引导主体、客体、内容、媒介及引导机制研究5 方面。  相似文献   

4.
【目的/意义】引用动机不同会导致一篇论文在多次被引用时的引用主题和重点产生差异,识别这些被引主题并分析其变化,有助于引用动机分析,提高文献推荐效果。【方法/过程】本文首先抽取被引文献的上下文语境信息,根据文本长度界定多种引用内容的划分范围;然后结合多种文本聚类方法,识别被引主题并比较其异同;最后通过时序比较,分析被引主题的演化路径和过程。【结果/结论】选取人工智能研究领域中的代表性高被引论文进行分析,发现前后句是对当前引用句的重要补充,引用句及其前后句组合能够更好地揭示被引主题;基于引用内容的被引主题呈现出多样化的特征,揭示了原文内容的扩展和引用动机的差异;被引主题演化分析能够有效地揭示原文内容被应用或改进的方向、主题、方法和技术。【创新/局限】形成基于引用内容聚类的文献被引主题识别及其演化分析框架,证明被引主题的差异化以及对原文的补充作用,同时揭示引用内容的主题时序变化的特征与现实意义,后续有必要扩大研究样本,使得研究结果具有更好的通用性。  相似文献   

5.
【目的/意义】针对基于关键词的科技文献聚类研究进行了一些探讨,包括:使用具有不同特征的关键词来 实现文献聚类在效果上有何差异;如何按特征对关键词进行选择来提高文献聚类效果。【方法/过程】按照关键词词 频与语义类型特征设置对照组进行实证研究,观察其对文献聚类密度及文献语义表示效果的影响。【结果/结论】单 独使用具有超高频、次高频、研究主题或限定范围特征的关键词进行文献聚类能使聚类密度较为合适;超高频特征 通常在其他频次中都具有体现,次高频词能同时反映不同频次的关键词特征,但次高频词对中频词特征的表示不 够全面;将语义类型不同的关键词分开来实现文献聚类,其效果好于将关键词进行组配,语义类型不同的关键词间 存在互斥性。【创新/局限】本文发现了在以关键词间的共现关系为基础来进行文献聚类时单独选择次高频或某一 语义类别的关键词来实现文献聚类具有较好效果,但缺少对关键词间语义结构关系的进一步研究。  相似文献   

6.
【目的/意义】更好地利用web of science中提供的作者关键词及增补关键词以便得到更为准确的情报分析 结果。【方法/过程】利用情报工作中的常用分析工具对比了作者关键词、增补关键词及两者结合的关键词所产生的 分析结果的异同及其与实证领域发展特点的吻合程度。【结果/结论】给出了不同情报分析目的下选择合适关键词 类别的相关建议。  相似文献   

7.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分, 为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇 章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者 用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度 矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层 次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】 本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标 签确定的方法比较简单,可以进一步探究。  相似文献   

8.
【目的/意义】运用词频分析方法探究某领域研究热点的文章数量的增多,在促进了领域研究发展的同时, 其写作方式也呈现比较严重的方法滥用及模板化现象,而这种现象并未得到学术界的足够重视。【方法/过程】通过 对国内运用词频方法开展特定领域热点分析的文章进行梳理和分析,总结了词频分析方法应用于热点分析类文章 的基本状况。【结果/结论】发现存在如下问题:方法模板化现象严重、多种方法简单堆砌、方法使用不规范以及“话 题性”研究主题过多等问题。  相似文献   

9.
陈善敏 《情报科学》2017,35(8):170-176
【目的/意义】以中国知网(CNKI)中国学术期刊网络出版总库的图书情报领域特色资源研究的论文为研究 对象,分析了我国高校图书馆图书情报领域特色资源研究的发展态势。【方法/过程】采用文献计量法和共词分析 法,利用网络知识图谱、因子分析、聚类分析和多维尺度分析,研究各关键词之间的关系。【结果/结论】综合分析发 现当前的研究热点主要包括五个方面:特色资源建设、地方特色文献、共享特色资源、数字特色资源、特色资源服务 模式和策略。  相似文献   

10.
【目的/意义】学术文本关键词抽取是从文本中自动抽取具有主题性、代表性的词或短语,是学术信息服务 的重要环节。传统的方法大多仅依靠候选关键词有限的词频、文档频率等统计信息,没有考虑学术文本内候选关 键词在对应学术领域的使用情况,使得关键词抽取的准确率受到限制。针对这一问题,本文提出一种基于先验知 识TextRank的学术文本关键词抽取算法。【方法/过程】首先计算候选关键词的使用情况作为先验概率特征值,然 后运用基于图排序的关键词抽取算法TextRank计算候选关键词的文本内特征值,最后结合以上两个特征计算得到 候选关键词的综合权值并对关键词进行排序。【结果/结论】在计算机科学领域的多个文献集上进行了实验评估,其 结果相较于传统的关键词抽取方法有了明显的提高,证明了基于先验知识TextRank的学术文本关键词抽取算法的 有效性。  相似文献   

11.
张蕴娣  于宁  赵闯 《情报科学》2022,40(10):187-192
【目的/意义】以主题聚类的方法揭示国内图情领域区块链研究热点,为区块链在图情领域的研究工作提供 参考。【方法/过程】利用中国知网数据库检索区块链在图情领域应用的全部期刊论文、会议论文与学位论文,提取 了470个关键词,并利用杰卡德系数计算文献的相似程度,形成10个主题聚类,之后利用IG(信息增益法)计算所有 关键词在主题聚类中的重要程度,通过前10位核心关键词阐述各主题聚类中研究论文的主要研究内容,并通过主 题聚类下的年度发文趋势分析区块链在图情领域未来的发展趋势。【结果/结论】文章共提取出区块链技术、智慧图 书馆、资源建设、信息服务、阅读推广、隐私保护、借阅服务、科学数据、版权保护、情报分析十大主题聚类,并将其归 纳出包含基础层、技术层、应用层、拓展层的研究框架,分析了未来研究趋势将更加集中于情报分析、智慧图书馆、 阅读推广、科学数据、版权保护、隐私保护六大主题中。【创新/局限】对研究主题的分析还可以采用更多的视角进行 分析,如知识图谱等。  相似文献   

12.
张金年  罗艳 《情报科学》2021,39(8):86-93
【目的/意义】学术合作有利于促进科研工作的顺利开展,加速科研成果产出,促进学术交流与知识融合。 【方法/过程】以2017-2019年图书馆学领域7本CSSCI来源期刊论文为研究对象,定义、提取作者关键词现实关系、 作者关键词潜在关系;运用共现分析识别、排除合作者数据,基于耦合分析界定作者间潜在关系并建立矩阵,构建 基于研究内容的作者潜在合作网络;运用聚类分析、结合聚类效果归纳潜在合作团体,并通过文献内容研究析出潜 在合作主题。【结果/结论】研究结果表明:图书馆学领域有72位潜在合作者、8个潜在合作团队,1个整体合作中心和 多个区域合作中心;潜在合作主题按集群分为7大类、按个体分为若干小类。该发现为科研人员的合作提供可借鉴 的参考。【创新/局限】该发现为科研人员的合作提供可借鉴的参考。  相似文献   

13.
裘江南  杨畅  李灵 《情报科学》2017,35(5):8-14
【目的/意义】在线知识社区中知识通过社会关系进行传播,形成知识网络,用户之间通过交流、沟通形成社 会网络,通过网络结构来探索社会关系与知识结构的序化过程。【方法/过程】基于社会网络分析理论和网络结构熵 理论,以英文维基百科为研究对象,通过知识网络和社会网络的平均路径长度、聚类系数、同配系数、 “蔡”结构熵, 揭示网络的演化规律。【结果/结论】通过词条“Big Bang”的案例研究发现:在线知识社区中知识观点较社会关系更 为紧密,聚合程度较高;社区演化初期,两个网络是无序的同配网络,随后逐渐演化为有序的异配网络。  相似文献   

14.
【目的/意义】大数据技术的发展与应用使大数据治理成为学术界的研究热点。可视化图谱能够直观地揭示该领域的研究概况与趋势。【方法/过程】运用文献计量信息可视化软件CiteSpace,以CNKI数据库中CSSCI期刊收录的大数据治理研究相关文献为数据来源,对该领域研究成果的总体概况、研究机构、期刊来源等进行特征分析,并绘制关键词共现图谱、聚类图谱和突变词信息表,分析了关键词的特点与发展趋势。【结果/结论】结果表明该领域的研究热点主题包括大数据治理的基本概念、大数据的管理和大数据治理的应用等方面,研究内容丰富且不断演变创新,未来有较大的发展空间。【创新/局限】借助可视化文献计量工具系统梳理了大数据治理的研究现状和发展趋势,提出了未来的发展建议。  相似文献   

15.
陈善敏 《情报科学》2017,35(6):171-177
【目的/意义】本文以中国知网(CNKI)中高校图书馆社会化的研究文献为研究对象,分析了我国高校图书 馆社会化研究的热点。【方法/过程】采用共词分析方法构建矩阵,利用网络知识图谱分析、SPSS因子分析、聚类分析 和多维尺度分析,研究各关键词之间的关系。【结果/结论】综合分析发现当前的研究热点主要包括五个方面:高校 图书馆社会化需求、社会化模式、社会化实施中的问题与对策、社会化需求下的情报信息服务以及社会化的趋势。  相似文献   

16.
张毅  李欣 《情报科学》2019,37(11):169-177
【目的/意义】将人工智能技术与可视化技术相结合,解析文章题名与摘要中包含的隐藏信息,为探索我国 图书情报领域的研究历史与现状提供全新研究视角。【方法/过程】从CNKI数据库中下载CSSCI来源期刊中图书情 报学领域的全部文章元数据148 956条,利用自然语言处理技术抽取题名与摘要中的标签、分类以及情感倾向,通 过统计、聚类、神经网络预测以及知识图谱等方法,绘制期刊下载与被引关系图、构建影响文献被引因素模型、研究 热点与情感倾向迁移图以及高质量文章的知识图谱等。【结果/结论】揭示了1957-2018年图书情报领域文献被引与 下载的关系,挖掘文献被引的影响因素,找出研究热点的变迁演化以及高被引文献的特征。  相似文献   

17.
[目的/意义]随着我国关于政策文本研究文献的日益增多,对国内CSSCI期刊发表的相关研究文献进行综合述评有助于梳理政策文本分析研究的脉络,为未来政策文本研究的深入提供参考。[方法/过程]基于文献计量学和可视化分析视角,绘制我国政策文本研究的作者共现图谱、机构共现图谱、关键词共现图谱、关键词聚类图谱、关键词突变图谱等。[结果/结论]可视化地呈现了我国政策文本研究中具有影响力的作者及科研机构间的合作情况,通过分析关键词共现、聚类、突变情况以揭示政策文本研究发展脉络,并对研究方法、研究视角与研究领域进行总结。  相似文献   

18.
李保珍  苏菁 《情报科学》2018,36(10):13-19
【目的/意义】基于专业性多源网络数据,构建同质性或异质性领域知识图谱。【方法/过程】基于场景性关键 词相似度计算进行同质网络层次聚类,揭示症状的同质性网络层次以及治疗方案的同质性网络层次;基于 2-mode 共现矩阵进行异质网络聚类,兼顾症状及治疗方案的关联关系,通过设置不同阈值揭示其异质关联性网络层次。 【结果/结论】基于聚类纯度及熵值评价指标,实验结果显示:就纯度评价指标而言,进行同质性网络知识图谱分析 较为合理;就熵值指标而言,进行异质性网络知识图谱分析较为合理。  相似文献   

19.
【目的/意义】提出一种TF*IDF改进算法,用于全文分词后的语词权重计算,提取高权重语词,分析学科研 究热点。【方法/过程】以万方数据库中2015年《情报学报》的载文为例,对每篇文章全文分词,用改进的TF*IDF方法 计算语词权重。【结果/结论】发现该改进算法准确可行,且运用该方法分析得到,用户研究、大数据、情报学、社交网 络、技术领域、文献作者、突发事件、零被引等,是2015年情报学的研究热点。  相似文献   

20.
【目的/意义】文献的向量表示方法对文献主题聚合、聚类和分类等研究具有重要意义。基于二元共现信息 的潜在语义向量空间模型(CLSVSM)挖掘了文本信息中词与词之间的潜在语义关系,与文本向量表示的基本模型- 向量空间模型(VSM)相比很大程度上提高了文本聚类的精度。【方法/过程】为使CLSVSM能更优的提取文献的潜 在语义信息,本文在二元CLSVSM基础上进一步引入了三元共现信息,以深度挖掘文献的潜在语义,通过研究三元 共现矩阵的表示,三元共现频次和相对共现强度的计算方法,最终建立了加权共现潜在语义向量空间模型(加权 CLSVSM)。最后我们分别利用中、英文献数据对二元CLSVSM和加权CLSVSM两类模型进行了实验比较。【结果/ 结论】结果显示:新模型对英文文献的聚类效果与二元CLSVSM相当,但对中文文献主题聚类效果明显要优于二元 CLSVSM。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号