共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义] 知识域可视化是信息可视化衍生出的一个重要分支。基于图书情报学、科学学的研究方法,对知识域可视化研究成果中的共被引与耦合进行全面梳理,分析共被引与耦合在知识域可视化方法中的具体应用,总结知识域可视化的共被引与耦合新发展,引导和推动知识域可视化研究的深入开展。[方法/过程] 在界定知识域、知识域可视化和构建知识域可视化研究框架的基础上,对知识域可视化方法的共被引与耦合进行了归纳和总结,分析了文献共被引方法、作者共被引、期刊共被引、文献耦合方法、作者耦合方法这5种主要的共被引与耦合方法。[结果/结论] 认为以上5种方法是知识域可视化研究的主要方法,而多元引用方法、融合替代计量学的共被引与耦合代表了知识域可视化的新发展。 相似文献
2.
基于关键词和摘要相关度的文献聚类研究 总被引:1,自引:0,他引:1
现有的文献聚类方法都是通过文献关键词来进行的.本文在研究大量文献聚类方法的基础上,提出了一种通过文献关键词和摘要进行加权的新的文献聚类算法.首先,改进了传统相似度计算的方法,设计出基于关键词和摘要词加权的相似度公式,使文献相似度计算更加精确.其次,基于"文献距离越大,聚为一类的概率越小"的思想,提出了一种"最大距离聚类法",并给出了算法的详细步骤.最后,实现算法并进行了大量的实验仿真.通过改进相似度计算公式,调整关键词和摘要词的权重,提高了聚类的质量.结果表明,本文提出的文献聚类算法是一种行之有效的方法. 相似文献
3.
[目的/意义]期刊耦合分析是从期刊吸收知识的共性进行期刊研究的方法,由于来源知识的分散性使得期刊耦合分析的应用效果较差。为改善其应用效果,提出一种融入引文内容信息的期刊耦合分析法。[方法/过程]该方法通过提取代表期刊引文内容的特征词,并通过融合函数将其融入传统的期刊耦合分析中。以图书情报学17种核心期刊为研究对象,分别构建了融入引文内容信息前、后的期刊网络,对两种期刊网络进行多维尺度分布对比、块模型划分对比、核心-边缘结构对比。[结果/结论]结果发现,融入引文内容信息后期刊耦合分析的网络特征有了明显改善,其期刊分析能力得到显著提升。 相似文献
4.
基于MathML的非平直文本信息处理研究* 总被引:2,自引:0,他引:2
杨志芹 《现代图书情报技术》2008,24(3):68-72
针对在Web环境下处理图书馆文献信息中大量的非平直文本信息相对困难的现状,以MathML语言为基础,解决数学公式等特殊数据信息的输入与显示问题,实现信息的检索和利用,为数学公式等非平直文本信息在Web上的应用提供一种全新的解决方案。 相似文献
5.
传统的Web文本分类方法将文本中关键词的相似度作为分类的依据,丢失了很多重要的语义信息,导致分类结果不够准确且计算量大。基于此,文章提出了一种基于语义相似度的Web文本分类方法,利用领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量集,定义Web文本相似度的计算公式,设计并实现基于语义相似度的KNN算法。实验结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少了计算量,提高了分类精确度。 相似文献
6.
基于定量分析识别技术前沿并测度各国的技术差距具有重要的理论和现实意义。本研究初步探讨了基于专利数据,利用文献计量学的引文耦合分析法,进行技术前沿的识别和技术差距粗略测度,并以锂离子电池为例进行实证研究。研究结果表明,该方法所识别出来的中国、美国和日本在锂离子电池领域的技术前沿以及各国之间的技术差距,与产业现状具有一定一致性,是一条可行的研究途径。 相似文献
7.
基于定量分析识别技术前沿并测度各国的技术差距具有重要的理论和现实意义。本研究初步探讨了基于专
利数据,利用文献计量学的引文耦合分析法,进行技术前沿的识别和技术差距粗略测度,并以锂离子电池为例进行实
证研究。研究结果表明,该方法所识别出来的中国、美国和日本在锂离子电池领域的技术前沿以及各国之间的技术差
距,与产业现状具有一定一致性,是一条可行的研究途径。 相似文献
8.
技术机会识别对于研发组织的创新管理具有重要意义,本文以人工智能领域2013—2015年的专利数据为例,提出了一种识别领域内技术机会的新方法。借鉴RFM(recency,frequency,monetary)模型的思路,使用K均值聚类法基于平均出现时间长度、出现频率和组合能力三个指标对知识元素进行聚类,进而发现了能够反映领域内技术发展方向的四个趋势性知识元素。使用随机行动者导向模型对知识网络的演化进行分析,在此基础上提出了发现知识元素的新技术机会的公式,并使用该公式识别出了趋势性知识元素潜在的技术机会。本研究利用人工智能领域2016—2018年的专利数据验证了所提出的方法的有效性,应用3D打印领域2014—2018年的专利数据验证了所提方法的稳健性。 相似文献
9.
10.
11.
[目的/意义]以主题短语识别为研究对象,提出基于PhraseLDA模型的主题短语挖掘方法,为快速理解文本内容、准确抽取文本主题提供借鉴思路。[方法/过程]对低频词进行量化定义,提出一种合理的短语重要度计算方法,最终利用PhraseLDA主题模型推理出主题短语。[结果/结论]实验结果表明该方法在多种数据集中挖掘出的主题短语质量较高,主题一致性较强。 相似文献
12.
13.
[目的/意义]针对采用不同引证网络探测新兴趋势的问题,比较群体动力学方法用于直接引证网络和文献耦合网络上的效能差异。[方法/过程]首先构建并分析直接引证网络、文献耦合网络和同被引网络的特征,然后基于群体动力学方法对文献耦合网络进行实证研究。[结果/结论]对比以往的研究结果发现:群体动力学方法作用于直接引证网络进行新兴趋势的预测结果较基线方法为好,而在文献耦合网络中预测的效果并不比基线方法更佳。 相似文献
14.
《Journal of Informetrics》2022,16(2):101291
Bibliographic coupling (BC) and co-citation (CC) are the two most common citation-based coupling measures of similarity between scientific items. One can interpret these measures as second-neighbor relations distinguished by the direction of the citation: BC is a similarity between two citing items, whereas CC is that between two cited items. A previous study proposed a two-layer node split network that can emulate clusters of coupling measures in a computationally efficient manner; however, the lack of intralayer links makes it impossible to obtain exact similarities. Here, we propose novel methods to estimate intralayer similarity on a node split network using personalized PageRank (PPR) and neural embedding (EMB). We demonstrate that PPR is strongly correlated with the coupling measures. Moreover, our proposed method can yield precise similarities between items even if they are distant from each other. We also show that many links with high similarity are missing in the original BC/CC network, which suggests that it is essential to consider long-range similarities. Comparative experiments on global and local edge sampling suggest that local sampling is stable for PPR in node split networks. This analysis offers valuable insights into the process of searching for significantly related items regarding each coupling measure. 相似文献
15.
基于C-value与TF-IDF的文献簇主题识别研究 总被引:1,自引:0,他引:1
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一.引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征.本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法.实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别. 相似文献
16.
阐述作者关键词耦合和形式概念分析的基本原理,详细讨论在作者关键词耦合的基础上生成概念格的具体方法以及知识结构的建构过程。通过对该方法在某一科研组织中的应用举例,阐明该方法能够较好地揭示组织知识结构。与传统的共词分析方法相比,基于形式概念分析的作者关键词耦合分析方法层次化效果更清晰、人工干预程度更低。 相似文献
17.
18.
利用并发展针对单个汉字的构词能力和构词模式公式,计算词的构词能力和词的构词模式,并以此作为新词发现的规则,对科技领域做了新词发现和新技术发现的实验。通过对实验结果进行对比分析,证实该方法是有效的。 相似文献
19.
20.
[目的/意义]大数据环境下,用户的知识需求由分散向关联转变,利用多特征耦合可以辅助知识发现服务发现资源间的多种相关关系,从而优化知识发现服务。[方法/过程]通过分析文献内部和外部属性特征定义多特征耦合的概念,从功能角度出发,剖析多特征耦合与数字图书馆知识服务之间的关系,结合现有的知识发现系统构建多特征耦合架构,基于数据层-耦合层-服务层三层提出提升知识发现服务供给侧的方法。[结果/结论]数据层保障数据的质量,数据源由单一向混合转变;耦合层提升耦合分析效果,分析单位由粗向细转变,注重细粒度单元间的语义关联;服务层重视用户的交互体验,开发多维可视化功能。 相似文献