首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 742 毫秒
1.
龚凯乐  成颖 《图书情报工作》2016,60(24):115-121
[目的/意义] 以网络问答社区为研究对象,提出基于“问题-用户”传播网络的专家发现方法,为建立用户激励机制、完善专家推荐方法提供借鉴。[方法/过程] 通过分析开放问答模式的特点,以“问题”和“用户”为节点、“答题关系”为有向边,构建“问题-用户”权威值传播网络,利用答案质量改进加权的HITS算法。[结果/结论] 提出的算法可以较好地兼顾用户的答题数量与答案质量,能够选择出活跃度高、知识渊博的用户作为专家。  相似文献   

2.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

3.
[目的/意义] 社交媒介不仅提供了用户间知识交流的平台,而且形成了知识复用的渠道。一部分社交网络用户在信息传播、知识共享等方面都能够对其他用户产生影响,称之为“小众专家”。对“小众专家”群体的研究对于社交网络中信息传播具有促进作用。[方法/过程] 以MetaFilter数据集为例,利用用户社交网络活动数据,生成用户关系网络,结合网络分析与时序分析筛选“小众专家”,分析“小众专家”群体在不同语义环境下的“稳定-迁移”特征,并提出评测指标,进行验证分析。[结果/结论] 结果显示:只有极少部分“小众专家”能够在多种语义环境下保持稳定性,而大部分“小众专家”只能在单一语义环境中保持稳定性。  相似文献   

4.
[目的/意义]在海量网络新闻和微博等新媒体文本中自动识别网络热点话题并抽取有意义词串来描述热点事件,对自动识别和描述网络舆情具有重要的研究意义。[方法/过程]在现有热点描述词抽取方法中,利用关联规则或多元词组合方法在抽取过程中存在噪音词较多和特征词语义被放大或转移等问题。本文提出一种基于复合词生成的描述词抽取方法,在所提取的语义更为精确的描述词集合上使用一趟聚类算法对新闻文本进行聚类,自动识别网络热点话题并对热点话题进行排名。[结果/结论]对腾讯新闻事件文本数据集所做的实验结果表明,本文所提出的方法较传统的词特征抽取方法在聚类结果上具有更好的话题簇识别能力和簇描述能力。  相似文献   

5.
领域前沿识别方法综述   总被引:1,自引:0,他引:1  
罗瑞  许海云  董坤 《图书情报工作》2018,62(23):119-131
[目的/意义]通过比较分析不同的领域前沿识别方法,总结各类方法在识别与预测前沿上的优缺点,为未来研究前沿的识别与预测提出改进意见。[方法/过程]通过综述国内外研究前沿相关的文献,辨析研究前沿的相关概念。分析目前主要的研究前沿识别方法,相较于传统的识别方法,重点对变革性研究前沿的识别方法进行归纳。总结当前领域前沿识别方法存在的主要问题,并提出改进建议。[结果/结论]就概念而言,对“研究热点”、“新兴研究”和“研究前沿”的概念内涵在时间和创新程度两个维度上进行了区分,依据创新程度的不同,研究前沿可以分为“常规性研究前沿”和“变革性研究前沿”;就识别方法而言,不同方法都有其适用场景。未来需要深入挖掘“研究前沿”,尤其要关注到主题之间的语义关联和多源数据的多元关系融合,以及对“变革性研究前沿”的前期征兆进行特征挖掘,并构建相应的识别与预测方法。  相似文献   

6.
[目的/意义]提出基于引文耦合和概念格的学科交叉知识结构探测方法。[方法/过程]利用Sci2工具获取情报学与计算机科学的学科交叉耦合文献,利用ConExp1.0工具构建两学科交叉知识概念格;通过概念格关联规则挖掘和层次聚类,将两学科的学科交叉知识结构细分为8个研究主题,揭示各研究主题的关联特征和对应的核心作者。[结果/结论]与传统的聚类树相比,该方法结合人类的认知规律描述概念与主题之间的关系,不仅具有较好的层次性可视化效果,而且意义更易于理解,具有更好的解释性。  相似文献   

7.
[目的/意义] 基于高维矩阵稀疏降维的思想,提出一种利用惩罚性矩阵分解(Penalized Matrix Decomposition,PMD)实现共词分析的新方法。[方法/过程] 以"学科服务"为研究主题,根据PMD算法原理,在Matlab环境下分别实现特征词的提取、特征词的软聚类以及聚类效果的可视化。[结果/结论] 与传统的共词分析方法对比,PMD算法在共词分析中具有独特的优势:提取的特征词比较全面,聚类数目便于确定,聚类结果易于理解。  相似文献   

8.
[目的/意义]事件自动识别抽取是当前典籍主题挖掘研究中一个新的重要课题,其中事件触发词的识别是一项基础的工作,本研究旨在探索古代典籍中事件触发词自动识别和分类的通用方法。[方法/过程]首先运用LDA模型对动词进行主题聚类,归纳典籍事件触发动词的分类体系;并依据聚类结果与分类体系,初步构建触发动词的种子词集。在此基础上,通过语义相似度计算,对种子词集进行扩展,构建典籍事件触发词语义数据集。在实验阶段,以先秦时期的重要典籍《左传》为例,对分类体系构建和种子词集扩展的方法进行验证。[结果/结论]结果表明,本文所提出的典籍事件触发词识别方法可行有效,据此构建的事件触发词集具有较高可信度,未来可进一步扩大实验的样本数量及范围。  相似文献   

9.
[目的/意义] 搜索引擎是用户访问网络资源的重要入口,识别用户搜索策略有助于发现用户搜索的认知规律,让搜索引擎更好地理解用户搜索。[方法/过程] 采用Microsoft顺序分析与聚类分析算法对用户搜索日志中的搜索时间进行分析,识别用户利用搜索引擎时普遍采用的搜索策略,并概括不同类型搜索策略的特征。[结果/结论] 用户在搜索中存在“快速消费”策略、“试探”策略、“探索”策略和“终止与确认”策略,不同策略在搜索时间、浏览次数、用户认知过程等方面表现出明显的差异。  相似文献   

10.
金碧漪  许鑫 《图书情报工作》2015,59(12):100-105
[目的/意义] 探究不同类型网络社区中健康主题特征分布,促使各网站平台能够更好地提供在线健康信息服务。[方法/过程] 以糖尿病为例,选取来自健康论坛的社会化标签和社会化问答社区的问答记录作为研究对象;通过数据编码和文本处理的方法,得到八大类主题,并比较两种网络社区中该八大主题分布情况的异同。[结果/结论] 两种网络社区中糖尿病主题冷热分布大体趋于一致。在最为用户所关注的主题上,两类社区各有侧重,分别是“诊断和检查”、“社会生活”。以上探讨和发现对在线健康信息服务质量的提升有诸多启示。  相似文献   

11.
[目的/意义] 针对目前全领域科学知识图谱构建方法中存在的技术难点,结合网络嵌入模型、机器学习聚类、流形学习可视化算法等人工智能领域的方法与模型,提出一套全新发现科学结构的知识图谱构建方案,以完善科学结构发现与可视化布局,并拓展科学知识图谱的分析应用场景。[方法/过程] 引入基于深度学习的网络嵌入模型和聚类方法改进原有的网络社团划分聚类方法,利用流形学习降维可视化算法扩大数据处理能力,并设计由下至上分层可视化布局方法,提升可视化图谱的稳定性与细节揭示能力。[结果/结论] 以科睿唯安公司的基本科学指标数据库(ESI)研究前沿中高被引论文作为分析数据集,使用新聚类算法得到1 169个研究领域,通过改进的可视化布局算法形成全领域科学结构图谱。与前几期科学结构图谱相比,本文提出的方法支持更大规模的数据分析,对可视化细节揭示与稳定性也有大幅优化,可以更好地展示全领域科学研究宏观结构及内在关系,为全领域科学知识图谱的绘制与构建提供更可靠的方法和技术支持。  相似文献   

12.
基于专利文献的技术演化分析方法研究   总被引:1,自引:0,他引:1  
在分析现有方法之不足的基础上,提出一种更完善的基于专利文献的技术演化分析方法:①采用分类号替代关键词作为专利文档聚类的基础;②采用基于语义的分类号-专利文档相似矩阵代替关键词-专利文档存在矩阵聚类;③采用更适合小样本聚类的系统聚类法。以石墨烯传感器技术为例,进行实证分析,绘制出石墨烯传感器技术层次语义网络图与技术演化图。研究结果显示,该方法可较好地应用于专利技术演化分析。  相似文献   

13.
孙海生 《图书情报工作》2016,60(10):123-129
[目的/意义] 传统共词分析的聚类算法存在以下不足:①关键词只能被划归一个聚类;②聚类过程对分类数目的确定缺乏严格判断标准。针对以上问题,采用复杂网络理论进行改进研究。[方法/过程] 采用连边社团检测算法对关键词进行聚类,以科学计量学为例进行实证研究。[结果/结论] 分析结果表明:算法对关键词的聚类结果有较好的改进效果,能够把核心度高的关键词同时划分到不同的研究主题之中,克服传统聚类算法的不足,而且划分密度可为聚类数目的确定提供客观判断依据。  相似文献   

14.
张晗  赵玉虹 《图书情报工作》2016,60(11):135-142
[目的/意义]针对共词分析存在的普遍问题,提出一种基于细粒度语义分析的共词网络构建与分析方法。[方法/过程]借助SemRep实现源文本主题概念及其语义关系的规范化抽取并由此构建语义共词网络,然后以节点的中心度和边的频次为指标对内容特征词进行抽取,利用UMLS语义网络规定的语义搭配模式,通过概念-语义类型-语义类型组的两级映射,对语义述谓项进行类团划分。[结果/结论]通过与常规共词分析方法比较,发现基于细粒度语义关系的共词分析能有效地揭示文本主题内容,利用UMLS语义网络资源能从语义学角度清晰准确地对语义共词网络进行类团划分。  相似文献   

15.
基于谱聚类的虚拟健康社区知识聚合方法研究   总被引:1,自引:0,他引:1  
[目的/意义] 改善虚拟健康社区知识聚合质量,为虚拟健康社区服务提供技术方法支持。[方法/过程] 运用谱聚类方法对虚拟健康社区中的知识进行抽取,利用概念相似度计算得到知识主题相似度矩阵,根据该相似度矩阵进行谱聚类。[结果/结论] 利用好大夫在线健康咨询平台发布的信息作为数据来源进行方法验证。结果表明,当聚类个数为5时,本文提出的方法得分值最高。通过谱聚类的方法充分挖掘虚拟健康社区潜在信息,改善了知识聚合质量,为知识聚合和知识服务提供了一条新途径。  相似文献   

16.
[目的/意义]传统的文献主题提取方法主要是通过关键词、摘要、全文等提取文献的主题内容,使得主题内容不全面或存在"噪音",而从文献内容语义出发,结合引用内容提取文献的主题,能够更加准确地提取出多文档的主题内容。[方法/过程]提出一种面向多文档的基于语义和引用加权的科技文献主题提取算法,利用文献的引用内容和关键词构建Labeled-LDA主题模型,形成文档-主题概率向量,再根据K-means聚类方法聚类文档,提取每类文档集的主题内容。[结果/结论]以PubMed生物医学数据库中的数据作为实验数据,测试该方法的可靠性,结果证明该方法能够准确、全面地提取出多文档的主题内容。  相似文献   

17.
[目的/意义]提出一种基于词频、词量、累积词频占比三者变化关系的共词分析词集范围的确定方法,尝试对现有词集范围选取方法中仅凭经验判断和过度依赖词频为“1”的关键词的问题进行改进,为相关研究提供一种更加规范、科学、值得借鉴的做法。[方法/过程]该方法充分考虑词集实际分布规律和特点,将词或词组分类成高、中、低频,并选择高、中频词共同作为共词分析的对象。[结果/结论]通过在具体领域的实例验证以及与其他方法的对比,证明该方法可以有效地选择合适的词集范围,对今后相关研究具有一定借鉴意义。  相似文献   

18.
[目的/意义]提出一个药物不良反应本体的半自动构建方法,构建的细粒度药物不良反应本体为利用社交媒体挖掘潜在的药物不良反应信号提供语义资源库。[方法/过程]首先,采用业务层次和语言层次相分离的设计理念,将用户在社交媒体中评论的药物不良反应表示成"对象要素-属性要素-描述概念"的形式。细粒度体现在社交媒体用户对药物同一不良反应描述概念表达的多样性上。然后,基于深度学习的思想,利用基于word2vec的描述概念候选词抽取算法自动地抽取出更多的描述概念候选词构建本体。[结果/结论]以糖尿病药物的建模实例表明,提出的细粒度药物不良反应本体的半自动构建方案,提高了本体构建的智能化水平,构建的细粒度药物不良反应本体为利用社交媒体挖掘潜在的药物不良反应信号提供语义资源库。  相似文献   

19.
[目的/意义] 为解决现有网页文本缺乏起源标注的问题,提出一种借助PROV本体发现相似网页文本起源关系的方法。[方法/过程] 通过聚类算法、自动语义标注和关联数据构建等技术的综合应用,结合PROV-POL溯源模型,检测网页文本实体的演变过程,实现文本级和属性级两级溯源方案。[结果/结论] 实验验证了借助语义网技术和数据溯源模型实现网页文本数据溯源的可行性,但实验过程中聚类算法的召回率有待提高。  相似文献   

20.
[目的/意义]作者共引网络分析(ACNA)是文献计量学中的重要分析方法,旨在通过寻找学术文献集合中作者之间的共引关系绘制出特定领域的知识图谱,进而指导科学研究。然而,ACNA的一个缺陷是其原始矩阵输入信息量过小。本文通过提出作者混合共引网络(HACNA),绘制更为精确的科学知识图谱。[方法/过程]鉴于不同种类的学术网络能为绘制知识图谱提供不同维度的信息,提高知识图谱绘制的精确性,本文以合著网络和引用网络为例,结合其他种类的学术网络在ACNA基础上进行精确科学知识图谱的绘制。[结果/结论]实证研究结果显示,与ACNA相比,HACNA绘制出的知识图谱在聚类过程中能够使得同类作者更为聚拢、不同类作者更为分散,从而提高了聚类效果和可视化程度。同时,HACNA绘制出的知识图谱还能够挖掘出更多细节。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号