首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 347 毫秒
1.
一种基于词共现图的文档自动摘要研究   总被引:1,自引:0,他引:1  
耿焕同  蔡庆生  赵鹏  于琨 《情报学报》2005,24(6):651-656
本文提出了一种基于词共现图的文档自动摘要算法。该算法以统计方法为基础,又利用词共现图形成的主题信息以及不同主题间的连接特征信息,旨在能够有效地生成既全面反映文档的主要内容,又不受领域限制的文档摘要;同时该方法能动态地确定文档摘要长度。在实验评估中,该文档自动摘要方法取得了令人满意的摘要效果。  相似文献   

2.
[目的/意义]分析学科主题演化趋势,对科研人员研究学科知识、决策层规划学科布局都有重要意义.相比于词频分析法和共引分析法,共词分析法的优势是能深入文献内部,从微观角度揭示学科主题演化规律.分析中国国内基于共词分析法的学科主题演化研究现状,以期为相关研究人员提供参考和借鉴.[方法/过程]采用人工判读法提炼出基于共词分析法的学科主题演化研究分析流程的5个步骤,并对每个步骤中研究人员使用的策略、分析手段和工具进行归纳总结.[结果/结论]数据集的来源数据库主要有综合类、专门类和引文类等3种,检索策略有基于词、基于期刊和复合检索策略等3种;共词分析对象来源主要为作者关键词,关键词选取主要基于关键词词频、关键词共现词频和前两者相结合3个角度;构建共词矩阵时使用得最多的归一化系数为ochiai系数;最常用的主题演化分析手段为聚类分析和社会网络分析图谱;使用得最频繁的工具为SPSS软件.  相似文献   

3.
本文从SCIE中挑选出网络信息计量学领域的20个热点关键词构建共词矩阵,借助共词可视化方法绘制了以"Webometrics"为例的Pajek网络图,并依据可视化图中节点的大小与连线的粗细分析了网络信息计量学的六大研究主题.分别为学科范畴、理论基础、研究对象、计量指标、研究工具、应用范围,并根据可视化图判断出理论基础、研究对象等.属于热点研究主题.  相似文献   

4.
本文以内分泌与代谢学科领域中六种核心期刊在2003 ~2007 年发表论文的全部主要主题词的频次,生成高频主题词的共现矩阵,利用SPSS 做聚类分析得到该学科当前研究热点.在共词聚类的基础上,绘制出2003 ~ 2007 年研究热点的基本框架---战略坐标图,揭示了该研究主题的内外部联系并对发展趋势进行分析.此外,通过社会网络分析揭示了该研究领域的核心主题,并应用Netdraw 对共词矩阵进行可视化,展现每个高频词之间的共现关系.本文将科学计量学和可视化技术结合应用于学科分析,目的是直观地揭示共词网络中隐藏的信息或知识,为科研人员对学科发展方向的决策提供参考.  相似文献   

5.
本文从SCIE中挑选出网络信息计量学领域的20个热点关键词构建共词矩阵,借助共词可视化方法绘制了以“Webometrics”为例的Pajek网络图,并依据可视化图中节点的大小与连线的粗细分析了网络信息计量学的六大研究主题,分别为学科范畴、理论基础、研究对象、计量指标、研究工具、应用范围,并根据可视化图判断出理论基础、研究对象等。属于热点研究主题。  相似文献   

6.
共词分析方法理论进展   总被引:74,自引:1,他引:74  
共词分析方法属于内容分析方法的一种。其原理主要是对一组词两两统计它们在同一篇文献中出现的次数,对这些词进行聚类分析,进而分析这些词所代表的学科和主题的结构变化。有基于包容指数和临近指数的共词分析方法、基于战略坐标的共词分析方法、基于数据库内容结构分析的共词分析方法。公式5。图1。参考文献13。  相似文献   

7.
基于主题概念的多文档自动摘要研究   总被引:4,自引:0,他引:4  
文章叙述了一种针对大规模文档集的综合性自动摘要的研究与实践。首先利用HOWNET来计算文献主题概念的内聚度,在此基础上,处理文档之间的相关度以及各自在整个文档集中的主题重要度等特征;其次阐述了基于文档综合主题辞和综合优先度的多文档自动摘要生成原理。实验结果表明,该系统经过对新闻多文档集进行综合性分析,生成的能有效地反映重要的主题内容。  相似文献   

8.
共词可视化:以人类基因组领域为例   总被引:5,自引:0,他引:5  
周静怡  孙坦  陈涛 《情报学报》2007,26(4):532-537
为了解决由基于资源的第二代数字图书馆阶段向基于知识网络服务的第三代数字图书馆的过渡过程中在信息获取中经常存在的问题,使用户能够方便快捷地获取想要的内容,对某一个知识领域或学科的研究热点、发展趋势等进行了解,实现科学映射.本文以人类基因组领域为例,将共词可视化应用到学科领域分析上.根据该领域中出现的高频关键词之间的共词关系,形成共词矩阵和相似矩阵后,通过3种方法--战略坐标、网络图和自相关地图,生成相应的3种可视化结果,各有侧重地揭示了特定学科领域的研究热点和发展趋势战略坐标可以揭示出人类基因组领域的研究结构和发展趋势,网络图可以补充揭示每个研究热点关键词之间的关系及其在网络中的作用,自相关地图反映研究热点的自相关程度.探索了通过共词可视化,表达学科和知识领域的各热点之间的关系,揭示知识领域的结构,映射知识领域的发展趋势,促进信息获取,使知识结构更加明显,帮助用户达到他们的目的.共词可视化为研究知识领域的相关问题、实现科学映射提供了若干新的思路.  相似文献   

9.
一种基于加权网络和句子窗口方案的信息检索模型   总被引:1,自引:0,他引:1  
经典的信息检索模型在文档表示上多采用词袋模型,与此不同,本文提出了一种基于加权网络的信息检索模型.在这一模型中,文档被表示为一个加权共词网络,词汇在文档中的重要性通过词项节点在网络中的重要性加以衡量.基于固定窗口平移和句子窗口方案,本文提出了文本游走模型Textrank的四个检索模型变种,分别是Win_Weighted_Textrank、Sent_Weighted_Textrank、Win_Weighted_Posrank和Sent_Weighted_Posrank.在Reuter RCV1上的实验证明,与无权网络模型Textrank、Posrank相比,本文提出的模型能显著地提升检索效果.  相似文献   

10.
探测、识别某学科领域研究主题的演化过程并进行可视化分析,对于掌握研究现状和发展趋势具有重要意义。学科主题演化是一个复杂过程,存在多种变量,如主题强度、结构和内容等,目前研究主要以单一维度进行可视化分析,信息负荷过大,存在感知局限性。本文提出多维度视角下学科主题演化可视化分析方法:通过人工标注方法对  相似文献   

11.
本体论方法在文献型信息检索系统中的应用研究   总被引:1,自引:0,他引:1  
在研究本体方法应用于文献信息检索的基础上,对基于叙词表的领域初级本体的构建进行研究,对概念词相似匹配的检索要求进行语义上的扩充,通过与本体的交互对检索文档进行过滤,筛选出能更好匹配检索要求的文档。  相似文献   

12.
为了改进基于关键词的信息检索方法的局限性,论文研究了一种综合利用领域本体改善信息检索性能的方法.该方法强调通过交互式的方式引导用户一步步逼近其真实的、潜在的检索需求,使用基于编辑距离的词形匹配方法辅助用户查询本体词汇,使用基于概念空间的检索词联想方法帮助用户扩充检索词.使用基于领域本体的词义识别算法来确定文档中的词汇词义.使用XML技术实现用户查询需求和文档标注的规范化标注.实验表明,该方法会有效提升查全率并且会改进查准率.  相似文献   

13.
交互式跨语言信息检索是信息检索的一个重要分支。在分析交互式跨语言信息检索过程、评价指标、用户行为进展等理论研究基础上,设计一个让用户参与跨语言信息检索全过程的用户检索实验。实验结果表明:用户检索词主要来自检索主题的标题;用户判断文档相关性的准确率较高;目标语言文档全文、译文摘要、译文全文都是用户认可的判断依据;翻译优化方法以及翻译优化与查询扩展的结合方法在用户交互环境下非常有效;用户对于反馈后的翻译仍然愿意做进一步选择;用户对于与跨语言信息检索系统进行交互是有需求并认可的。用户行为分析有助于指导交互式跨语言信息检索系统的设计与实践。  相似文献   

14.
科技期刊多元化发展的研究热点问题分析   总被引:1,自引:1,他引:0  
科技期刊多元化出版的问题一直是关注和争论的焦点.本文用共词分析法,检索中国全文期刊数据库(CNKI)1990-2009年收录的以(科技期刊and数字化)or(科技期刊and网络化)or(科技期刊and多元化)为主题检索词的文章,用得到的可视化热点图谱分析科技期刊多元化出版的热点领域,以期为广大学者了解目前的研究状况和进一步研究方向的确立提供一定的依据.  相似文献   

15.
通过应用共现矩阵描述共现现象,利用基于共现矩阵的可视化技术定性的研究了学术机构科研活动,从而拓展了共现现象的研究内容。基于机构合作矩阵和机构-关键词矩阵的聚类树形图和多维尺度分析图可以用于分析机构的合作模式。机构-研究主题交叉图则可以用来考察机构在研究主题的参与情况。通过对可视化技术的深入研究,遴选了基因组学领域中发表论文数量较多的优势机构,分析了基因组学领域主流研究内容的轮廓与发展,并获得了这些机构所关注的研究主题和取得的科研成果。  相似文献   

16.
有效避免伪反馈的"查询主题漂移"主要需要解决两大问题,一是如何确定相关文档,形成较高质量的伪相关文档集,另一个是在伪相关文档集里如何挑选扩展信息.本文主要研究在获取了高质量伪相关文档集合的基础上如何有效进行XML查询扩展.针对XML文档的特点,提出了扩展向量空间模型的查询词扩展方法.实验结果表明,与初始查询和传统的词项扩展方法相比,该扩展方法更能获得与用户查询意图相关的扩展信息,更能有效地提高检索质量和性能.  相似文献   

17.
[目的/意义]为改善作者共被引分析(author co-citation analysis,ACA)在识别学科领域知识结构中缺乏内容信息的不足,将文献内容信息(题名、摘要、关键词)引入到作者共被引分析中,提出一种新的作者共被引分析方法,即"内容与ACA融合的方法(content and author co-citation analysis,C-ACA)"。[方法/过程]以"学科服务"主题领域为例,分别建立ACA作者相似矩阵Aij、作者-内容矩阵并转换为作者相似矩阵Bij;通过构建线性融合函数实现作者文献内容与ACA的融合;最后通过提取作者主题因子成分并在NetDraw环境下进行2-模图可视化,挖掘并呈现学科服务研究领域的知识结构。[结果/结论]与传统ACA方法比较,C-ACA方法能够更准确、更细致地挖掘和揭示学科领域知识结构。  相似文献   

18.
本文基于术语共现理论,利用形式概念分析中概念格的自动生成来推理作为属性的领域专业术语的层次结构并进行可视化展示,进而提出了一整套用于实现领域本体概念层次关系构建的解决方案,具体包括文档/词汇与术语语义关联的识别、领域形式化背景的建立、基于形式概念分析的主题概念的生成、基于主题概念格的术语层次关系抽取、术语层次体系的OWL描述和图形展示等.笔者以“白血病”领域为例,详细论证了无知识库支持环境下中文文本到医学学科术语层次结构的衍化过程,并对以文档术语矩阵(DTM)和词汇术语矩阵(WTM)为形式化背景生成的术语层次体系进行了比较分析.  相似文献   

19.
从创造力研究背景、方法、内容等不同方面入手,梳理团体创造力研究的发展演进过程,归纳来自心理学、社会学等不同领域的研究者对团体创造力研究的主要贡献。检索Web of Science数据库,收集2001-2011年间团体创造力相关研究的文献作者、摘要、参考文献等信息,运用科学可视化软件CiteSpaceⅡ进行团体创造力研究前沿、研究热点、主要研究学科和研究期刊的文献共被引分析,结合共被引分析结果,整理出国际团体创造力研究的发展态势、研究动向及其在各学科间的演进和研究发展轨迹,发现团体创造力研究以心理学和管理学学科方法和研究手段为基础,开始逐步向各学科交叉领域拓展。  相似文献   

20.
[目的/意义] 基于高维矩阵稀疏降维的思想,提出一种利用惩罚性矩阵分解(Penalized Matrix Decomposition,PMD)实现共词分析的新方法。[方法/过程] 以"学科服务"为研究主题,根据PMD算法原理,在Matlab环境下分别实现特征词的提取、特征词的软聚类以及聚类效果的可视化。[结果/结论] 与传统的共词分析方法对比,PMD算法在共词分析中具有独特的优势:提取的特征词比较全面,聚类数目便于确定,聚类结果易于理解。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号