首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于主题聚类的主题数字图书馆是针对某一个特定的主题,获取与该主题相关的数字资源集合(本文以文本资源为研究对象),然后再依据主题聚类算法,对该主题的信息资源集合进行聚类,生成可供用户浏览的多层次结构导航,结合全文检索实现基于主题聚类的主题数字图书馆系统.主题数字图书馆系统主要包括主题采集模块、主题聚类模块和数据集成模块,构建过程中主要涉及主题提取、主题聚类以及聚类结果描述等三类关键技术.表2.图1.参考文献20.  相似文献   

2.
提出基于Prefuse的主题知识图谱系统框架,通过对信息检索领域的关键词进行共词分析、层次聚类和TreeML文件转换,实现信息检索主题知识图谱的构建。最终将信息检索研究划分为5个主题:智能化信息处理、搜索引擎相关、用户行为研究、信息系统研究和基于内容的信息检索研究。  相似文献   

3.
网络问答社区的知识生态系统研究   总被引:1,自引:0,他引:1  
[目的/意义]通过吸纳知识生态学的理念来进一步完善网络问答社区的相关理论体系。[方法/过程]在前人的研究基础上,分析网络问答社区的知识主体、知识生态环境和知识生态链,构建出网络问答社区的知识生态系统模型,进一步从形成条件、动力和演化3个方面对系统的自组织机制进行深入探索,并以“知乎”为例对本文提出的知识生态系统进行验证。[结果/结论] 网络问答社区的知识生态系统将社区用户、用户生成内容和社区机制等有机结合在一起,从整体上揭示了网络问答社区的运行和发展。  相似文献   

4.
陈小卉  胡平  周奕岑 《情报学报》2020,39(4):450-458
社会化问答社区的出现改变了原有的问答模式并拓展了知识获取的途径。回答者作为知识的主要贡献者,是促进问答社区内知识传递的核心要素。现有关于问答社区用户的研究普遍以用户的属性数据为依据,较少考虑使用个体连接所形成的关系数据进行分析。本文以中文问答社区"知乎"为研究对象,爬取了"流行音乐"和"英语学习"两个话题下的大规模数据,通过构建回答者关注关系网络,定义和量化直接连接和间接连接两类同伴关系,使用网络自回归模型探究同伴效应对知识贡献行为的影响。研究发现,回答者的知识贡献行为会受到直接和间接连接同伴效应的正向影响,但是间接连接同伴效应会随着回答者网络密度的增加而逐渐减弱甚至消失,聚类系数对回答者的知识贡献行为有负向影响。  相似文献   

5.
融合多层次数据的问答知识图谱本体模型构建   总被引:1,自引:0,他引:1  
[目的/意义]针对基于问答对的智能问答准确率和解决率低、用户满意度差等问题,研究构建知识图谱本体模型,构建基于知识图谱的智能问答,解决基于问答对的智能问题所面临的问题.[方法/过程]首先,分析当前智能问答面临的问题及原因,提出构建知识图谱支撑智能问答的方案.其次,在已有本体模型构建方法的基础上,提出一种融合多层次数据的...  相似文献   

6.
从题名抽取关键词,把题名作为基于本体自动分类的文本主体,实现海量科技论文高效、精准地分类,已经成为图书馆事业发展的重要课题。本文利用文本内部词汇的语义关联特性,在高频词和隐含主题两个不同粒度层面,构建了基于BTM模型的题名信息自动分类方法:首先从细粒度层面进行词频统计,提取领域高频词;随后从粗粒度层面进行BTM模型分析,得到主题关键词;之后,将两者去重合并获得领域核心词集;最后,利用SVM算法进行文本分类。该方法有效地实现了知识的快速聚类和关联自动分类,为用户提供了满意度更高的知识发现及相关扩展服务。  相似文献   

7.
本文以社会化问答社区为例,探究疫情期间健康信息需求的主题与用户情感变化特征,以期改进问答社区在突发事件中的应急策略,通过数据采集和清洗、文本预处理、LDA主题模型、BERT+BiLSTM情感分类模型对25540条数据进行知识挖掘和主题-情感协同分析。研究结果显示,本文使用的方案能够有效捕捉疫情期间网民需求健康信息的主题特征。在情感分类方面,BERT+BiLSTM模型的分类准确率较基线模型提升了11.75%。为更好地应对突发公共卫生事件,本文建议社会化问答社区应自行生产科学的健康信息、提高针对主题的舆情监控力度并积极引导用户认知。  相似文献   

8.
金碧漪  许鑫 《图书情报工作》2015,59(12):100-105
[目的/意义] 探究不同类型网络社区中健康主题特征分布,促使各网站平台能够更好地提供在线健康信息服务。[方法/过程] 以糖尿病为例,选取来自健康论坛的社会化标签和社会化问答社区的问答记录作为研究对象;通过数据编码和文本处理的方法,得到八大类主题,并比较两种网络社区中该八大主题分布情况的异同。[结果/结论] 两种网络社区中糖尿病主题冷热分布大体趋于一致。在最为用户所关注的主题上,两类社区各有侧重,分别是“诊断和检查”、“社会生活”。以上探讨和发现对在线健康信息服务质量的提升有诸多启示。  相似文献   

9.
论文探讨利用R语言工具对图书馆新浪微博数据进行子主题聚类和挖掘,指出:在文本分词、构建词频——文档矩阵的基础上,使用Pamk算法和Kmeans算法进行微博聚类,获取图书馆服务质量评价与建议信息,挖掘图书馆核心微博用户,便于图书馆利用微博数据评估服务效果,改进服务质量。  相似文献   

10.
[目的/意义] 知识图谱已成为公共数字文化资源知识组织的新形态。利用知识图谱技术赋能红色历史人物知识问答服务,提升用户交互体验,对红色历史资源的开发利用具有重要意义。[方法/过程] 在梳理历史人物数字资源组织及知识问答系统相关研究的基础之上,构建了红色历史人物知识图谱Schema与KBQA架构,从数据获取、知识抽取、知识融合、图谱生成和知识问答五个环节搭建了红色历史人物问答模型,并以老上大历史人物数字资源进行实证研究。[结果/结论] 本文设计的知识问答服务架构在红色历史人物数字资源的图谱半自动构建、知识推理与智能交互方面具有优越性,提升了用户知识服务体验。  相似文献   

11.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

12.
林杰  苗润生 《情报学报》2020,39(1):68-80
专业社交媒体中主题图谱的内容包括论坛中的主题及主题之间的关系,其具有挖掘专业产品创新方向、构建专业知识索引等重要应用价值。本文基于深度学习技术与文本挖掘技术,提出了专业社交媒体中的主题图谱构建方法。首先,使用专业社交媒体中的文本训练Skip-Gram模型,利用该模型的隐藏层权重与模型输出的预测结果,分别获取词语间的语义相似度与上下文关联度。其次,基于该语义相似度与上下文关联度,对已有领域种子本体词汇进行扩充,将语义相似或上下文相邻近的词汇纳入本体词汇,为主题抽取提供高质量的领域词汇。然后,基于扩充的专业本体词汇,使用结合本体词汇的LDA主题模型从专业社交媒体文本中抽取主题与主题词。最后,利用语义相似度与上下文关联度,定义关联度权重,通过图模型与谱聚类,获取主题间与主题词的关联关系与层次结构。本文使用汽车论坛语料进行主题图谱生成实验。实验结果表明,本文方法获取的主题词纯净度相比单独使用LDA模型提升了20.2%,且能够清晰合理地展现主题之间的关系。  相似文献   

13.
[目的/意义] 学科主题演化研究有助于掌握学科发展现状、研究热点、研究前沿和发展趋势等情况,是进行科技创新的基础,是面向科技创新的重要研究方向。[方法/过程] 提出一种语义分类的学科主题演化分析方法:将关键词分为研究问题、研究方法和研究技术3类,构建不同语义分类的共词网络;然后基于Fast Unfolding社区发现算法识别具有语义特征的社区(主题);利用相似度算法计算相邻子时期主题间的相似度,构建学科主题演化图谱,以分析某学科领域研究问题、研究方法和研究技术的变化,实现深度、细致的学科主题演化分析。[结果/结论] 通过对2012-2015年CNKI数据库收录的我国大数据研究领域相关论文数据的处理分析,证明该方法的准确性和有效性。  相似文献   

14.
文章通过对时序高频词聚类,把情报学与计算机科学两个学科的交叉研究主题分为核心、新兴、衰退与稳定四种不同趋势变化的主题类型;通过对时序低频词聚类,预测两个学科的潜在交叉研究主题将会集中在新兴技术方法的应用、信息检索的深入研究和网络信息的有效组织、管理与利用三大方面.  相似文献   

15.
用户兴趣模型是个性化服务的核心,对用户兴趣的挖掘可以发现潜在的兴趣知识,提供更为优化的服务.本文将主题图技术与用户兴趣模型结合起来,研究了用户兴趣知识的主题图表示,并在此基础上运用无尺度图K-中心点聚类算法对构建的主题图进行深层次的聚类挖掘,建立了基于主题图的用户兴趣挖掘模型.在解释模型各个模块功能的同时,提出了该过程模型中的关键问题,并对建立模型过程中的无尺度图K-中心点聚类算法、文档中的主题图表示及主题概化和主题图合并等关键问题进行了深入的分析,最终构建了智能主题图,实现了过程建模和事物建模.  相似文献   

16.
网络问答社区利用Web2.0方式重建了人与信息的关系,对高校图书馆的知识共享、社会发展环境和"Living Library"推广产生影响。高校图书馆应吸收借鉴网络问答社区知识服务模式、重视隐性知识采购、参与问答社区服务平台,以满足社会网络环境下的用户知识需求。  相似文献   

17.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

18.
龚凯乐  成颖 《图书情报工作》2016,60(24):115-121
[目的/意义] 以网络问答社区为研究对象,提出基于“问题-用户”传播网络的专家发现方法,为建立用户激励机制、完善专家推荐方法提供借鉴。[方法/过程] 通过分析开放问答模式的特点,以“问题”和“用户”为节点、“答题关系”为有向边,构建“问题-用户”权威值传播网络,利用答案质量改进加权的HITS算法。[结果/结论] 提出的算法可以较好地兼顾用户的答题数量与答案质量,能够选择出活跃度高、知识渊博的用户作为专家。  相似文献   

19.
社区类问答网站以国外的quaro、国内的知乎、百度知道、新浪爱问知识人为大众所知,这类网站以问答的形式由网络用户提出自己的问题,然后由其他用户进行回答。这其中用户所产生的内容往往良莠不齐,网站通常有自身一套筛选机制对用户回答的答案进行先后排序、突出或隐藏。这样的筛选机制是根据什么条件来设立的,对用户产生内容又会产生怎样的影响?每个网站之间的筛选机制有何不同?笔者以知乎网为例,对知乎网话题与问答进行分类分析研究,以期探讨出对网络问答社区用户产生内容筛选机制现存问题与解决方法有所帮助的结果。  相似文献   

20.
基于图挖掘的文本主题识别方法研究综述   总被引:1,自引:1,他引:0  
本文通过文献调研分析,将基于图挖掘的文本主题识别方法总结为中心度方法、紧密关联子图查找和图聚类三种,后两者又细分为基于clique子团或类clique子团、基于图拓扑结构或结点属性聚类的方法。中心度方法通过对比文本网络中术语结点的重要度来实现文本主题的识别,紧密关联子图查找和图聚类方法则是根据文本图中术语结点和边的属性相似度来识别文本核心主题。基于语言文本网络自身特性,如何构建复杂文本关系图来同时揭示术语间的句法、共现和语义关系,如何基于术语关联和图拓扑结构识别其中的紧密关联子团,基于何种标准将紧密关联子团聚类以揭示文本核心主题,都是未来需要进一步深入研究的问题。表1。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号