首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义]为了将大数据更好地用于循证决策,文章构建了循证决策视角下的患者健康主题分析模型。[方法/过程]首先使用LDA主题模型对高血压问答数据进行主题探测,并结合文献提炼出高血压八大主题;再次使用问卷调查法和层次分析法对主题探测结果进行评估;最后对得到的证据进行实践讨论。[结果/结论]文章对大数据和循证决策的结合做了尝试性探索,结果表明循证决策视角下的患者健康主题分析模型,具有一定的实用性和创新性。  相似文献   

2.
[目的/意义]探索基于Altmetrics的新兴主题探测方法,有利于弥补目前新兴主题识别的不足、推动知识服务与情报学学科发展。[方法/过程]从新兴主题特征出发,基于AAS(Altmetrics Attention Score)聚合分数设计新兴主题探测过程和指标,并结合第三方结果比较和指标验证等对构建方法进行检验和分析。[结果/结论]提出的新兴主题探测方法识别结果有效,并能较好地识别具有发展潜力的新兴主题。  相似文献   

3.
[目的/意义]从微观视角把握研究前沿主题在基金项目、论文数据中的关联关系,有助于准确把握科学知识生长中的研究前沿活动机理,对于研究前沿、新兴趋势识别和多源科技文献融合等工作具有一定的实践指导意义。[方法/过程]首先,利用LDA模型进行基金、论文研究主题探测;然后,综合新兴度、关注度指标和战略坐标图进行初始研究前沿判别,在主题扩散演化滞后效应测度结果基础上进行滞后修正的研究前沿识别;最后,利用ARIMA模型和Word2Vec模型进行研究前沿主题趋势预测分析。[结果/结论]以美国纳米农业领域为例进行了实证研究。研究发现,基金和论文在外部数量和内部主题特征两个层面都显示出一定的滞后性。文章对纳米颗粒在农作物代谢过程中诱导应激机制、用于绿色可持续环境及农业应用的纳米气泡技术、农作物吸收不同剂量下纳米材料的反应与机制等7个研究前沿主题发展趋势进行了预测分析。  相似文献   

4.
[研究目的]专利是技术信息的载体,以专利数据为研究对象,在产业链视角下进行技术主题提取及识别,从专利数据中识别新兴技术可以有助于把握新兴技术的发展动态。[研究方法]首先,根据产业链的概念和专利IPC分类号构建出产业链各个层级对应的专利集;然后,结合专利文本的特点提出EW-LDA主题模型,从词汇权重和语境两个角度对LDA主题模型进行改进,使用EW-LDA模型提取出产业链的各个层级中得技术主题;最后,根据专利文本及新兴技术的特点,从新颖度、热点度、关注度和增长率四个方面入手构建新兴技术主题识别指标,将技术主题分为新兴、热点、潜在、衰退和噪音五类。并在人工智能领域的专利数据上进行实验。[研究结论]结果表明,提出的EW-LDA主题模型具有更好的主题建模效果,产业链视角下的新兴技术主题识别方法可以有效的识别出新兴技术。  相似文献   

5.
[目的/意义]为减少医疗资源的浪费、推动患者更高效的针对性就医,提出一种基于在线问诊文本信息的线下就诊医院推荐方法。[方法/过程]首先,利用LDA主题模型对在线医院问诊文本进行建模,识别出其中的隐藏疾病主题,并以疾病主题代表医院诊疗优势。然后,根据患者所患疾病,筛选出具备该疾病优势下的医院。结合多种相关数据,运用熵值法确定各维度数据的权重。最后,使用TOPSIS计算该优势下每家医院的推荐指数,并将排名前五的医院推荐给患者。[结果/结论]以“好大夫在线”平台中的问诊文本作为实验数据集,进行验证。实验结果表明,本研究提出的推荐方法降低了单一维度和人为主观性对结果造成的影响,具有良好的推荐效果。  相似文献   

6.
[目的/意义]自国务院颁布《促进大数据发展行动纲要》以来,我国大数据产业经历了快速发展阶段,但新型冠状病毒肺炎疫情影响下国际形势发生新变化及数据正式成为新型生产要素后,给未来大数据产业发展带来了诸多不确定性,因此对我国现有大数据政策的主题分析及未来发展动向研判具有重要的现实意义。[方法/过程]文章从团队自建语料库中选取367条大数据政策作为样本,通过构建以政策发布时间和层级为纵轴,以主题聚类、主题词共现强度、主题相似度为横轴的二维分析框架来对我国大数据政策进行综合分析。[结果/结论]分析结果表明,未来我国大数据政策可能出现六大发展动向:数据安全将成为大数据政策发展的核心问题;大数据与各领域深度融合将成为政策发展新方向;关键核心技术研发与攻关将是大数据政策持续关注点;数据智能将引领军民融合的深度发展;跨领域的大数据人才培养将是政府关注重点;构建联防联控与应急管理协同机制将以大数据为重要支点。  相似文献   

7.
[目的/意义]利用知识图谱构建大数据驱动的社交网络舆情事件主题图谱,是网络舆情学术界和产业界关注的新问题,结合校园突发事件网络舆情进行可视化分析对推动社交网络舆情监控平台的构建具有一定的理论和现实指导意义。[方法/过程]文章在对知识图谱、社交网络舆情事件主题图谱相关理论进行分析梳理的基础上,构建校园突发网络舆情事件主题图谱中的实体、关系和过程模型,并结合"北京交通大学实验室爆炸"舆情事件进行可视化分析。[结果/结论]数据结果表明,政府官微在舆情引导中起到重要作用;可以从"故事线"和"时间线"两个方面对舆情事件进行可视化分析;高校舆情事件在爆发初期、事件调查进展期、事件调查结果期呈现不同的情感倾向;高校舆情事件的传播媒介在移动端和非移动端传播差异不大;舆情夜间传播活跃度高于日间。  相似文献   

8.
[目的/意义]文章旨在揭示不同层级政府针对新冠肺炎疫情的应急模式,纵向探究新冠肺炎疫情治理体系,对政府应急管理超前布局具有一定借鉴意义。[方法/过程]基于时空大数据演化技术,结合政策内部特征和外部特征视角揭示不同层级政府政策扩散特征,并通过可视化方法展示。在内部特征方面,通过主题挖掘分析政策时间维度和层级维度主题演变;在外部特征方面,从发文时间、发文部门、发文数量维度上构建政策扩散特征指标,实验以中央、湖北省、北京市政策文本为数据源开展。[结果/结论]研究发现,首先,不同阶段主题存在差异性,但在疫情防控、企业扶持主题上存在延续性;其次,中央政策具有指导性、宏观把控性,湖北省整体注重疫情防控、医疗救治和复工复产,北京市侧重企业扶持、疫情防控、政务服务;最后,同层级政府的政策扩散特征表现不同。  相似文献   

9.
[目的/意义]传统知识图谱的构建,通常使用海量数据进行实体和关系的抽取,不具备主题指向性,且难以满足观点深度挖掘,因此提出涉众网络分析理念以提供定题情报服务。[方法/过程]文章结合网络分析法和文本挖掘对涉众网络的概念进行剖析;将涉众网络的理念应用在技术竞争态势分析层面构建了专利技术竞争态势的多层网络分析模型。[结果/结论]选取区块链技术领域作为案例对涉众网络概念进行应用检验,同时对区块链技术竞争态势和技术瓶颈进行探讨,从而对未来技术发展战略给予参考意见。  相似文献   

10.
刘志辉 《情报探索》2020,(6):132-134
[目的/意义]对社会科学视角下Web主题结构挖掘研究的最新著作进行述评。[方法/过程]从数据采集技术、主题信息抽取和专题Web信息资源组织等方面,介绍了《学术Web主题结构挖掘研究》一书的核心内容,并点评了其主要研究贡献。[结果/结论]该书为宏观Web主题结构分析研究提供了系统化的解决方案,是近年来这一研究方向为数不多的专著。  相似文献   

11.
[目的/意义]用户间的专业知识异构以及用户场景的动态性,导致现有的目录式数据查询方式难以为用户提供主动式数据服务。文章针对用户在数据使用中的差异化专业知识进行识别和重组,作为连接用户和数据资源的中间知识库,以支持进一步的场景化数据互操作研究。[方法/过程]为实现这一目的,提出一套基于主题分析和语用情境融合的多义术语识别、建模方法,借助静态概念关系和动态语用情境构建术语知识库。主要研究内容包括:基于词频和词性构建文本向量空间;在领域知识不充足的情形下,提出采用主题模型半自动识别多义术语,并基于语用情境模型,在多义术语与其适用情境之间建立语义关联路径。[结果/结论]文章提出的一套基于主题分析和语用情境建模的多义术语识别方法,通过建筑工程领域的实例研究,证明该方法能够识别并解决用户之间的专业知识异构问题。  相似文献   

12.
[目的/意义]对比论文数据和专利数据的特征指标,识别热点、新兴、潜在和消亡研究前沿主题。[方法/过程]利用LDA主题模型,对智能汽车领域相关的论文数据和专利数据进行主题提取,计算两个数据源下各主题的强度和主题新颖度并进行对比分析。[结果/结论]本文识别出路径规划技术等热点研究前沿6个、智能计算等新兴研究前沿2个、安全认证技术等潜在研究前沿6个、车载平台等消亡研究前沿6个。本文在前沿识别方法上进行了创新,有效识别出领域内研究前沿并进行分类,为相关机构和研究人员提供借鉴。  相似文献   

13.
[目的/意义]预测社科领域在未来有发展潜力的研究主题对于科研工作者寻找新的学科增长点和政府部门优化资源配置至关重要。文章提出一种基于语义表示和动态主题模型的社科领域新兴主题预测框架,以期丰富和完善主题预测研究的方法体系。[方法/过程]首先,使用BERT模型和UMAP算法对文本进行语义表示和向量降维,再通过动态主题模型对嵌入向量进行聚类,从而获得全局主题;其次,构建新兴主题指标计算公式,基于Neural Prophet模型和非参数检验方法预测新兴主题;最后,通过划分时间窗将全局主题细化为多个局部主题,以定位最近时间段的新兴词汇。[结果/结论]选取“人口老龄化”领域的学术论文和报纸进行实证研究,并采用资料验证法进行方法有效性分析,结果表明该方法能够快速准确地预测社科领域中的新兴主题。  相似文献   

14.
[目的/意义]定量化、可视化地分析、总结健康信息领域研究主题演化特征,有利于把握健康信息领域整体的发展现状与未来发展方向。[方法/过程]利用Node2vec算法和LDA主题模型,从内部文本和外部引文两个维度进行健康信息领域研究主题扩张与收敛程度计算,然后利用科学、严谨的数学模型对研究主题扩张与收敛时序变化数据进行跟踪建模,结合模型构建结果对健康信息领域几十年来研究主题的动态演化规律进行总结归纳。[结果/结论]研究发现,健康信息领域研究主题的发展演变过程呈现出以下规律:健康信息素养从对健康信息的认可到利用再到评价的变化趋势,健康信息需求从专业集中性、单一被动性到多主体性、多层次性的变化趋势,健康信息行为从搜寻性到传播性再到评价性的演变趋势等。  相似文献   

15.
[目的/意义]识别学科交叉前沿主题并预测其发展趋势,有助于了解学科内部结构,挖掘领域重点部署方向,为未来创新性、突破性研究提供参考。[方法/过程]以美国国家自然科学基金项目及其产出论文分别作为前端、后端数据,首先,从三个维度测度项目学科交叉度,遴选领域学科交叉项目;其次,从主题关注度、新颖度等方面构建研究前沿主题识别指标体系,对学科交叉主题进行二次遴选,满足阈值的即为学科交叉前沿主题;再次,对比时间序列分析模型ARIMA和LSTM主题拟合效果并选择误差最小模型对学科交叉前沿主题进行趋势预测分析;最后,以生物科学领域为例对方法的有效性和可行性进行实例验证。[结果/结论]生物科学领域在纳米生物学技术、全球变化和海洋环境生物学、生物信息学及壶菌病与两栖动物多样性方面有较好发展前景。经专家咨询和已有研究对比分析,该方法可有效识别领域学科交叉前沿主题,并对其未来研究趋势走向有一定参考借鉴。  相似文献   

16.
[目的/意义]从知识流视角揭示研究前沿核心主题与发展主题知识吸收与扩散过程,分析其演变规律及关键节点,以期为研究人员深入开展前沿研究提供新视角和新思路。[方法/过程]首先,基于共被引理论获取研究前沿核心文献和施引文献集合,通过主题聚类识别前沿核心主题和发展主题两类知识节点;其次,对知识节点进行向量化表示,通过计算知识节点间相似度构建知识节点之间的关联关系,依据知识节点类型和节点关联关系识别研究前沿知识流动的6种类型;再次,利用EChart平台对主题演化状态进行可视化;最后,以“基因组编辑技术及其在农作物中的应用”研究前沿为例开展实证研究,并结合近年基因编辑技术研究内容、相关前沿发布情况验证方法的可行性和有效性。[结果/结论]实证结果表明,基于核心主题和发展主题,从知识流的视角对主题演化状态进行分析,能够识别前沿主题演化路径及发展的关键节点,有助于探索研究前沿可能的创新切入点,开展前瞻布局,把握前沿机遇。  相似文献   

17.
[目的/意义]研究了大数据环境下个体投资者的信息获取行为偏好,探索新媒体环境对个体投资用户的决策影响。[方法/过程]基于开放式股票投资在线社交网络(OSN)的视角,分析、确定个体投资用户的主要信息获取行为,以及影响个体投资决策的两个重要因素;通过问卷调查收集相关数据,提出研究假设,进行数据分析,并运用回归分析方法进行假设检验,分析个体投资者决策的信息获取行为偏好。[结果/结论]研究发现:不同个体投资者对信息获取行为的选择存在明显差异;并且个人分析能力不同的投资者的行为偏好存在差异;个性化推荐是对个体投资者决策具有较大影响作用的信息获取行为。  相似文献   

18.
[目的/意义]舆情反转现象频发消耗了网民的信任感,降低了网民在网络世界的安全感。基于舆情大数据对反转现象进行及时的分析识别,对营造健康安全的互联网舆论环境具有重要意义。[方法/过程]文章通过案例分析对舆情反转的特征与规律进行了归纳总结,并从主题演化角度出发,提出一种基于主题聚类模型LDA与门控循环神经网络单元(GRU)的舆情反转实时识别模型(DDPOR)。首先根据时间窗口采集实时文本数据,利用主题模型动态计算事件的当前言论较于先前观点的主题吻合度。随后结合文本时序特征,利用门控循环神经网络完成反转判定,实现网络舆情事件的反转预测。最后选取27个经典舆情反转案例开展实证分析,检验模型对反转的识别率与灵敏度。[结果/结论]实验表明,DDPOR可以及时地实现舆情反转的自动化识别,识别准确率高达90.54%,优于其他对比模型,且对网络舆情的实时监测与管控具有一定实践价值。  相似文献   

19.
[目的/意义]为了实现从非结构化的在线评论中有效提取用户需求,文章提出了数据驱动下产品需求识别的方法。[方法/过程]利用Word2vec表示学习方法,获取评论文本内容的语义向量表示;结合K-means算法和LSA模型实现评论文本聚类,识别产品需求主题;在此基础上,通过网络分析方法探索需求主题间的关联关系。以华为手机的评论数据为例进行方法验证。[结果/结论]结果表明,基于语义的文本特征可以取得较好的聚类效果,与传统方法相比,CH指标和SC指标均得到显著提高,验证了该方法的有效性。研究方法和结果能够为企业产品创新和运营决策提供一定参考。[局限]样本数据集规模不够,缺少跨平台实验计算和比较。  相似文献   

20.
[目的/意义]精准把握用户需求以引导企业高效开展产品创新,对企业实现可持续发展至关重要。对此,开展了用户需求导向下基于三级技术功效矩阵的产品创新机会识别路径研究。[方法/过程]首先,针对目标产品领域进行用户评论数据与专利数据的收集及预处理;其次,利用LDA主题模型对评论数据进行主题聚类以挖掘重点用户需求;再次,运用Stanford Parser自然语言处理技术从专利数据中提取SAO结构,从中识别技术词与功效词并分别进行主题聚类,以构建技术功效视角下的三级语义知识库;最后,以重点用户需求导航,并以三级语义知识库为数据源,构建三级技术功效矩阵,识别具有较高创新价值的产品创新机会。[结果/结论]结果表明,构建的产品创新机会识别路径能够为企业精准高效开展产品创新提供科学的决策参考依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号