首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
[目的/意义]文章对科技政策隐性扩散路径自组织方法进行研究,挖掘科技政策文本包含深层语义信息,将隐性知识显性化,为科研人员拓展和丰富政策扩散路径研究提供参考。[方法/过程]本文结合科技政策篇章文本的形式语义和内容语义两个方面对政策文本结构化处理和深度挖掘,对政策文本资源全解析,抽取科技政策文本中包含的特征,其中包括概念和关系自动获取与标引技术、网络表示学习,挖掘科技政策文本中的隐含结构信息,利用BiLSTM-CRF模型的深度学习方法实现概念的自动获取和自动标引关系。将得到多篇科技政策文本的概念和关系组成概念关系对的形式,借助于表示学习的方法发现每个节点稠密的向量表示。[结果/结论]通过实验验证,证明了本文借助隐性路径特征的科技政策扩散隐性路径自组织方法的有效性,在一定程度上拓展了政策研究的方法,为科研人员在政策扩散研究上提供了参考。  相似文献   

2.
[目的/意义]利用自然语言处理技术,研究一种从科技规划文本内容中自动构建研究前沿主题地图方法。[方法/过程]首先,利用自然语言处理领域中的信息抽取、主题识别等技术对科技规划文本进行主题挖掘分析,然后,利用Java语言开发相应挖掘工具,构建科学研究前沿主题地图,并进行可视化展示。[结果/结论]通过对碳纳米管研究领域的实证研究证明,该方法能够全面、快速准确的绘制出该领域科学研究前沿地图。  相似文献   

3.
张维冲  王芳  赵洪 《情报学报》2023,(3):289-303
现有政策智能处理技术缺乏对政策文本语料的深层关联与有效聚合,这一技术瓶颈导致政策文本资源知识复用困难,碎片化文本难以转化为系统性知识。本文以政策网络、全要素网络、知识聚合为理论基础,以知识图谱为技术框架,提出基于全要素网络构建的政策文本关联聚合技术方案。研究过程以16万余篇政策为数据样本,实现了政策文本的语义表示与识别、知识关联与聚合、政策网络构建、政策知识聚合,从政策主体、客体、目标、依据、主题等多维度揭示了政策间的高度关联性,并运用SARS和COVID-19案例进行了规模化应用检验,为推动政策科学更加有效地解决社会复杂问题提供借鉴。最后面向实际应用场景,设计了具备信息整合和网络多维分析功能的政策智能分析平台原型,为提升实践应用水平提供参考。  相似文献   

4.
2020年初COVID-19的突发对社会生产生活造成巨大挑战,也对政府治理能力提出重大考验。疫情期间的公众舆论在充分反映民众诉求的同时,也对政府治理起到重要的推动作用。现有关于疫情期间公众舆论的研究成果,大多从舆论的价值角度分析,缺少更深层次对民众诉求的挖掘。文章基于人民网《领导留言板》数据对新冠疫情期间民众对政府的诉求进行分析,通过隐含狄利克雷分布主题模型对民众诉求的主题进行挖掘,并分析各类主题的时空演变特征,以及演变特征与防疫政策的关联。研究发现,疫情期间民众诉求的主题可以归纳为5类:社区管理、医疗防疫、学校教育、交通物流和经济措施,不同主题的热度在时间和空间上具有明显差异,这种差异与疫情发展有关,也与不同时间发布的防疫政策相关。对民众诉求主题及其与政府政策关系的研究,可为政府部门今后应对重大公共卫生事件提供借鉴。  相似文献   

5.
公共数据是指国家机关、事业单位、经依法授权具有公共事务管理与公共服务职能的组织在履行职责过程中收集和产生的各类数据,对其进行收集、处理、共享和开放等多途径治理是发挥数据要素作用的重要保障。本文通过分析我国公共数据治理政策发展变化的特点、内在规律和基本趋势等为公共数据治理政策的完善和创新提供参考依据。在全面搜集我国公共数据治理政策文本基础上,运用统计分析和文本挖掘等方法对政策文本形式与内容特征进行抽取和分析,重点对数据治理政策的高频词组与主题内容变化、关键线索词分布等进行了分析。研究结果发现,数据治理政策客体对象在发展演变中不断变化,其覆盖的主题内容范围明显扩大;在数据治理政策中开始关注有关主体的权利或权益保护;数据治理政策更加关注数据开发利用和数据对经济社会发展的作用。  相似文献   

6.
为充分把握第四次工业革命的历史机遇,世界各国必然会瞄准战略科技领域,以一批关键技术为抓手,推出一系列的政策、战略、规划、计划和具体举措,推动科技进步和变革,在第四次工业革命中占据先发优势。本文以世界主要国家近年来发布的科技政策战略、前沿研发等重要动态新闻文本为分析对象,采用NLP (natural language processing)、文本挖掘、科学计量学等方法,揭示第四次工业革命中各国关注的重点领域技术和举措。研究结果发现,世界主要国家重点关注生物与农业、材料、航空航天与空间、数字与通信、能源、海洋、传统制造业等科技领域,积极布局量子计算、人工智能、再生能源、纳米技术、基因技术等关键技术,并采取投资计划、合作研究、政策研究和研究项目等发展举措推动上述科技领域和关键技术的发展。本文从动态新闻文本挖掘出发,梳理了第四次工业革命中世界主要国家布局的关键领域技术和重点举措。从理论意义上看,拓展了NLP、文本挖掘和科学计量学在科技政策研究中的应用场景;从实践意义上看,为我国布局第四次工业革命战略科技领域和关键技术、实施相应发展举措提供情报参考。  相似文献   

7.
[目的/意义]借助信息扩散研究方法,对伴随文化内容传播的社交媒体热点这一特殊类型事件中的民族文化演化扩散规律进行探究,为解释民族文化扩散规律、推动民族文化传播提供新视角。[方法/过程]以微博平台“丁真事件”发布文本为数据来源。基于LDA主题模型、民族文化符号识别与情感分析构建主题—民族文化符号—情感关联网络,对热点事件中不同主题传播伴随的民族文化演化扩散动态进行情境还原。量化不同类型用户的民族文化传播影响力,探究热点事件中不同主体的民族文化传递接力过程。[结果/结论]结果表明,从主题—民族文化符号—情感关联网络构建与传播主体影响力两大层次分析社交媒体情境下民族文化扩散路径规律,可帮助人文学者精准把握文化传播细节及其动态交互特征。  相似文献   

8.
[目的/意义]借助信息扩散研究方法,对伴随文化内容传播的社交媒体热点这一特殊类型事件中的民族文化演化扩散规律进行探究,为解释民族文化扩散规律、推动民族文化传播提供新视角。[方法/过程]以微博平台“丁真事件”发布文本为数据来源。基于LDA主题模型、民族文化符号识别与情感分析构建主题—民族文化符号—情感关联网络,对热点事件中不同主题传播伴随的民族文化演化扩散动态进行情境还原。量化不同类型用户的民族文化传播影响力,探究热点事件中不同主体的民族文化传递接力过程。[结果/结论]结果表明,从主题—民族文化符号—情感关联网络构建与传播主体影响力两大层次分析社交媒体情境下民族文化扩散路径规律,可帮助人文学者精准把握文化传播细节及其动态交互特征。  相似文献   

9.
当前文本主题获取方法大多依靠单一关联分析,不能全面分析可获取信息,难以准确获取科技发展主题。科技文献的主题词、作者和引文之间蕴含了以研究主题内容为纽带的语义关联关系,主题词共现关系、引文关系和合著关系分别从不同的角度展现了主题关联关系。因此,本文根据主题词之间语义关系距离的远近,将主题识别中主题词关联分为基础关系、强化关系和新增关系,在此基础上提出面向主题识别的多元关系抽取及关系融合方法;并以基因工程疫苗的研发与制备领域为例进行领域实证分析,利用PathSelClus算法实现基于多元关系融合的主题聚类,通过对比实验证明多元关系融合可以有效提高实证领域的文本主题聚类效果,而未来多关系融合主题识别则是需要重点关注的问题。图4。表6。参考文献19。  相似文献   

10.
[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。  相似文献   

11.
基于对四川省科技活动机构、科技人员状况、科技人力资源与活动经费的投入、科技成果产出以及科技 成果转化等方面的统计比较,分析四川省科技成果转化的现状,指出四川省科技成果转化过程中的问题,并提出相应 的对策和建议。  相似文献   

12.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

13.
陈瑶榕 《新闻世界》2013,(12):152-154
科技新闻是对科技成果、科技事件、科技人物等进行的报道,担负着向公众普及科技的责任。科技新闻包含着人文色彩,科技新闻人物包含着人文情怀,科技发明的目的是为人服务的,科技新闻报道是培养理性的人的重要途径。在人文主义的视角下,从事科技新闻报道应该挖掘科技人物的人文精神,揭示科技成果的人文意义,实现科技新闻的人文传播。  相似文献   

14.
[目的/意义]描述国家层面政府数据开放共享政策文本的形式和内容,反映国家政策的概貌,并指出当前政策存在的不足。[方法/过程]采用内容分析法对国家层面的政策文本进行分析。通过搜索引擎、专业数据库和政府门户网站检索政策文本,经数据清洗获得有效样本112份。利用Nvivo10对政策文本进行编码,归纳主题内容;利用Excel表格进行描述性统计,计算频次及百分比。[结果/结论]研究发现:我国政府数据开放共享政策起步较早,2015年开始政策数量迅猛增长;初步形成了贯穿数据生命周期的政策框架;国家各部门的政策为国家顶层设计奠定基础;国家在网络安全、基础设施、跨部门统筹等方面成绩斐然。但仍存在不足,表现在:政府数据开放共享的政策体系尚未形成;政府数据及其元数据缺乏统一的组织描述规范;数据创建与汇交、数据归档与保存和数据监管是薄弱环节;政府与公众互动的政策需扩展深化;政府数据开放共享全过程的质量管理政策有待建立;个人隐私保护政策需进一步具体化;政府数据知识产权政策亟待建立和完善。  相似文献   

15.
[目的/意义] 在科学研究中,从不同来源的科技文献中识别挖掘科研热点对于开展科研工作具有指导意义。旨在通过本研究提出的模型方法,快速准确地识别蕴含在多源文本中的热点主题,为科研创新提供支撑服务。[方法/过程] 提出一种基于LDA2vec模型的多源文本下科研热点识别的方法并针对科研热点识别构建模型,该方法融合LDA主题模型对隐含语义挖掘的优势和Word2Vec词向量模型对于上下文关系把握的优势。以机器学习领域的科技文献为例,利用模型困惑度和主题一致性两个指标对LDA2vec的在本领域应用的可行性和有效性进行验证,并与LDA的主题提取效果进行对比。[结果/结论] 实验结果表明,提出的方法在面对多源数据情况下,进行科研热点识别挖掘是可行的,且在一定程度上有效果的提升,对利用单一数据源进行主题分析的不足进行补充,对多数据源融合的实践应用进行丰富。  相似文献   

16.
[目的/意义] 大数据政策是大数据应用和发展的推动力量,其价值取向分析可以为我国政府大数据政策的制定、执行和评估提供借鉴,为大数据政策未来的发展方向提供依据。[方法/过程] 收集国务院及其各部门门户网站发布的政务大数据政策文本共计58份,运用主题分析方法对政策文本中表达政务大数据价值取向的主题进行编码分析,编码过程以NVivo12软件为辅助工具。[结果/结论] 通过主题分析,构建大数据政策价值取向总体框架,框架总结政治、经济、社会、生态与科技5个维度的价值取向,并探讨各维度及其具体价值取向间的交互关系。  相似文献   

17.
[目的/意义]旨在研究科学计量方法在科技政策研究中的应用程度和范围。[方法/过程]对科学计量领域与科技政策领域的实证数据集进行关键词分析,设计二维词频分析框架,并在此基础上通过聚类分析揭示不同类型的计量与政策研究相结合的主题。[结果/结论]数据结论显示:科学计量方法在科学政策研究中的应用主要是在宏观层面,而在微观问题层面应用相对较少;一些利用科学计量方法研究的政策问题并非是科技政策领域的研究热点或核心。这种情形与科学计量学的学科特点与使用局限性有一定的关系,但如何恰当扩展和深化科学计量方法在科技政策领域的应用,以解决科技政策中的具体问题、更好地支撑科技管理与科技决策,需要引起关注。  相似文献   

18.
贾君枝  冯婕 《图书情报工作》2017,61(12):122-128
[目的/意义] 挖掘不同名称数据之间的关联关系,将关于某一实体或主题的领域知识表现出来,这对实现不同层次、不同粒度的知识体系的解构和重构、提供满足多种需求的知识服务工作具有重要的研究意义。[方法/过程] 提出一种基于人物实体数据运行关联规则挖掘实验的研究框架,通过对人物实体条目的抽取、预处理及属性识别与分类等处理方法,利用R语言得到人物实体集的关联规则,实现多种名称数据的关联,最后从Wikidata知识库提取113位诺贝尔文学奖得主的实体条目进行实证分析。[结果/结论] 分析右部为地点名称、机构名称、时间名称和主题名称等4种不同类型规则的关联特征,实现不同名称数据类型的关系挖掘问题。本研究可为知识的揭示、聚合和关联提供新的视角,探索了数据挖掘技术在名称数据中的应用。  相似文献   

19.
针对面向结构特性的科技文献分类问题,通过关联规则的分类方法将科技文献划分为不同的类型:综述型、理论型和应用型。首先对科技文献数据分词等进行预处理;然后通过PredictiveApriori关联算法挖掘关于类别特征项的频繁项集,构造科技文献分类的分类器;接着对分类科技文献进行分类规则匹配,判定所属类别;最后通过实验对分类性能进行评估,并通过对比证明了本方法的有效性。  相似文献   

20.
选取网络文本资源的标题识别作为切入点,除考虑多数研究关注的文本的格式信息(如字体)、位置信息等特征外,加入对标题与网页正文内容的相关度的考虑,利用科技监测项目采集到的大量历史数据作为统计分析的基础,从候选标题的可能来源和特征方面,构建基于规则的网络文本资源标题快速识别方法,并给出该方法的时间效率和识别准确率测评结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号