首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
徐蕾  李庆  肖相泽 《现代情报》2018,38(6):157-164
[目的/意义]本文在已有的关于大数据政策研究基础上,分析当前国内的大数据政策的关注焦点与不足,为后续的政策创新提供参考借鉴。[方法/过程]以9个国家级大数据综合试验区2014年11月至2017年11月出台的政策为研究样本,综合运用扎根理论、词频分析和政策力度测量方法,确立政策关键词的权重,借鉴Ochiia系数得出关键词共词矩阵,利用可视化分析工具获取共词网络。并综合运用度中心性研究、聚类分析、多维尺度分析和社会网络分析方法研究网络的结点特征与网络结构。[结果/结论]发现现阶段我国大数据试验区政策重点关注金融财税对大数据发展的支持、大数据产业的集聚发展、基本的制度建设和基础设施建设、创新发展应用等方面。对于产业引导基金、核心企业培育、大数据的深层次应用以及外部技术的引进等方面存在不足。  相似文献   

2.
[目的/意义]科学数据已经成为数据驱动型科研的重要资料和产出成果,研究科学数据引用可以帮助追踪数据的使用状况、开展数据计量和评价、加速科研进程。[方法/过程]以生物信息学领域学术论文全文信息作为研究对象,利用规则抽取和人工标注形成了生物信息学引文分类数据集,对比评估6种深度学习模型与3种传统机器学习模型在数据集上的分类和识别效果。[结果/结论]实证研究效果显示,采用考虑语义和上下文特征的深度学习方法在科学数据正式引用识别任务中具有更优效果。[局限]未充分考虑数据类别不均衡问题。  相似文献   

3.
[目的/意义]科学数据已经成为数据驱动型科研的重要资料和产出成果,研究科学数据引用可以帮助追踪数据的使用状况、开展数据计量和评价、加速科研进程。[方法/过程]以生物信息学领域学术论文全文信息作为研究对象,利用规则抽取和人工标注形成了生物信息学引文分类数据集,对比评估6种深度学习模型与3种传统机器学习模型在数据集上的分类和识别效果。[结果/结论]实证研究效果显示,采用考虑语义和上下文特征的深度学习方法在科学数据正式引用识别任务中具有更优效果。[局限]未充分考虑数据类别不均衡问题。  相似文献   

4.
以Web of Science 1945—2019年科学史与科学哲学领域文献作为基础数据集,基于h核内参考文献共被引网络聚类,鉴别领域主要研究主题共5个;用高被引、高中介中心性以及历史根源三维度根基文献识别法,筛选出科学史与科学哲学领域中最重要的10篇根基文献,作为领域的核心知识基础。研究表明,科学史与科学哲学领域学者倾向于引用早期经典著作,符合人文社科的引用特征。  相似文献   

5.
孙海生 《现代情报》2019,39(4):134-142
[目的/意义]已有研究对文献耦合关系和同被引关系比较的研究较少,本文比较两种关系在文献间建立联系的差异,并且比较耦合/同被引强度与文献相似度的相关性,分析耦合分析和同被引分析各自更适合哪些方面的应用。[方法/过程]根据复杂网络理论,构建文献耦合网络和同被引网络,实证比较文献耦合网络和同被引网络的拓扑性质。利用QAP关联分析,研究耦合关系、同被引关系与文献内容相似度的关系。[结果/结论]网络拓扑结构分析表明,耦合关系在文献之间建立的联系更普遍而且更稳定,更利于检索被引用次数较少的大多数文献;同被引关系在高被引文献之间建立的联系更紧密,利于检索和确定领域内的核心文献。QAP关联分析表明耦合强度和文献相似度的相关性更强,在文献聚类分析研究主题时,耦合强度更可靠。  相似文献   

6.
[目的/意义]针对被引频次指标在学术论文评价中的局限性,提出基于多维度引用特征的学术论文评价方法,提高引文指标在单篇论文评价中的可靠性。[方法/过程]通过被引频次标准化消除学科、时间等因素的影响,作为频次指标;通过引用主体的重要性、引用时间跨度、引用强度、引用位置、引用情感、主题相似度6个维度的引用特征,区分不同引用中被引文献对施引文献的作用,作为特征权重;将频次指标和特征权重相结合,对学术论文进行定量评价。[结果/结论]改进基于引用的学术论文评价方法,有效解决被引频次指标对所有引用同等对待的问题。该方法的评价结果比被引频次指标更加合理,还能更细致地剖析论文的被引特征。  相似文献   

7.
史雅莉 《现代情报》2019,39(4):34-41
[目的/意义]对科学数据引用标准实施过程中的关键问题进行探讨,总结国外实践经验,为我国科学数据引用标准化提供借鉴和参考。[方法/过程]在对国内外科学数据引用标准进行全面调研的基础上,采用案例分析法,从数据引用服务的开展、数据引用标准实施指南的联合推行、数据引用系统的开发与应用及引用标准实施效果的反馈4方面深入分析澳大利亚ANDS数据引用实践。[结果/结论]通过调研及分析提出我国科学数据引用标准实施建议:便捷的用户服务、DOI技术的嵌入使用、系统化的数据存储与管理和广泛的业务合作。  相似文献   

8.
[目的/意义]有效融合引文网络中的引用关系和文本属性等多元数据,增强文献节点间的语义关联,从而为数据挖掘和知识发现等任务提供有力的支撑。[方法/过程]提出了一种引文网络的知识表示方法,先利用神经网络模型学习引文网络中的k阶邻近结构;然后使用doc2vec模型学习标题、摘要等文本属性;最后给出了基于向量共享的交叉学习机制用于多元数据融合。[结果/结论]通过面向干细胞领域的CNKI引文数据集的测试,在链路预测上取得了较好的性能,证明了方法的有效性和科学性。  相似文献   

9.
[目的/意义]通过对在线健康社区意见领袖交互行为的分析,探讨其识别、特征、影响和作用,为社区的良好运转和管理提供建议。[方法/过程]构建两级传播理论下的在线健康社区意见领袖模型,并以百度"自闭症吧"数据为例,结合社会网络分析方法研究社区整体网络特征、意见领袖个体网络特征和用户间交互网络。[结果/结论]百度"自闭症吧"整体网络中间密集,边缘稀疏,具有小世界效应;通过中心度分析及k核分析发现识别出的意见领袖各项个体指标数值均偏高,处在整体网络核心位置,有效连接信息传播两级,推动信息在来源层、意见领袖层和受众层间稳定流动,为其他用户提供帮助鼓励;验证了所建模型并根据研究发现提出两点针对性建议。  相似文献   

10.
[目的/意义]为了解我国教育学领域学者数据重用行为特征,帮助图书馆等机构在其科学数据管理和服务过程中制定更有针对性的数据服务策略。[方法/过程]本研究运用内容分析法对我国2017—2018年544篇基金论文中的科学数据重用行为进行分析。[结果/结论]研究发现,教育学领域学者数据重用比例较高且较为稳定,政府网站、数据中心及期刊论文是教育学领域学者重用数据的主要来源渠道,但存在着科学数据二次分析较少及数据重用不规范的问题。  相似文献   

11.
[目的/意义]语句层共被引的关系内容抽取与分类有助于揭示共被引论文间的主题关联。[方法/过程]文章从共被引主题的相似性和相关性出发,利用引用标注位置、作者、语义角色分析、句法分析等信息,将语句层共被引关系划分为同系列、同主题、发展关联、运用关联、并列关联,然后抽取相应的引用主题,构建<被引论文及主题,关系类型,共被引论文及主题>双层三元组,实现共被引关系内容结构化表达,并在Neo4j图数据库中呈现。[结果/结论]实验采用Athar引用语料库;结果表明,本文研究方法可提高语句层共被引网络中关系的可读性和共被引论文的语义搜索、问答与推荐的效率。[局限]实验方法针对英文文献而设计,未来将在更多领域的英文语料上进行验证,并从名词性关系识别、术语选择等方面完善关系内容抽取与分类。  相似文献   

12.
在SSCI的文献数据中,同一专著或文集类在被引用时题名、版本年份及作者名拼写存在着不一致的情况,为了使其具有一致性,本文提出了对引文数据进行预处理的方法。对文献数据进行文献和作者共被引分析,分别获得重要文献和作者的列表;对文献名和作者名按字母排序,找出同一文献不同的题名和出版年份以及同一作者名的不同拼写,利用“搜索”和“替换”功能对引文数据进行修改。经过对引文数据的预处理,共被引网络中的重要节点及其被引次数,以及共被引连线明显增多。对于著作和文集类被引文献占较大比例的社会科学研究领域,进行引文数据预处理有助于获得更客观的计量分析结果。  相似文献   

13.
[目的/意义]科学数据安全是国家信息安全的组成部分,随着数据科学研究的兴起,高校科学数据安全的政策研究有待深入。[方法/过程]采用网络调查的方法,对美国U.S.News前50名大学的科学数据管理内容进行分析,从“涉及对象”“保护方法”和“科学数据生命周期”等角度梳理政策重点和空白点。基于科学数据生命周期,从“制度层”“基础设施层”“数据素养层”和“实施层”四个主要层次,构建了高校科学数据安全的内容框架,并分别讨论了科学数据生命周期不同阶段与科学数据安全相关的各个主体的职责。[结果/结论]高校科学数据安全内容贯穿科学数据生命周期,相关主体包括制度层、基础设施层、数据素养层、执行层。  相似文献   

14.
毛璐  许鑫  邓璐芗 《情报科学》2023,41(2):126-134
【目的/意义】研究数据在科学研究中占据重要的基础性地位,高价值研究数据的引用对推动科学研究起着重要作用,因此如何评价出高价值研究数据并对此进行引证显得尤为关键。【方法/过程】本文从DCI近十年社会科学领域的数据集入手,确立研究数据评价指标和方案。【结果/结论】低被引数据集作者总被引频次与高被引数据集差距悬殊;高被引数据集具有数据作者篇均被引频次较高;基金资助数量较多;数据仓储机构的数据平均被引频次较高;关键词数量、操作方式较多;提供DOI号及元数据描述方式较详细等。为数据引证影响因素的分析带来一定启发。【创新/局限】得出数据引证行为的优化实施建议:促进评价体系多元化、培养数据伦理意识、规范数据引证形式、加强各个环节的数据治理。  相似文献   

15.
[目的/意义]在跨学科、跨领域的大数据环境下,情报学与数据科学交互与融汇发展日益明显,数据驱动知识发现已成为情报学新的学科生长点和应用支撑能力。因此,对军事数据科学理论框架展开研究,探索军事数据科学理论框架的构建方式是很有意义的。[方法/过程]文章阐述了开展军事数据科学研究的必要性,并在界定军事数据科学内涵与外延的基础上,分析了军事数据科学与统计学、计算机科学、情报学以及军事领域知识的关系。[结果/结论]通过理论论证,提出从要素—流程—价值三视角构建军事数据科学基础理论框架的设想。  相似文献   

16.
[目的/意义]分析社会科学数据集的跨学科性有助于理解数据集在不同学科的扩散规律,促进数据集在不同学科之间开放共享。[方法/过程]本文以CHARLS和CGSS数据集为例,首先对CHARLS和CGSS数据集的学科多样性与平衡性进行测度分析;其次构建CHARLS和CGSS数据集跨学科合作网络,采用Louvain算法对网络进行聚类,探测不同的研究社区,然后采用BERTopic对使用数据集的文本进行主题建模;最后构建不同阶段的跨学科合作网络,揭示CHARLS和CGSS数据集跨学科合作演化特征。[结果/结论]CHARLS和CGSS数据集的跨学科多样性和平衡性不断增长,使用CHARLS和CGSS数据集的学科均形成了以少数学科为主导,多学科共同参与的格局;使用CGSS数据集的研究主题比CHARLS数据集的相对较为分散;CHARLS和CGSS数据集的跨学科合作网络节点数、边数以及社区数在不断增长,网络密度有所下降,不同阶段的主导学科不断变化。  相似文献   

17.
【目的】对中国科技期刊论文的科学数据引用情况进行量化分析,探究我国科技期刊论文实施数据引用的效果,分析数据引用标准和科技期刊管理政策对数据引用行为的影响。【方法】以中国科学引文数据库收录的论文为基础,选取参考文献列表中的科学数据引用文本为研究对象,从引用基础特征、引用数据来源、引用元数据要素及数据类型3个定量维度和案例期刊对比定性维度展开分析。【结果】我国科技期刊论文科学数据的被引频次相对较少但近年来逐渐增长,各学科领域的科学数据引用倾向存在差异,科学数据引用格式与国家标准规范还存在较大差距,数据开放共享正在改变科研论文对各类科学数据的引用趋势。【结论】应增强科研人员数据引用意识,完善期刊数据引用细则,以学科领域期刊学会为单位细化引用规范,加强科技期刊与国家自主数据资源标识体系合作。  相似文献   

18.
【目的】 比较期刊和会议论文集的影响力差异以及二者的关系,探索期刊与会议论文集的混合共被引分析方法。【方法】 以计算机科学领域为例,从澳大利亚计算研究与教育协会的期刊和会议排名系统中获取A类期刊和会议组成的数据集作为研究对象,基于中国计算机协会的计算机学科分类对期刊和会议名称进行学科标注。从Scopus数据库中抽取出大型混合共被引关系。最后构建期刊-会议混合共被引网络进行共被引分析。【结果】 期刊与会议论文集倾向同类内引用;同一学科聚类不明显;会议论文集在核心共被引网络中具有更强中介中心性,期刊文献在总体共被引网络中具有更强的中介中心性。【结论】 期刊与会议论文集倾向同类内引用;计算机科学领域内各学科融合程度高;高水平会议论文集应纳入部分学科学术评价指标。  相似文献   

19.
彭贤哲  周海玲  石进 《现代情报》2023,(10):107-119
[目的/意义]多角度分析图书被引行为,可展现图书在学术应用场景的特点,提高图书关联评价、采购入馆的准确性和科学性。[方法/过程]本研究以南京大学图书馆G类中文图书为研究对象,采集书目数据、点击量、借阅量及其在中国社会科学引文库中的引文数据,从引用类型、引用规律、引用网络等方面,展现了图书的自引、跨学科引用、被引半衰期、知识广度、知识深度等各项隐性指标的分布特征及相关性,进一步剖析了图书采购、借阅行为的特点。[结果/结论]结果表明,当前读者借阅行为普遍缺乏方向感,图书馆优先采购涉猎广泛的图书,缺乏对图书知识深度及学界认可度的重视。为此,有必要在图书推荐和采购过程中纳入引文评价、关联指标,提升读者阅读体验,优化图书馆馆藏质量。  相似文献   

20.
[目的/意义]调研国内外科学数据集成的最新研究和实践进展,为促进我国科学数据共享的进一步发展提供参考。[方法/过程]将科学数据集成体系划分为5个分支:科学数据集成理论、科学数据集成方法、科学数据集成技术工具、科学数据集成模型、科学数据集成平台,深入评析每个分支的最新进展。[结果/结论]为了提高科学数据集成效率,应大力推进科学数据的标准化工作,制定体现科学数据共享特点的、完善的标准体系,推动实现科学数据全生命周期管理的规范化。为了科学评价科学数据集成的成效,需要推进科学数据集成评估研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号