首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
学术文献具有鲜明的文体特征,且部分特征能够用于网络中文学术文献的自动识别与检索,提高学术文献的相对检准率.本文分析了学术文献的部分文体特征,并调查了检索网络中文学术文献时的主要干扰文献--新闻报道的文体特征,从特有表述、平均句长、中西文字符比例三个方面,对两类文献的文体特征进行了分析对比.最后就本文的研究结果如何用于网络中文学术文献检索系统(NSIRS)进行了探讨.  相似文献   

2.
计算机科学学术文献具有独特的文体特征,且部分特征能够用于计算机科学网络中文学术文献的自动识别与检索,提高计算机科学学术文献的相对检准率。本文通过建立计算机学术文献语料库与IT新闻语料库,对计算机科学学术文献和IT新闻在特有表述、平均句长、中西文比例三方面的文体特征进行提取与加权,应用于基于百度的网络中文学术检索系统(NSIRS)中。结果显示,本研究提取并设定的文体特征能有效提高NSIRS对计算机科学学术文献的检索效率,从而证明发掘并应用特定学科文献独特的文体特征的意义。图2。表4。参考文献14。  相似文献   

3.
互联网上免费的中文学术资源数量庞大,但实用的专门检索工具仍然或缺.文章以网络中文学术文献的识别与检索为目标,调查分析网络学术文献网页的特征,并以非学术文献网页作为参照,验证所发现特征的可靠性.研究结果显示,学术文献网页在关键词词频、链接数量和相关链接比例等特征方面与非学术文献网页具有明显差别,差异程度都大于75%,属于程度明显,能较好地用于区分学术文献网页与非学术文献网页,为今后系统开发学术文献网页的自动化识别工具提供了依据和理论支持.  相似文献   

4.
[目的/意义]了解学术文献信息资源使用行为特征,对于提高硕士生学术文献信息资源利用能力、学位论文写作质量及图书馆文献信息资源建设水平具有重要意义。[方法/过程]通过构建学术文献信息资源使用行为分析体系,从个体、时间、单位三个角度定量地比较图书馆学硕士生的学术文献信息资源使用行为,并对其原因进行分析。[结果/结论]研究发现,不同高校、时间的硕士生在学术文献信息资源使用方面呈现出不同的特征。如期刊论文和中文文献使用最多,网络信息资源、学位论文、英文文献的使用数量呈现上升趋势,不同高校存在显著性差异。硕士生的教育背景、信息素养、外语能力以及研究课题,文献信息资源的数量、类型、保障情况与服务质量都会影响硕士生学术文献信息资源使用行为。  相似文献   

5.
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。  相似文献   

6.
学术文献特征表示,是学术文献搜索、分类组织、个性化推荐等学术大数据服务的关键步骤。研究表明,图神经网络能够有效学习文献的特征表示,然而当前研究主要集中在有监督学习方法上,不仅对数据集的大小和质量的要求较高,且学习到的文献特征表示与具体任务高度耦合。基于此,本文将四种无监督图神经网络方法引入学术文献表示学习,从Cora、CiteSeer和DBLP (database systems and logic programming)数据集的引文网络、共被引网络和文献耦合网络中学习文献的表示向量,并应用于文献分类和论文推荐两大下游任务。研究结果表明,(1)深度互信息图神经网络适合于文献分类任务,对抗正则化变分图自编码器则在论文推荐任务上性能更佳;(2)Cora数据集上的结果表明,相较于共被引和文献耦合网络,引文网络更适合于学习通用的文献表示向量。  相似文献   

7.
主题检索一直是信息检索系统也是信息检索研究的重点,但文献的非主题特征的研究与利用没有受到足够的重视.文献的非主题特征指与文献相关,但与其主题内容或语义没有直接或必然联系的特征.笔者尝试较系统地归纳文献的非主题特征,并基于信息需求研究、信息查找与利用行为研究的有关理论,分析非主题特征对于信息检索理论与实践的意义,并通过基于非主题特征的网络中文学术文献识别系统(NSIRS)的设计与评价,验证其可行性与效果,分析了当前一些信息检索系统的非主题检索功能与特色.  相似文献   

8.
通过分析研究网络学术文献的主要来源、常用文件格式及Heritrix的工作原理,制定基于Heritrix的网络学术文献获取方案,从种子站点选择或抓取任务配置、文件类型和大小过滤以及学术文献判定等方面对整体方案进行具体设计和分析,并搭建实验平台,编写相关程序进行实验以验证该方案的可行性,最后指出后续研究方向。  相似文献   

9.
2005年12月,国际标准化组织正式颁布了《ISO19005-1文件管理-电子文件长期保存格式第一部分PDF的使用(PDF/A-1)》(以下简称《PDF/A-1》国际标准),并作为电子文件管理中电子文件长期保存格式最新标准在国际上全面实施。一、《PDF/A-1》国际标准的基本概况1、PDF的基本概念PDF的英文全称是"Portable Document Format",中文直译为"可移植文件格式",但一般很少使用其英文全称或中文全称,而直接使用"PDF"(本文也用其简称"PDF",下同)。PDF是表达或显示电子文件的一种格式,采用PDF格式的电子文件一般称为PDF文件。PDF文件既可以直接由PDF格式生成,也可以由其他电子文件格式,如微软的Word格式、金山的WPS字处理格式等转换而来生成,甚至还可以由纸张、缩微胶片和其他载体的文件被数字化后加以转换而生  相似文献   

10.
[目的/意义] 对不同学术社交网络中不同学科用户的文献阅读差异进行分析,以了解在不同学术社交网络中的学科分布情况,掌握在不同学术社交网络中的学科研究热点。[方法/过程] 通过Altmetric. com获取24个学科的4 800篇热点文献,利用爬虫采集这些文献在Mendeley和ResearchGate的被阅读次数,再对文献进行内容分析,得到关键词,最后对比分析不同学术社交网络中文献阅读差异以及学科关注热点的一致性。[结果/结论] 不同学科的读者身份、读者所属领域具有显著差异,ResearchGate中的文献阅读次数普遍高于Mendeley,且社会科学等软学科的文献阅读相对优势更为明显,而物理学等硬学科的文献阅读相对优势较低。Mendeley和ResearchGate在地球与地理科学、化学和环境科学等学科中的关注热点具有较高的一致性,而物理学等部分学科中的关注热点表现出较低的一致性。  相似文献   

11.
丁洁  王曰芬 《图书情报工作》2014,58(15):135-141
在综合国内学术信息检索服务的现状和现有理论方法研究的基础上,以检索词推荐为研究对象,构建基于文献特征项共现网络的学术信息检索词推荐模型。模型包括基础文献存储模块、文献特征项抽取模块、文献特征项共现网络预处理模块、基于特征项的文献检索模块及检索词服务前端5个部分。利用实验验证基于特征项的共现网络用于检索词推荐的可行性,结果表明推荐模型结果与各检索项的检索词更具有相关性,推荐质量较好。  相似文献   

12.
针对目前大量研究机构和个人在网络上共享并定期更新其研究论文的情况,研究收集、跟踪这些学术文献信息使其成为图书馆网络数字资源有益补充的可能性,指出网络学术文献信息发布存在一定规律,并据此提出了一种能从互联网自动识别、抽取、组织这类学术信息并提供查询的门户架构。  相似文献   

13.
随着Internet的发展,互联网上的学术文献数量呈指数增长,很难为科研工作者所利用,因此亟需一种方法对海量的网络学术文献进行自动的搜集、整理、分类。在前期充分的实验论证后,设计实现一个海量网络学术文献自动分类系统,该系统使用模块化设计,包括学术文献自动抓取模块、学术文献词-文档矩阵处理模块、本体集成模块以及基于语义驱动的分类模块。实验证明,该系统可以有效地完成海量学术文献的自动抓取、处理和分类工作。  相似文献   

14.
[目的/意义]传统的关键词自动抽取将摘要看成一个整体,常以候选词的出现频次等非语义信息构建特征,并未考虑学术文献摘要中目的、方法、结论等各个结构功能语义蕴含的差异性。本文以中文文献为研究对象,探讨候选词所在的结构功能域对关键词抽取的影响和作用。[方法/过程]本文将文献标题和摘要文本共分为4个结构功能域,在传统的词频、词长、词跨度等基准特征上,融合了基于BERT的语义特征和结构功能特征,并以不同的特征组合方式,使用图书情报领域的中文学术文献,基于分类模型进行关键词自动抽取实验。[结果/结论]实验结果表明,融合结构功能特征后,关键词抽取效果整体提升了6.82%,证明了学术文献摘要结构功能的识别形成的结构功能特征对关键词抽取效果的提升有良好作用。  相似文献   

15.
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。  相似文献   

16.
文献题录数据和引文数据在传统文献计量研究中的应用存在着诸多的障碍和壁垒。随着自然语言处理技术的发展和学术文献全文数据特别是结构化全文数据的丰富,这些障碍和壁垒在不断被攻克。通过综述学术文献全文计量分析的相关研究成果,本文发现:学术文献的计量研究正在经历巨大转变——从聚焦于学术文献的外部特征到开始关注内容特征,从关注学术文献的句法特征到重视语义特征乃至语用特征。以引文内容分析为代表的学术文献全文计量分析研究发展突出,其他全文信息的计量分析工作也崭露头角。目前,全文计量分析中各个研究方向的发展程度参差不齐,部分研究方向尚处于萌芽阶段,相关研究的研究方法和数据仍待继续加强或丰富。未来全文计量分析研究需要多个学科的广泛参与和相互合作,出版商与学者应积极参与到全文计量分析研究中来;需要对学术文献进行更加全面的认识,从而推动全文计量分析向客体细粒度化、视角多样化、指标语义化和评价结果全面化等方向不断迈进,并促进全文计量分析与学术服务和学术评价工作的有机结合,使文献计量学能够更好地为学术活动服务。图4。参考文献157。  相似文献   

17.
学术社交网络用户行为研究进展   总被引:1,自引:1,他引:0  
[目的/意义]开展学术社交网络用户行为研究文献的引文分析,以了解该领域研究概貌,并归纳识别学术社交网络用户行为的主要研究方向及进展,为后续研究提出建议。[方法/过程]系统搜集学术社交网络用户行为研究文献,整理形成文献集,运用引文分析方法,统计出高频关键词、高被引文献和高被引作者,并进行定性内容分析,概述学术社交网络用户行为主要研究方向及进展,提出研究结论和建议。[结果/结论]学术社交网络用户行为研究主要集中在学术社交网络的采用情况、社会网络结构、使用行为模式、使用行为影响因素以及使用障碍5个方面,并在各方面取得了一定的研究进展,但存在研究不充分、理论支撑不足等问题。  相似文献   

18.
为弥补在传统学术交流领域中仅仅通过文章引用和期刊影响因子进行学术质量评价的局限性和时滞性,本文提出并构建了以引文指标衡量学术影响力和以altmetrics指数衡量网络影响力的加权模糊运算模型,认为该评价模型适用于对自媒体环境下的人文社科学术文献进行质量评价,从而能够从多个维度全面反映人文社会科学学术文献的真实状况和水准。  相似文献   

19.
采用开源软件Lucene、IKAnalyzer、Luke进行中文学术文献计量软件的开发实践。介绍该软件的实现框架、数据准备、索引建立、自定义SemicolonAnalyzer分析器中的关键实现代码,并对该软件的不同计量效果进行分析。研究的主要目的是利用开源软件降低计量软件开发的复杂度,为研究人员提供一种自行开发中文学术文献计量软件的可行方法。  相似文献   

20.
论文从四种主要交流途径分析了网络学术信息交流对图书馆文献传递的影响,并对网络学术信息交流和文献传递作对比分析,指出图书馆应顺应信息社会的发展潮流,合理利用网络学术信息交流来开展文献传递工作,更广泛地满足用户的文献信息需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号