首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
指出作为处理海量数据的有效工具,文本挖掘技术近年来在人文社科领域得到广泛重视。概述文本挖掘的相关技术和研究现状,介绍信息抽取、文本分类、文本聚类、关联规则与模式发现等常用的文本挖掘方法在人文社科研究中的具体应用,以拓展文本挖掘的应用领域,并为人文社科研究的方法创新提供新的思路。  相似文献   

2.
文本挖掘在人文社会科学研究中的典型应用述评   总被引:1,自引:0,他引:1  
调研文本挖掘在人文社会科学领域的应用现况,介绍国际上文本挖掘在这些领域应用的成功案例与经验,展现目前文本挖掘在人文社科领域的最新研究进展,给国内相关研究的开展提供一定的启示。  相似文献   

3.
数字人文中的文本挖掘研究   总被引:1,自引:0,他引:1  
概述数字人文的概念、研究内容和现状,指出文本挖掘方法是数字人文研究的一个研究热点与趋势。在综述文本挖掘在数字人文各个研究领域中的具体应用基础上,重点介绍欧美发达国家文本挖掘应用于数字人文研究的前沿实践,以期为我国人文学科研究方法与范式的转型提供借鉴。  相似文献   

4.
崔春  毕强 《图书情报工作》2014,58(24):99-105
关联爵士项目是一项探索关联数据在数字人文领域中应用的实验项目,主要关注如何利用关联数据提升文化遗产文献的可视性,即通过爵士历史的数字档案揭示音乐家之间的关系以及他们在爵士领域的社交网络.介绍关联爵士项目产生的背景、具体内容、开发步骤以及项目中的关键问题,认为其可以为我国关联数据与数字人文领域的结合研究带来一定的启示:采用挖掘实体关系为目标的研究路线与方法、最大化文本来源、发布中文名称规范关联数据、对现有本体进行选择和映射、利用众包方式开展文本分析工作.  相似文献   

5.
文本自动分词是非物质文化遗产相关数字人文研究的基础与关键步骤,是深度发掘非遗内在信息的前提。文章构建了国家级非物质文化遗产项目申报文本自动分词模型,探究了融入领域知识的机器学习模型CRF、深度学习模型Bi-LSTM-CRF和预训练语言模型BERT、RoBERTa、ALBERT在非遗文本上的分词性能,并对比了通用分词工具HanLP、Jieba、NLPIR的效果。在全部14种模型中,RoBERTa模型效果最佳,F值达到了97.28%,预训练模型中ALBERT在同等条件下训练速度最快。调用分词模型,构建了非遗文本领域词表和全文分词语料库,对非遗文本词汇分布情况进行了分析挖掘。开发了中国非物质文化遗产文本自动分词系统(CITS),为非遗文本自动分词及分词结果的多维可视化分析提供了工具。  相似文献   

6.
"数字人文"是当代信息技术与人文研究融合而形成的一个新兴研究领域,在国内,其理论构建和应用研究都在初步探索阶段。但随着研究的深入,数字人文必将对图书馆工作产生重要的影响。由此,作为数字图书馆建设重要组成部分的古籍数字化工作,应该充分占有数字人文研究成果,从文本挖掘、GIS技术、文本可视化和古籍语料库四个方面进行古籍数字化的深度开发。  相似文献   

7.
在近年信息处理与分析相关技术领域的进展中,文本挖掘是最引人注目的领域之一。文本挖掘是一个方法群,涉及统计学、自然语言处理、信息抽取、可视化等多项信息技术。同很多新兴领域一样,文本挖掘目前并没有统一的定义,没有完全一致的方法与模型,但是,Feldman和Sanger那个很笼统的定义:“可将文本挖掘大致定义为一个知识密集的过程,在此过程中用户与文档集合通过分析工具进行交互”,清晰表明了这种方法与信息分析的内在联系。  相似文献   

8.
文本挖掘工具述评   总被引:5,自引:0,他引:5  
简要介绍一些商业文本挖掘工具和开源文本挖掘工具,针对其中四款典型的开源工具进行详细的比较,包括数据格式、功能模块和用户体验三个方面;选取三种各具特色的工具就其文本分类功能进行测评。最后,针对开源文本挖掘工具的现状,提出几点建议。  相似文献   

9.
张蓓 《档案管理》2022,(2):68-70
数字人文的兴起为徽州文书档案开发利用提供了新的路径和方式.本文基于数字人文视野,分析了徽州文书档案开发利用的可行性,重点论述了文本挖掘技术、数据管理技术、GIS技术、VR技术等数字人文技术在徽州文书档案开发利用中的应用,并指出应通过建立数字仓储、搭建数字人文研究平台和项目委托开发来促进徽州文书档案开发利用转型升级的具体...  相似文献   

10.
面向TRIZ的领域专利技术挖掘系统设计与实践   总被引:1,自引:0,他引:1  
[目的/意义] 针对面向TRIZ的专利技术深度、精准挖掘的需求,设计并开发一套领域专利技术挖掘系统。[方法/过程] 首先,归纳面向TRIZ的专利技术挖掘的具体需求,分析现有工具的不足。其次,提出领域专利技术挖掘系统的体系结构,总结其关键技术及解决方案。最后,开发一套面向TRIZ的领域专利技术挖掘原型系统,并进行大口径光学元件(LAOE)领域专利技术挖掘实践。[结果/结论] 该系统基于SAO(subject-action-object)三元组与简单知识对象,集成文本挖掘技术构建细粒度、多维度的领域技术索引,实现领域知识棱镜、面向TRIZ的语义检索与专利可视化分析功能,可以支持深度、精准的专利技术挖掘应用。  相似文献   

11.
在数字时代,城市记忆资源建设面临着严峻挑战。本文以“数字人文”为研究视角,在探讨数字人文与城市记忆资源建设匹配性的基础上,用数字人文的理念与方法重新审视城市记忆资源建设模式,按照城市记忆资源体系构建、资源采集原则与方法、数字化加工与存储、资源数据库搭建的流程优化传统资源整合模式,最后提出基于文本挖掘、关联数据、GIS与虚拟现实、文本可视化等数字人文技术的记忆资源开发路径。  相似文献   

12.
The following case study describes two library-led text encoding projects involving correspondence collections. The first, a documentary edition of personal papers held by Peter Still, a former slave, was conceived as an independent research project involving the participation of two undergraduate research assistants; the second, based upon letters to and from the Rutgers College War Service Bureau (1917–1919), has been designed as a two-week text encoding unit in a proposed undergraduate course on data and culture. These two projects, both featuring the letter as their object of study, are compared and contrasted as models of data and process, affording reflections on the overlapping concerns of the library instruction and digital humanities communities of practice. I propose viewing text encoding projects, particularly those that focus on lesser known creators or on life documents such as letters, as a means of accessing both critical library pedagogy and digital humanities methodology. By developing such projects, librarians address a number of collection and instruction related objectives of the library, while offering a valuable introduction to a set of methods that are of increasing importance to undergraduate education. Furthermore, these projects may be conducted at smaller scales, by reusing and adapting methods and software shared by the digital humanities community, thereby limiting reliance on institutional partners for technology and infrastructure support, which may not be forthcoming in under-resourced institutional contexts.  相似文献   

13.
ABSTRACT

This article takes as its case study the challenge of data sets for text mining, sources that offer tremendous promise for DH methodology but present specific challenges for humanities scholars. These text sets raise a range of issues: What skills do you train humanists to have? What is the library's role in enabling and supporting use of those materials? How do you allocate staff? Who oversees sustainability and data management? By addressing these questions through a specific use case scenario, this article shows how these questions are central to mapping out future directions for a range of library services.  相似文献   

14.
本文从文本挖掘的定义着手,分析了文本挖掘的过程,包括文本预处理,文本知识发现,文本模式的评价以及文本模式的呈现,并详细介绍了文本挖掘在主动信息服务、信息检索系统、专利信息分析等方面的应用.  相似文献   

15.
ABSTRACT

The Internet has been the catalyst for the convergence of many subject areas and online platforms. Information professionals such as Archivists, IT developers and especially Librarians have been impacted in the development and promotion of digital humanities content for research, teaching, and learning in the modern academic library. In this case study, relevant findings from research that sought to determine the level of awareness of digital humanities in Irish Libraries is examined. The research project, The Mary Martin Diary, is highlighted as an example of a multidisciplinary collaboration project that utilized library communication skills, project management skills, digital humanities tools and techniques, as well as other online resources in its development. These skills and tools have the potential to be applied to similar projects that librarians engage in. Recommendations derived from this research highlight the practical application of skills for information professionals and their roles in the development and promotion of digital humanities content for research, teaching, and learning in the modern academic library.  相似文献   

16.
[目的/意义] 分析澳大利亚数字人文项目特征,总结澳大利亚数字人文项目概况,获取对我国数字人文的建设性意见。[方法/过程] 运用网络调查法和访谈法对澳大利亚数字人文项目开展情况进行分析,总结项目概况并梳理其发展阶段和各阶段代表性项目,按照研究方法和方向的不同进行分类,同时根据项目成果和影响力建立分析评价体系来获取有价值的特征,并据此讨论为丰富我国数字人文建设的理论和实践提供借鉴的诸多意见。[结果/结论] 澳大利亚数字人文项目整体阶段特征明显、意义显著,本文总结出其项目的社会服务、图书馆深度参与、创新合作共享等特征,针对我国数字人文提出加大投入、释放图书馆潜力和形成特色的主要意见。  相似文献   

17.
[目的/意义] 分析澳大利亚数字人文项目特征,总结澳大利亚数字人文项目概况,获取对我国数字人文的建设性意见。[方法/过程] 运用网络调查法和访谈法对澳大利亚数字人文项目开展情况进行分析,总结项目概况并梳理其发展阶段和各阶段代表性项目,按照研究方法和方向的不同进行分类,同时根据项目成果和影响力建立分析评价体系来获取有价值的特征,并据此讨论为丰富我国数字人文建设的理论和实践提供借鉴的诸多意见。[结果/结论] 澳大利亚数字人文项目整体阶段特征明显、意义显著,本文总结出其项目的社会服务、图书馆深度参与、创新合作共享等特征,针对我国数字人文提出加大投入、释放图书馆潜力和形成特色的主要意见。  相似文献   

18.
数字人文的发展与实践为人文学科带来了极大的挑战与机遇。图书馆可以为数字人文项目的开展提供丰富的资源,但我国图书馆参与数字人文的实践仍有提升空间。文章选择QS排名前10的美国高校图书馆开展的数字人文项目作为研究对象,调研其数字人文技术的利用、数字人文项目的设立以及跨学科合作、数字研究中心与奖学金的设立、利用数字人文进行馆藏展览与服务情况等,发现其具有技术运用全面、专题资源库丰富、学科交流密切、项目开展多元化和研究中心广泛成立的特点,能为我国图书馆开展数字人文实践提供启示。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号