首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 399 毫秒
1.
2011年二三月间,全球出版业的研究智囊之一出版研究协会(PBC)委托两位荷兰研究者Eefke Smit和Maurits van der Graaf进行了一项有关期刊论文内容挖掘的研究工作。项目访谈了29位内容挖掘研究专家并针对学术出版商展开问卷调查,最终就内容挖掘的发展现状、利益相关者、政策和趋势等问题做出了回答。所谓内容挖掘(content mining)是指为满足信息检索、信息提取或荟萃分析的需要而采用自动化的工具、技巧和技术来处理大量非结构化或非均一结构的数字内容。内容挖掘  相似文献   

2.
基于深度标引的专利文本挖掘框架研究   总被引:1,自引:1,他引:0  
专利文献中的文摘、权利要求项、全文等文本信息蕴涵了重要技术细节和技术保护等内容,从这些专利文本内容中挖掘具有技术价值、商业价值的潜在信息是当前专利信息应用领域的研究热点.文章研究将面向分析目标的专利文本深度标引应用到专利文本挖掘中,在数据预处理阶段就将分析目标作为知识抽取的基础,专利分析人员可依据分析需求,在文本挖掘时只提取标引结果的某一部分进行分析和处理,这不仅可提高专利文本挖掘的数据预处理质量,也可提高后期文本分析的效率.该文为<数字图书馆论坛>2008年第11期本期话题"科技创新中的专利应用研究"的文章之一.  相似文献   

3.
基于因特网信息的挖掘与评价研究   总被引:2,自引:0,他引:2  
基于因特网信息的挖掘和评价,是网络信息服务领域中的新课题,本文概述了目前网上基于Push技术、WWW文本信息的挖掘技术、联机分析处理的信息挖掘等三种技术的内容,并就其挖掘信息评价提出定性、定量的标准。  相似文献   

4.
文物科技类图书就是记录文物科技工作内容与成果的图书,其内容主要涵盖文物保护修复技术、文物科技研究、文物建筑测量与维修等.相关图书的出版情况,可以作为反映行业发展趋势的重要标杆.通过对文物科技类图书出版的整体趋势与具体特点的分析研究,不但有利于把握该行业图书出版的整体情况与未来趋势,而且还可以从侧面了解该行业的整体发展趋势与特点,为行业从业人员提供参考.笔者搜集了1981年至2013年正式出版的206种文物科技类图书的信息(包括作者、出版者与图书种类等)作为研究对象.  相似文献   

5.
当前媒介从业人员在信息选择中,面对经济利益和职业诉求的矛盾时的的态度与行为如何?本文通过对北京市媒介从业人员的调查,通过对他们在面对有偿信息、商业信息和政府信息等方面的处理态度和行为的描述和分析,认为媒介从业人员在职业中的经济行为尽管受到传播制度的影响,但与媒介组织的类型、媒介从人员的从业时间、职位高低和个人背景之间关系更为密切.  相似文献   

6.
基于文本挖掘机制的区域经济关系分析   总被引:1,自引:0,他引:1  
已有的经济关系研究大都采用实证的或单纯的计量学的方法来实现的.本文则针对非结构化的文本特点,采用信息抽取和文本挖掘方法挖掘用户感兴趣的区域经济关系是具有十分重大应用价值的研究课题.本文在探讨了基于实体关系的文本挖掘机制的基础上,对31个省、市、自治区的区域经济关系进行了分析.运用文本挖掘技术对经济关系的挖掘包括两种方式:一是基于属性的经济关系挖掘,利用信息抽取获取各个实体属性,采用聚类方法分析经济实体关系;二是基于相互引用的经济关系挖掘,首先构造经济实体关系分类词典,提出了实体关系标注算法,利用信息抽取获得实体之间的引用情况,然后构造关系有向图,从中挖掘区域经济之间的关系.研究表明,运用文本挖掘技术,既可以对各个区域经济发展状况进行分析和评价,也可以发现特定区域经济之间的内在关系.  相似文献   

7.
<正>大数据直接影响新闻信息的选择。借助大数据技术,可对相关数据进行深入挖掘、分析、整理,在此基础上形成的新闻报道会更具有说服力,更适合受众的需要。通过大数据技术汇集、处理、挖掘新闻,揭示信息之间的相关关系,使新闻认知贴近事件真相变得相对简单,这不仅更引起受众的关注,也大大提升了媒体传播影响力。可见,新闻内容及内容的真实是传播力构成的关键所在。大数据对优化新闻表现方式的积极作用不可低估。新闻内容以什么样的方式向读者呈现,报纸可以通过调整版面来达到,  相似文献   

8.
本文对我国档案用户三十年(1979-2009)来的研究状况进行了考察,对研究主题、研究人员、研究方法等作了描述,并分析了用户研究在内容与方法上存在的问题,通过反思与总结,以便促进档案用户研究在新时期的发展,更好地为档案信息资源开发与利用服务工作服务.  相似文献   

9.
Web站点用户浏览模式自动分类可以更好地组织站点上的内容信息来满足不同用户的访问需求.Web使用挖掘技术已经在这项研究中得到了广泛的应用,但是集成Web内容挖掘的成果还不多见.本文首先给出了结合Web内容和使用挖掘技术的用户浏览模式分类的原型系统框架.系统中主要的过程是:对数据集中原始的Web服务器日志进行清理,使用Web使用挖掘技术从用户浏览会话中挖掘出有代表性的用户浏览模式,根据模式中每一个相关的页面内容抽取出一个N-gram集合,构建基于N-gram的用户浏览模式简档.最后本文对用户浏览会话作了分类实验分析,实验结果表明这个方法在N-gram=6,df=10%的情况下取得了较高的分类精确度.  相似文献   

10.
Alfred P.Sloan基金会资助印第安纳大学的数据洞察中心60万美元对一个大型数字化内容馆藏——HathiTrust数字资源库进行第一次非消费性调查研究。"非消费性"(Non-Consumptive)研究是指研究人员不需要阅读任何纸质资料,所有工作都可以通过计算机来完成,所有资料都能检索或是挖掘。合作单位有HathiTrust研究中心(HTRC)和密歇根大学电气工程与计算机科学系。  相似文献   

11.
正一、档案数字化的含义和内容1.档案数字化的涵义。档案数字化,是将不同载体形态和记录方式的档案信息通过计算机录入、转化、处理等形式,把文字、图像、声音等信息转化为由0和1两位数字编码来表达一种综合性技术,即变成数字信号,然后存贮到磁盘、光盘等物理载体上的全过程。2.档案数字化的内容。档案数字化的内容分为两方面:  相似文献   

12.
在云图书馆环境下,网站可以通过关注用户访问路径、访问时间,利用Web挖掘的方法和技术对用户访问效益进行挖掘,以此来改进站点结构和内容,构建路径优化的模型,进一步实现个性化设计与服务,以提高用户访问效益和信息获取的整体效率.论文着重阐述站点优化模型和实现方法.  相似文献   

13.
基于文献计量分析的LED知识图谱及产业化对策   总被引:5,自引:0,他引:5  
LED照明是当前最具发展前景的高技术领域之一.本文运用文献计量相关分析方法对LED的历史文献进行分析,通过绘制多维尺度分析图谱和核心关键词关联知识图谱,挖掘当前LED的技术成熟度、研究热点和关键技术点等信息,得出LED技术目前主要集中宽带隙材料、发光类型及特性、有机发光和超亮度LED研发上;氮化镓(GaN)、电致发光(electroluminescence)、光致发光(photoluminescence)、白光(White LED)等在整个LED研究中处于中心和控制大多数信息流向的地位.最后,本文通过国别分析判断我国LED产业的实力水平,最终为我国的LED技术产业化发展提供建议.  相似文献   

14.
概述近20年来合作信息查寻与检索行为研究的主要内容,并分析存在的主要问题,结果发现: 该领域核心研究力量主要分布于北美与欧洲的图书情报领域和计算机支持的协同工作(CSCW)领域;研究样本主要选取学术科研人员与工程技术人员等富信息人员;以质性研究为主,采用多种数据收集与分析方法;研究内容主要涉及合作信息查寻与检索的内涵与类型、用户行为表现与特征、框架模型及影响因素等。通过分析目前研究中存在的不足,指出今后在合作信息查寻与检索行为研究中需要深入探讨的若干问题。  相似文献   

15.
本文研究了军事指挥综合决策支持系统的设计,综合运用了数据仓库、联机分析处理和数据挖掘等新的决策支持技术,通过建立数据仓库来存储海量战场信息(包括历史信息和实时信息),用联机分析处理、数据挖掘等技术来获取作战知识、作战规则及影响战争胜负的关键信息,为指挥员做出科学决策提供辅助。  相似文献   

16.
XML文档相似度计算方法研究   总被引:1,自引:0,他引:1  
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评.  相似文献   

17.
随着专利数据量的激增和新技术领域的交错重叠,迫切需要在专利信息分析中深化到内容层次,内容挖掘是其中的重要途径和必要手段。借鉴文本内容挖掘的思想和技术,提出基于内容挖掘的专利信息分析的方法体系,分别阐述方法体系中包含的专利文本信息预处理、专利信息内容分析和专利信息知识处理过程的主要步骤及其涉及到的各种技术和算法。最后,以混合动力汽车领域专利信息的内容挖掘为例进行实证研究。  相似文献   

18.
个性化知识服务中基于Ontology的用户兴趣挖掘研究   总被引:2,自引:1,他引:1  
个性化知识服务是知识经济时代信息服务发展的必然趋势,是满足信息用户多样化、专门化知识需求的高层次服务模式.用户兴趣知识的挖掘和用户兴趣模型的建立是个性化知识服务的重要研究内容.本文将Ontology技术与个性化知识服务结合起来,研究用户兴趣知识的Ontology表示,并以此为基础提出了一种动态的用户兴趣学习和挖掘方法,分析了该方法中参考Ontology的建立、用户兴趣知识的初步学习和用户兴趣模型的完善等关键步骤.研究结果表明,基于Ontology的用户兴趣挖掘可以较为准确地表示、跟踪和学习用户的个性化知识,实现隐性用户兴趣的发现和利用,满足用户特殊的信息需求,是一种提高个性化知识服务质量的有效方法.  相似文献   

19.
“博物馆信息学“札记   总被引:1,自引:1,他引:0  
一   博物馆信息学(museum informatics)一词近年来频繁地出现在有关博物馆的文献中.这是博物馆及其相关的文化教育设施大量使用信息技术的一种反映,是专业人员利用情报学(信息科学)的理论和知识来研究博物馆现象的结果.“博物馆为信息科学的专业工作者提供了一个独特的研究知识的积累、分析和传播的独特环境.“(1)信息技术在博物馆的广泛应用,新博物馆信息系统的建立更为这种研究增添了新的内容.因此,我们可以像生物信息学(bioinformatics)那样,将博物馆信息学定义为应用信息科学的理论、知识和技术来研究博物馆的科学.(2)……  相似文献   

20.
对目前微博信息挖掘技术中的微博内容挖掘及用户关系挖掘的研究情况及相关方法进行介绍及归纳,认为其中微博内容挖掘主要包括微博短文本挖掘、话题趋势检测、情感倾向性分析等方面,用户关系挖掘主要包括用户群体特性、用户社区发现、意见领袖挖掘及微博传播模式等方面;指出这些方法的局限性,并对微博信息挖掘的发展进行展望,以为进一步研究提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号