首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 131 毫秒
1.
龚琳 《兰台世界》2009,(1):20-21
PDF文件格式是档案数字化的一种较理想的途径。不仅传统的纸质档案与各类型的数字档案可以便捷地转换为PDF文件,而且PDF文件的特点也很适合档案管理。基于PDF的数字文件的信息防护是一个较新的领域,当前基于文本格式、语义语法和格式化文本的隐藏算法研究已有一定进展。  相似文献   

2.
简述PDF信息抽取过程中采用的转换工具及抽取语言,简析PDFTOHTML格式转换后的中间文档,分析PDF科技论文首页元数据存在的问题,给出对以上问题的解决方案。  相似文献   

3.
PDF文件格式是档案数字化的一种较理想的途径.不仅传统的纸质档案与各类型的数字档案可以便捷地转换为PDF文件,而且PDF文件的特点也很适合档案管理.基于PDF的数字文件的信息防护是一个较新的领域,当前基于文本格式、语义语法和格式化文本的隐藏算法研究已有一定进展.  相似文献   

4.
基于计量分析的馆藏资源语义化理论研究   总被引:1,自引:1,他引:0  
目前的馆藏资源语义化方法存在一定的问题。本文引入信息计量学分析方法,结合语义网的相关理论和方法,构建了基于计量分析的馆藏资源语义化理论模型。通过对信息计量学和语义网进行理论和可视化应用的类比研究,发现:①信息计量学从定义、主要规律、馆藏资源元数据的关系研究到元数据的可视化展示都与语义网的理论、应用非常类似;②基于计量分析的馆藏资源语义化方法在语义关系深度、计算机自动处理程度、可重复性和实用性方面比基于元数据和领域本体的馆藏资源语义化方法更好;③把计量分析方法应用到馆藏资源语义化中,不仅可以提高馆藏资源的应用效率,解决基于元数据和领域本体语义化的不足,还能促进交叉研究和学科发展。图5。表3。参考文献10。  相似文献   

5.
XML文档的数据库转换技术研究*   总被引:3,自引:0,他引:3  
概述目前XML的几种存储方法,简单分析科技论文的文档类型,最后采用SQL Server 2000对PDF格式的科技论文经元数据信息抽取后所生成的XML文档实现具体的XML的数据库转换。  相似文献   

6.
针对现有元数据索引方法因其固有的缺陷而难以应用于复杂的语义网络,提出一种新的基于语义的元数 据索引查询方法。该方法以RDF图为数据模型,在路径索引的基础上,为元数据建立索引,并通过路径表达式实现元数据的查询。它能有效的促进领域知识的共享和语义表达,提高元数据的检索效率和查准率,为用户和应用提供语义查询和信息汇集能力。  相似文献   

7.
元数据互操作的逻辑框架   总被引:1,自引:1,他引:1  
元数据的互操作是分布式信息环境下信息发现的核心技术.文章在元数据的结构模型基础上,讨论了元数据互操作的层次、原型和语义语法的一致性.文章认为,语义的一致性和语法的统一性是元数据互操作发展的趋势,由于元数据抽象模型将元数据的语义语法描述置于同一个框架下,基于抽象模型的元数据互操作可能是一个值得探索的领域.  相似文献   

8.
针对现有环境信息元数据标准和电子文件元数据标准难以充分反映环境保护档案信息资源特点的问题,首先分析了环境保护档案的类型,提出了一种基于核心元数据的可扩展的环境保护档案元数据模型。接着研究了环境保护档案核心元数据及其扩展模式。以文件级环境影响评价档案元数据为例,最后阐述了环境保护档案元数据逐级扩展的方法与过程。  相似文献   

9.
电子文件管理元数据元素语义的结构化是表征元素语义构成部分及其关系的过程,目的是为了实现元数据元素语义结构的标准化.这种结构化主要包括语义结构化和语法结构化.元数据元素语义的结构化是最基本的语义结构化,是保证元数据基本元素和子元素理解的一致性、实现基本元素和子元素互操作的关键.标准化的元素语义结构有助于实现文件管理元数据描述电子文件的准确性,保证电子文件真实性、可靠性、完整性和可利用性,保证电子文件的法律证据价值.图7.参考文献4.  相似文献   

10.
标签形式的社会性语义越来越占据主导地位,使元数据界在这种新形式的信息内容表达和检索方面面临机遇和挑战。其中,主要的挑战是与标签相关的语境信息的缺失。以Flickr标签为例,对如何利用社会性语义资源来丰富主题元数据进行了实验。实验过程包含4个步骤:收集Flickr标签样本;通过共有信息计算标签间的同现情况;通过Google检索结果来追踪标签对的语境信息;用自然语言处理和机器学习技术来抽取标签间的语义关系。本实验能够利用Google搜索结果构建语境库,并且以自然语言处理和机器学习算法对这些语句进行处理。这种新方法对于赋予标签对以一定语义关系有相当高的准确率。也探讨该方法在利用社会性语义丰富的主题元数据方面的意义。  相似文献   

11.
首先将我国《标准临床路径》与国际上较完善的临床路径进行比较分析,找出我国《标准临床路径》存在的问题,然后采用openEHR两层法来构建医学临床路径核心元数据体系的语义结构,其中参考信息模型层采用《中国电子病历标准》)的数据结构,原型模型层以《标准临床路径》中的核心元数据为数据来源,结果发现:我国现有《标准临床路径》在语义框架结构上存在分类笼统、内容模糊,缺少清晰明确的逻辑层次的问题;在语义属性结构上存在元数据类型和属性值单一的问题。从语义框架结构和语义属性结构两个方面对临床路径元数据体系进行结构重建,在所设计的临床路径语义框架结构中,将在我国标准临床路径中的三个文档“主要诊疗工作”、“重点医嘱”、“主要护理工作”下增加一级数据组,以便更好地将三个文档的细节项目进行合理归类;在语义属性结构中,设计4种数据元类型,包括“判定数据元”、“赋值数据元”、“条件数据元”和“引用数据元”,从而为建立规范的、模块化的、适于计算机操作的临床路径提供具体思路。  相似文献   

12.
张正强 《情报学报》2006,25(1):30-35
本文通过比较通用元数据和图书情报元数据中的责任者元素的语义结构,分析了电子文件管理元数据中责任者题名元素的语义结构,指出在电子文件管理元数据中责任者元素存在着三种主要的语义结构,即全显示语义结构、半显示语义结构和模块化语义结构。文章在分析比较责任者元素的这三种语义结构的优点和局限性后,得出结论:模块化语义结构是一种简洁、灵活且功能强大的语义结构,其实质是分面组配原理的应用,在电子文件管理元素据标准化中是值得采用的结构。  相似文献   

13.
解读语义Web     
介绍语义Web的概念及目的,认为语义Web的实质就是使计算机能够理解网络信息资源的元数据,并以书目数据的发展变化为例解读语义Web中元数据的结构和意义。提出书目数据向元数据发展,需要著录项目标准化,构建元数据描述框架,制定计算机能理解的词汇,科学地定义词汇的属性和词汇之间的关系。  相似文献   

14.
电子文件管理元数据中,时间元素存在4种语义结构:时间元素的前端模式语义结构、后端模式语义结构、连续体模式的语义结构、分面语义结构。建立电子文件管理元数据标准时, 最好以连续体模型为依据来建构,同时采用分面语义结构。表6。图3。参考文献5。  相似文献   

15.
数字图书馆网格服务描述机制研究*   总被引:2,自引:0,他引:2  
将数字图书馆网格中的服务特征进行分类,基于这些特征分类进行多属性的数字图书馆网格服务描述,就数字图书馆网格中服务的语义描述层次问题进行探讨,提出基于本体的数字图书馆网格服务语义描述模型。  相似文献   

16.
在电子文件管理元数据中,主题元素存在着3种语义结构:无级次语义结构,有级次语义结构,多级次语义结构。由此也就形成3种不同的XML语法结构。基于XML电子文件管理元数据的主题元素的语义结构设计,不能忽视XML检索功能的需求分析。表8。参考文献5。  相似文献   

17.
[目的/意义] 通过对国内外数字文化资源语义融合相关研究成果的总结和Europeana案例分析,为国内数字文化资源整合的研究与实践提供参考和借鉴。[方法/过程] 选取目前发展较为成熟的数字文化资源整合项目Europeana作为案例,分别从资源内容描述规则、语义知识本体模型设计、元数据语义化操作和关联数据的发布与访问4个方面对其数字文化资源语义融合的实现方法进行分析。[结果/结论] 研究发现,构建聚合式元数据模型、建立细粒度语义概念模型、创建开放的语义关联数据网络、提供泛在化关联数据应用服务是实现数字文化资源语义融合的关键。  相似文献   

18.
以基于本体的张謇研究知识库智能检索系统开发为例,探讨基于本体的专题领域知识库智能检索系统的框架结构,工作流程以及功能实现。系统采用语义Web技术和智能Agent技术,使用RDF模型对知识库的Web页面元数据进行描述,然后利用本体建模语言对张謇研究领域知识进行建模,根据所得到的本体对元数据进行基于语义的查询,为用户提供智能检索服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号