首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
基于“Topic”的语义信息组织与图书馆学的经典Subject理论密不可分,可将其视为较为抽象化的Subject理论在语义Web环境下的一种“演化”和实用化的主题技术。文章首先解读Subject和Topic的概念,并概述两种基于Topic的国际标准技术,即TopicMaps和DITA;其次,简要描述TopicMaps的技术和应用,并重点介绍在图书馆界鲜为人知的DITA技术及其应用;再次,对基于“Topic”的语义信息组织方法予以总结。  相似文献   

2.
大数据智能分析是企业技术创新的新希望,也是科技信息机构在服务转型的压力下所面临的新机遇。应用大数据智能分析,企业可以从海量多样的数据中,深入挖掘并呈现满足创新需求的各种关联信息,获得洞悉,并做出更为准确的创新决策。文章面向企业技术创新服务,讨论大数据智能分析系统的机制,并以大数据类型——结构化和非结构化数据为中心,介绍它们不同的处理技术。由于计算机处理结构化数据的简易性和精准性,文章将数据的结构化处理技术作为主要的议题进行讨论,介绍实用的标准技术DITA。最后,以作者研发项目为例,介绍与大数据分析有关的工作及展望。  相似文献   

3.
范勇 《贵图学刊》2005,(3):45-46
PDF文档作为最流行的电子文档格式之一,集多媒体信息于一身,交互方式丰富,并且可在web上发布和传递。本文在分析PDF文档在web数据库进行双向数据传递机理的基础上,对如何利用PDF文档结合ASP技术开发利用信息资源进行了探讨。  相似文献   

4.
为适应图书馆信息咨询服务工作发展的要求,文章设计了一种信息咨询工作文档(简称FRIS),并介绍了它的记录结构和内容,以及对文档工作界面的总体要求,分析了文档的操作流程,并探讨了文档的主要功能.  相似文献   

5.
图书馆面临着如何有序地存储、管理并利用大量的、非结构化信息的问题。文章从信息门户理论出发,讨论了在图书馆信息管理领域对非结构化数据进行管理活动所面对的问题与解决途径,以及由此产生的利弊。  相似文献   

6.
文章通过对企业技术创新的信息需求调查,提出了企业信息服务需要解决的问题,介绍了中国化工信息中心自2007年进行企业专业化信息服务的实践,并从组织架构、建设周期、资金、检索技术、资源、服务链等方面对企业专业化信息服务今后的发展提出了思考。  相似文献   

7.
为适应图书馆信息咨询服务工作发展的要求,文章设计了一种信息咨询工作文档(简称FRIS),并介绍了它的记录结构和内容,以及对文档工作界面的总体要求,分析了文档的操作流程,并探讨了文档的主要功能。  相似文献   

8.
本文在研究敏感信息安全管理与防泄密技术的基础上,提出了一个针对电子文档的综合安全管理系统体系架构,该系统架构将通过融合电子文档的安全存储、安全使用、安全分发与传输,以及相关网络系统环境防泄密控制等安全机制来满足敏感信息在文档生命周期内各阶段的防泄密需求.希望该项研究能够对大家关于电子文档的防泄密管理工作有所帮助.  相似文献   

9.
文章介绍了国家图书馆网络信息资源采集与保存发展历程和技术发展,分析了基于开源架构进行定制开发的网络信息资源采集与保存平台的构建架构、功能特点,介绍了网络信息资源增量采集、增量回放显示功能实现的关键技术和方法,并对网络信息资源采集与保存未来的发展进行了思考。  相似文献   

10.
杨彦辉 《图书馆学刊》2007,29(2):134-135
SOA是一种IT战略,它把分散的应用系统组织为可被迅速组合&重用的标准的服务,从而实现应用的集成。讨论了基于SOA(service-oriented architecture)来架构图书馆信息综合服务系统的方案和技术设计。  相似文献   

11.
[目的/意义]基于大量专利文献数据的核心技术主题识别有助于识别某技术领域的关键技术、分析关键技术的发展方向,是进行技术创新的基础情报工作,对于研究人员、企业乃至国家层面都具有一定的意义。[方法/过程]提出基于Chunk-LDAvis的核心技术主题识别方法,首先基于经典LDA模型进行主题识别,然后利用名词组块对初始LDA主题识别结果进行标注,构建Chunk-LDA主题识别结果,提高其可解读性;然后基于社会网络分析方法构建主题网络,识别核心技术主题;基于R语言的LDAvis工具包绘制可交互的Chunk-LDAvis核心技术主题关联分析图谱,发现核心技术主题的隐含联系,辅助进行核心技术主题识别。[结果/结论]通过对纳米农业领域进行实证研究,验证了本文提出方法的准确性和可行性。  相似文献   

12.
Studies of the digital divide have focused on lack of access to hardware, software, connectivity, and computer skills. Newer studies point to the existence of other factors such as the lack of culturally relevant content. Driven by this issue, this study provides a preliminary map of the “nature” of Web-based content about U.S. Latinas, a community that has traditionally been underrepresented in information systems. The nature of the content was explored and analyzed by examining attributes such as type of site, language of site, topic(s), producer(s) of site, technical features, and targeted audience. The study also theorizes the lack of relevant content and discusses the possible social implications of the disparities in access to digital information technologies. Using content analysis, the study provides a framework with which to categorize and analyze Web content. The results suggest content areas that need development and potential information barriers to consider in the process.  相似文献   

13.
基于语义爬虫的商品信息主题采集研究*   总被引:2,自引:0,他引:2  
结合网页主题链接分析和网页主题内容语义分析,提出一个以主题爬虫实现采集商品信息的方法。在爬行过程中通过对本体的统计学习,使主题本体参照物不断得到优化。实验结果表明,该方法较其他传统爬行算法更有效,并能防止主题漂移的发生,带来较高的主题收获率。  相似文献   

14.
[目的/意义] 改善现有LDA专利技术主题分析存在的辨识度低、可解释性弱和界限划分模糊问题,对于把握技术热点、追踪技术前沿具有重要意义。[方法/过程] 将国际分类号IPC引入LDA专利主题分析中,将其作为技术词的语境,以<词/词组,分类号>二元组的WI (Word IPC)结构进行训练,构建WI-LDA模型,实现对专利文献主题的识别和分析。[结果/结论] 通过中国石墨烯领域的实证研究及与传统LDA模型的对比研究证明,WI-LDA模型泛化能力较强,在专利技术主题分析上能有效降低主题的辨识难度,增加主题的可解释性,使文本主题划分更加清晰。  相似文献   

15.
一种通用HTML网页主题信息提取方法*   总被引:9,自引:0,他引:9  
采用DOM规范,把HTML网页表示成树结构,对不同模板的HTML页面“主题”信息提取进行研究和分析,提出一种新的结点主题相关性判定方法,依据此方法判定出要抽取的主题内容,并删除无关内容,结果输出只含主题信息的HTML文档。  相似文献   

16.
《The Reference Librarian》2013,54(25-26):483-493
Ethical problems in librarianship, especially in reference work, are a popular topic for research. Robert Hauptman's famous "bomb" experiment presented us with the question of whether wholesale information dissemination is ethical. I chose drug abuse to be the topic of my query in an unobtrusive test similar to Hauptman's. I intended to find out whether reference librarians would help me determine how one goes about freebasing cocaine. Responses, as expected, were varied. No one absolutely refused to hel me. Perhaps most of the librarians consulted were content not to 'I; now what I was going to do with the information. The results of this study parallel those reported by Hauptman. My conclusion, though, is in support of information dissemmation, recognizing the fact that anyone should have the right to read about either explosives or cocaine.  相似文献   

17.
[目的/意义]改善现有专利技术主题分析方法主题辨识度低、主题词二义性、无法识别技术信息中的"问题"与相应"解决方案"等问题。[方法/过程]本文通过抽取专利文本中的SAO结构,并从SAO结构中识别"问题和解决方案"(P&S)模式,基于"bag of P&S"假设,构建基于"主语-行为-宾语"(subject-action-object,SAO)结构的LDA主题模型,实现对专利文献主题结构的识别和分析。[结果/结论]案例研究表明,该方法能够有效识别主题分布,并在主题辨识度和语义消岐方面较传统LDA模型具有较大优势。  相似文献   

18.
[目的/意义]潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDA主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDA在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDA主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘要和关键词+摘要作为语料的LDA主题抽取的效果均优于关键词作为语料的LDA主题抽取效果,并且前者在主题抽取的广度方面表现更好,而后者抽取的主题粒度更细。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号