排序方式: 共有38条查询结果,搜索用时 15 毫秒
31.
WWW虚拟图书馆——对于概念及原理的分析 总被引:9,自引:0,他引:9
随着互联网信息的激增,“巨大的网络信息量”与“特定的用户需求”之间的矛盾日益尖锐,而搜索引擎尚不能完全解决以上矛盾,因此,人们把目前投向虚拟图书馆。究竞何谓虚拟图书馆?它是否就是人们常说的数字图书馆?它的实现原理又如何?本文正是以上问题的剖析,谨希望由此能引发更深入的研究,进而推动Internet信息资源管理向合理化方向发展。 相似文献
32.
33.
本文通过计算60种有代表性的图书情报类英文期刊从2006年至2008年的主题数量与方差,将被调查期刊按照其主题专业化与综合性分为四类。在每类期刊中选取影响因子最高的期刊,利用自组织映射的成分图分析特定期刊的主题特点。结果发现,大多数(占85%)期刊较为均衡地报导有限数量的主题;少数(占13.3%)期刊呈现出较强的综合性,即较为均衡地报导数量较多的主题;个别(占1.7%)期刊涉猎广泛,且具有明显的主题侧重;不存在高度专业化的期刊。其中,期刊的主题数量与主题侧重程度差异(由方差反映)呈现同向变化的规律,即期刊的主题数量越多,其主题侧重程度差异也越大,反之亦然。 相似文献
34.
基于支持向量机的产品属性识别研究 总被引:1,自引:0,他引:1
本文提出了一种结合自然语言处理技术与支持向量机模型,从客户评论中识别产品属性的方法.为了检验该方法的有效性,从收集的22 157条有关餐厅的评论语句中随机选取3701条,对其进行手工标注.针对手工标注语料库,利用支持向量机方法进行了产品属性识别训练和测试,并在准确率、召回率、F1值方面进行了评估.在测试结果中,平均准确率为95.6%,平均召回率为81.9%,平均F1值为87.3%.实验结果表明,该方法在平均准确率、平均召回率和平均F1值方面均高于最大熵模型方法,在句子层次上具有较好的属性识别效果. 相似文献
35.
基于本体的数字图书馆检索模型研究(Ⅱ)——语义信息的提取 总被引:5,自引:0,他引:5
语义信息提取是一项较新的技术,本文讨论语义信息提取的定义、原理和思路,并以国共两党关系历史为领域背景,详细分析语义信息提取的过程,即对于待处理的自然语言文字,将其进行分段和分句;针对拆分出的句子,进行分词和词性标注;在词性标注的基础上选择适当动词作为句子的语义谓词;判断该谓词是否属于语义谓词列表;再根据语义谓词来获取相关的语义实体,同时对于指示代词进行消解;最后对时间和地点维进行提取,并更新语义提取背景。本文还对开发过程中所用到的数据结构、关键算法进行了分析。 相似文献
36.
基于本体的数字图书馆检索模型研究(Ⅲ)——历史领域资源本体构建 总被引:11,自引:3,他引:11
近些年来,本体(Ontology)已经在知识工程、人工智能、语义网等相关领域得到了广泛关注和深入研究。目前在数字图书馆领域,本体资源仍然是种稀缺资源。作为“基于本体的数字图书馆信息检索模型”研究课题的一部分,我们构建了“国共合作”历史领域本体,希望利用本体的思想和方法来对数字图书馆中的人文历史学科资源进行知识组织和知识表现。本文将介绍我们在历史领域本体构建方面所进行的工作,探讨在领域本体构建过程中所遇到的问题及其解决方法,希望我们所做的工作能为数字图书馆相关领域的本体构建研究提供有价值的参考。 相似文献
37.
中文本体的自动获取与评估算法分析 总被引:6,自引:0,他引:6
在下一代互联网,即语义网中,信息模式建立在本体描述之上。由于手工构建本体是一项工作量巨大并且繁杂的任务,因而,能否自动构建本体正逐渐成为语义网使用的关键性要素。在这样的背景下,本文对比和借鉴了国内外本体自动获取的方法和思路,将中文领域本体的提取划分为文本预处理、本体抽取和本体关系获取三个阶段。接着,本文讨论了这三个步骤所涉及的算法,包括基于统计模式对文本抽词、基于奇异值分解从词—文档矩阵中提取本体、基于语义相似度对本体进行聚类等。对于本体自动获取的效果评估,本文提出了利用计算手工和自动两种方式得到的本体相似度来进行衡量的思路。 相似文献
38.
[目的/意义] 从跨语言视角探究如何更好地解决低资源语言的实体抽取问题。[方法/过程] 以英语为源语言,西班牙语和荷兰语为目标语言,借助迁移学习和深度学习的思想,提出一种结合自学习和GRU-LSTM-CRF网络的无监督跨语言实体抽取方法。[结果/结论] 与有监督的跨语言实体抽取方法相比,本文提出的无监督跨语言实体抽取方法可以取得更好的效果,在西班牙语上,F1值为0.6419,在荷兰语上,F1值为0.6557。利用跨语言知识在源语言和目标语言间建立桥梁,提升低资源语言实体抽取的效果。 相似文献