排序方式: 共有74条查询结果,搜索用时 15 毫秒
61.
以往的术语抽取研究大多将语言学方法和统计方法分别进行单独的处理,并且只考虑候选术语本身的术语度,而没有考虑候选术语所在句子的术语度对术语抽取性能的影响.本文将语言学方法与统计方法进行并行融合,综合考虑候选术语及其所在语句的术语度,进行基于多层术语度的一体化术语抽取.该研究有两个特色:首先,采用条件随机场模型,能有效融合语言学方法和统计方法,实验结果表明了基于一体化策略的术语抽取方法的有效性;其次,通过语料库比较方法,提出基于多层术语度的术语抽取方法,该方法能抽取多字术语,实验结果表明了利用多层术语度进行术语抽取的有效性. 相似文献
62.
利用引文内容进行主题级学科交叉类型分析 总被引:1,自引:0,他引:1
[目的/意义]针对学科交叉宏观研究不能刻画学科交叉主题,以及学科交叉微观研究仍处于主题挖掘研究阶段的现状,从内容层面解决主题学科交叉度计算问题,并构建学科交叉分类的量化标准。[方法/过程]首先,采集学术论文并解析引文内容;利用术语集获取术语和术语主题。然后,统计引文内容中的主题术语重复率。接着,计算学科间的主题学科交叉度。最后,基于主题学科交叉度分布熵,进行分类并分析。[结果/结论]研究结果表明:①六个学科难以与医学在实践应用知识层面进行学科交叉;医学的理论基础与六个学科有明显的学科知识交叉。②学科交叉存在三种类型分别为:界内交叉、工具型交叉和界外交叉。综上,通过引文内容中的术语可以有效地计算主题学科交叉度,定量地研究学科交叉类型。 相似文献
63.
认为随着Web2.0,的发展,社会化标注系统也开始影响图书馆传统的信息组织方式。以中英译本的图书为研究对象,从豆瓣、Amazon、Librarything获取社会化标签,从中国国家图书馆和美国国会图书馆获取MARC记录中的主题词,探究每本书的标签和主题词在长度、个数和相似度三方面的差异。实验结果显示:不同语种的标签或主题词在长度、个数和相似度三方面存在差异;不同类目的图书的社会化标签在这三方面也存在差异;单本书的社会化标签与主题词之间同样存在差异。该研究能够帮助图书馆了解社会化标签并借此提升用户服务品质。 相似文献
64.
65.
66.
67.
68.
自动标引通用评价模型研究 总被引:1,自引:0,他引:1
目前大多文档都不具有关键词,但手工标引关键词费时费力且主观性较强,因此关键词自动标引是一项值得研究的技术,由此引发的标引结果有效评价问题也成为一个亟需解决的问题.然而,评估关键词自动标引的性能并非一件容易的事情.针对常规自动标引评价方法存在的评价结果不能完全反映真实的标引结果以及评价成本高的情况,本文提出一种通用的自动标引评价模型.该模型可以有效地利用外部资源,在有参照情况下与无参照情况下,分别对标引结果进行评价.实验结果表明,自动标引通用评价模型能增加标引评价的可靠性,并且降低标引评价的成本. 相似文献
69.
针对DCF聚类描述法存在的问题,提出一种基于组合策略的聚类描述方法,即综合利用"先描述、后聚类"和"先聚类、后描述"的优点,解决聚类描述的可理解性问题.实验结果表明该方法的有效性,将该方法用于搜索结果聚类这一应用中. 相似文献
70.