首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于文本空间表示模型的文本相似度计算研究
引用本文:张文萍,黎春兰.基于文本空间表示模型的文本相似度计算研究[J].现代情报,2013,33(2):21-23,124.
作者姓名:张文萍  黎春兰
作者单位:1. 武汉科技大学管理学院, 湖北 武汉430081;2. 武汉大学信息管理学院, 湖北 武汉430072
基金项目:湖北省教育厅人文社科项目“云计算环境下图书馆信息服务模型研究”(2012Q190)研究成果之一
摘    要:在分析现有文本表示法的基础之处,提出一种以段落、语句、词语为层次结构的文本表示方法——文本空间表示模型,并在此模型基础上探讨一种以文本段落为基本单位的相似文本计算算法,以实现相似文本检测目标。最后建立测试集并在测试集上执行检测实验,结果表明此方具有较好的相似文本发现效果。

关 键 词:文本相似度  文本空间表示模型  段落  算法

Using Text Space Representation Model in Text Similarity Computing
Authors:Zhang Wenping  Li Chunlan
Institution:1. School of Management, Wuhan University of Science and Technology, Wuhan 430081, China;2. School of Information Management, Wuhan University, Wuhan 430072, China
Abstract:Based on the analysis of existing text representation methods,a new model for text representation that decompose text to paragraphs,sentences and phrases hierarchically is introduced in this study contrast with the inadequacy of existing text representation methods.With the help of this model we propose a text similarity computing method on the unit of paragraph of text.The following experiments carried on the testing set proved a better effect by this method.
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《现代情报》浏览原始摘要信息
点击此处可从《现代情报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号