排序方式: 共有13条查询结果,搜索用时 484 毫秒
1.
基于情感倾向识别的汽车评论挖掘系统构建 总被引:2,自引:0,他引:2
文本情感识别是一个具有广泛应用前景的研究领域,它在信息检索、文本过滤、产品在线跟踪评价、民情民意调查分析、智能教学系统中都有着广泛应用。而汽车情感识别正在成为人们日益关注的研究热点。本文利用文本分类技术,采用分步骤分模型的设计方法,构建出汽车情感倾向识别系统,通过对汽车评论进行挖掘和分析,识别其情感倾向和演化规律,并以可视化的界面将结果展现给用户,从而向汽车生产商提供反馈信息,同时可以为汽车消费者提供购车指导。另外本文还就汽车语料库的建立,分类模型的构建以及本系统构建过程中的一些关键问题进行了分析和探讨。 相似文献
2.
3.
词义消歧是一个分类过程,局部上下文是主要的分类特征.对称窗口指上下文边界与歧义词的左右距离相等,大部分消歧系统凭经验将其作为最优的局部上下文窗口,很少选择非对称窗口.对称窗口是否优于非对称窗口?本文以Senseval-3中文数据集为例对这一问题展开研究.首先,对训练集采用交叉验证法确定最优窗口,它是非对称的.并采用此非对称窗口与多组经典的对称窗口进行了对比消歧测试,结果表明非对称窗口的表现优于对称窗口.进一步在独立采用词或词性作为特征的情况下进行交叉验证评估,发现趋于对称的窗口总体上表现是优秀的.在不进行辅助计算的情况下,可以选择对称窗口作为局部上下文窗口,但它并不是最优的. 相似文献
4.
5.
中文词义消歧上下文最优边界问题研究 总被引:1,自引:0,他引:1
为了选择最优的边界,采用交叉验证方法,将取得错误率最低的上下文边界确定为上下文最优边界,并应用此方法对SemEval-2007中文数据集进行处理,得出此数据集的上下文最优边界为[-2,+2].为了验证其结果的有效性,进一步采用SemEval-2007测试集进行消歧测试,结果表明采用交叉验证法确定的最优边界对词义消歧准确率有一定提升.同时对不同词性歧义词的最优边界也进行讨论. 相似文献
6.
7.
8.
基于意见挖掘的城市形象网络监测系统初探* 总被引:2,自引:0,他引:2
针对无法对舆情信息进行有效搜集、分析等难题,利用意见挖掘的相关技术,采用分步骤、分模型的设计方法,构建出城市形象网络监测系统。通过对与城市有关的评论进行挖掘和分析,识别其情感倾向和演化规律,并以可视化的界面将结果展现给相关政府部门。 相似文献
9.
基于标注语料库的有指导学习方法是词义消歧取得性能最好的方法,优于无指导学习方法和基于词典的方法.它的准确率极大地依赖于标注语料库的规模,而目前人工标注语料库数量极少,缺乏标注语料就成为制约词义消歧发展的瓶颈,如何生成大规模标注语料成为词义消歧研究热点.自举是解决上述问题的重要方法,它以小规模标注语料作为种子,运用机器学习算法生成大规模标注语料.本文对自举在词义消歧中的应用和关键问题进行介绍.首先对自举进行算法描述,然后分别从中英文词义消歧领域介绍自举的应用情况,最后对自举应用涉及的初始种子、自举参数、未标注语料集的选择和互联网应用等几个关键问题进行总结. 相似文献
10.