共查询到10条相似文献,搜索用时 26 毫秒
1.
针对图书出版领域的常用问题集研制自动问答系统,重点解决问句索引与检索问题。在问句索引中提出结合分词与词性标注、浅层语义分析等方法来索引问句;在问句检索中提出基于特征向量空间和语义类的方法来计算问句相似度。最后对该系统进行实现。 相似文献
2.
3.
4.
5.
6.
面向农民的问答系统问句处理研究* 总被引:1,自引:0,他引:1
为提高农民获取信息的便利性,文章着重面向农民问答系统的开发,提出问答系统由知识库构建、问句处理、信息检索、答案抽取4个模块组成,其中问句处理是研究重点。在总结农民问句特点的基础上,提出基于疑问词和短语的问句分类方法,并在问句处理过程中采用去除客气词、建立针对非正式疑问词和无疑问词时的“特殊规则表”等方法,以有效地进行问句归类及关键词提取。同时利用所构建的“同义词扩展词表”扩充关键词,并设定不同的权重基准,为信息检索模块的处理奠定基础。 相似文献
7.
文章借鉴已有文本处理、特征提取和语义相似度计算方法,建构了公共危机事件案例语义相似度计算模型,并以兰州大学的中国公共危机事件案例知识库为例,选择案例库中两种不同类型的四个案例进行了结果验证.实验结果表明,本文提出的案例相似度计算模型方法具有有效性,为公共危机事件的案例推理增加了一种可借鉴的方法. 相似文献
8.
基于词序方法的文本相似度计算模型 总被引:1,自引:0,他引:1
针对传统向量空间模型对文本相似度的计算未考虑词序导致偏差的问题,提出使用马尔可夫模型的状态转移矩阵、两两文本的最长公共子序列以及它们的所有公共子串信息来描述词序信息,在此基础上提出一种将马尔可夫状态转移矩阵、最长公共子序列、公共子串和TF-IDF相结合,兼顾词序和词频信息的文本相似度计算方法,并使用英文TREC-9的部分数据集对基于词序方法的文本相似度计算方法进行了测试.试验结果表明:在同等分词及评估条件下,基于词序方法的文本相似度计算结果的准确率相对于单纯采用传统的基于向量空间模型的TF-IDF方法提高了5%~15%. 相似文献
9.
10.
针对海量信息的冲击,专家提出了语义技术的概念,作者在文章中主要讨论了语义技术在分词算法、知识库建设、输出排序算法中的应用。 相似文献