排序方式: 共有75条查询结果,搜索用时 296 毫秒
61.
【目的/意义】如何识别文本中的知识片段进行标引,使检索系统能检索文本知识内容是提高用户信息利 用效率的关键。【方法/过程】在文献调查的基础上,文章基于本体概念模型和Word2Vec词向量模型阐述了文本片 段语义标引的流程框架,并对本体语义扩展、神经网络模型训练、文本片段标引、文本片段权重获取四个部分的关 键环节及技术做了详细说明。最后通过实验验证了该流程框架。【结果/结论】实验结果显示该方法在文本知识片 段识别上是有效的,知识识别的准确率达到80%,能够实现对文本知识内容进行标引。该方法为自动化实现基于知 识的文本信息组织提供了有益的参考。 相似文献
62.
63.
64.
针对主观文本识别、情感分词以及情感分类模型选择等研究方法上存在的效率较低、文本表达维度高等问题,文章提出了一种基于旋进原则和AdaBoost集成技术的回归SVM情感分类模型(AdaBoost+ SVM-L),不仅提高了主观文本标注准确率,更通过AdaBoost+ SVM-L模型对情感样本的极性和强度进行了判断,实现了文本情感强度阈值的可视化.并通过分组对照实验比较了SVM、NB以及AdaBoost+ SVM-L模型的性能指标. 相似文献
65.
基于情感分析的评论挖掘模型研究 总被引:1,自引:0,他引:1
在社会化网络环境下,关于产品的评论成为企业竞争情报分析重要的数据源.这些评论中包含用户对产品各个方面的情感倾向,对其进行情感分析可以帮助商家了解产品的优缺点.针对现有情感分析的不足,本文在构建评论挖掘模型时综合采用了共词分析和基于句法分析的极性传递法.共词分析可定量确定用户关心的产品维度;极性传递算法考虑句子结构特点,在对句子级文本做情感分析时相较传统情感分类算法有更好的分析效果.同时,引入极性值和强度值计算情感词和主题词的情感强度. 相似文献
66.
67.
一、阅读下列材料,解答1~6题。长江三峡河段是当今世界上最大的水力资源宝库之一。最早提出修建三峡工程的是中国民主革命的先驱孙中山先生。自那以后,无数的专家学者对三峡工程倾 相似文献
68.
69.
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Allocation)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。 相似文献
70.
用户兴趣本体弥补了基于关键词的用户兴趣模型不能从语义上表达用户兴趣的缺陷,但大多是利用领域本体来构建,很难反映用户多方面和潜在兴趣,并且构建领域本体也是一个难点。本文据此提出一种基于词汇同现的用户兴趣本体构建方法。根据网页浏览记录找到用户兴趣网页集,经过数据处理将其转换成用户兴趣文本集。以TFIDF为指标抽取概念,词汇同现统计提取概念间关系,运用无尺度K-中心点聚类算法对其调整,将有关联用户的本体合并得到多用户本体,该本体能在语义上更全面反映用户兴趣并发现潜在兴趣。 相似文献