共查询到20条相似文献,搜索用时 466 毫秒
1.
介绍了隐马尔可夫模型的基本原理以及在说话人识别中的实现,对文本相关与文本无关进行比对.得出文本相关的识别率要高的结论及原因。 相似文献
2.
3.
在素质教育中,小学语文文本读解教学就是要在语文文本阅读课堂中,师生共同读解文本,建构丰富的文本意义,实现多元化。本文为此具体首先探讨了当前小学语文文本读解的内在要求,然后从三个方面分析了当前小学语文文本读解的教学现状,然后提出了相关对策:词语阐释、主题诠释和空白填补。 相似文献
4.
作为保护文本文件版权的有效方法,文本数字水印已逐渐成为研究的热点。本文系统地介绍了文本数字水印的相关概念和特点,探讨了文本数字水印的具体实现方案,文本水印中用到的各种技术方法和水印的攻击与评价。文章最后分析了文本数字水印目前存在的问题以及今后的发展方向。 相似文献
5.
互文性强调特定文本与其它相关文本之间的相互影响、相互联系,是理解一切文本的前提。根据互文性理论。任何一个文本都是在它以前的文本的遗迹或记忆的基础上产生的,或者是对其他文本的吸收和转化中形成的。本文将这一概念应用到广告翻译中、通过分析广告语中的互文性,及广告译文的研究,为广告翻译研究开拓了新的视角。 相似文献
6.
在对互联网上海量文本信息进行管理的过程中,文本自动分类是一项关键且基础的技术。本文主要介绍了文本分类的概念、实施过程.相关技术以及文本分类在网络信息服务中的几个典型用途。 相似文献
7.
提出了一种基于位置敏感哈希算法的海量文本数据查询算法,通过位置敏感哈希算法将文本数据的特征向量映射到哈希桶中,从而有效地降低了计算复杂度并提高了数据检索的效率。首先,利用TF-IDF特征表示文本的特征向量,并根据给定的哈希函数集把文本的特征向量映射至哈希桶;接下来,利用哈希表为给定的文本计算出与之对应的直方图,通过直方图距离计算文本的相似度;最后,通过计算目标文本集中的文本与待查询文本的相似度进行文本排序,排序分值高的文本作为相关文本返回给用户。实验结果表明,对比已有方法文本提出的算法在MAP以及查全率-查准率曲线两个测度上都获得了较好的性能。 相似文献
8.
9.
为了能在海量的文本中及时准确地获得有效的知识和信息,文章表示技术以及文本自动分类技术受到了广泛的关注。文章介绍了文本分类的过程和相关的技术,利用向量空间模型构建文本表示模型,介绍了常用的文本分类算法,由于传统类中心分类算法训练文档分散,不能准确的表示各类别的中心向量,提出了优化算法,从而提高了分类准确度。 相似文献
10.
11.
协同过滤推荐方法由于只利用用户对项目的评分数据,常常会遭遇到评分数据稀疏问题和项目的冷启动问题。本文提出了一种利用项目文本信息与评分信息的混合推荐方法。首先,利用doc2vec处理与项目相关的文本信息数据,通过对项目相关的文本信息数据进行无监督训练得到文本特征向量。然后,利用概率矩阵分解技术融合文本特征向量和评分数据两类信息进行训练,得到用户的潜表示和项目的潜表示,利用用户的潜表示和项目的潜表示可以对用户未打分的项目进行预测。通过实验验证,本文的混合推荐方法在没有显著降低预测精度的同时能够处理项目冷启动问题。 相似文献
12.
13.
在对信息可视化相关理论模型进行研究的基础之上,结合新闻要素本身的特点和用户的信息需求,界定新闻文本信息实体的概念,提出专题新闻文本集信息可视化理论模型,并对模型的要素和过程进行详细分析.然后以“四川汶川大地震”网络新闻文本集为实例对其进行实证研究,通过分析用户的信息需求,构造信息实体关联矩阵,对新闻文本集进行可视化,并对可视化的结果进行分析. 相似文献
14.
利用自组织映射网络(80M)可以实现文本聚类,在此基础上进一步对索引词聚类,从而可以得到文本聚类图和索引词聚类图。利用这两个图,就可以对普通文本进行超文本自组织,即对普通文本的某些知识点做超链接,以链接到与之相关的Web文档上。 相似文献
15.
《科技通报》2015,(8)
通过对文本数据库的优化索引提高信息检索功能,传统的数据库索引方法采用单层文本特征聚类方法,聚类特征不一致时,存在非法聚类和非法结果输出的安全问题。提出一种基于虚拟数据加速分布重组的数据库索引技术,首先构建虚拟数据加速分布重组模型,改进数据库的分布模型,提高对文本数据的索引能力,把需要的文档集经过预处理后,构建文本数据库,算出各个候选扩展词的权重后,需要根据各个词与原查询词的相关度,构成数据库文本扩展词集合,采用相关规则挖掘的规则词作为扩展,得到了虚拟数据的加速分布系统状态函数,构建规则库,从中提取与原查询相关的扩展词,进而实现查询扩展,实现数据库索引算法改进。仿真结果表明,该算法进行文本数据库索引的收敛性好,检索精度和有效连接数较高,执行时间短,展示了其优越性。 相似文献
16.
【目的/意义】为在线医疗问诊平台中的医生自动生成高质量标签,更好地服务于对医生资源的分类、检索和管理。【方法/过程】基于在线问诊文本信息,提出了结合时间周期特征与文本主题特征的医生标签自动生成算法。首先根据医生相关文本信息提取关键词生成候选标签,然后从患者问题文本和医生回答文本两个方面进行LDA主题模型训练,按时间周期挖掘出问题文本和回答文本的主题特征,对候选标签进行质量控制;最后经标签加权混合后得到最终的医生标签。【结果/结论】实验结果表明,该标签自动生成算法能够反映出医生标签生成的动态性,能够准确生成符合医生专业知识特征的高质量标签,具有较好的标签生成效果。 相似文献
17.
文本挖掘是基于非相关文献知识发现的核心。本文将文本挖掘的过程细化为从文献源到初始文献集子过程,从初始文献集到中间词集子过程,从中间词集到关联词集子过程。并对每一个子过程中所使用的方法进行分析比较。在此基础上对文本挖掘存在的问题进行分析,并提出改进方法。 相似文献
18.
【目的/意义】本文以主题为核心,从外部属性和内容属性两个视角展开政策文本结构化解析,直观反映政
策核心内涵,挖掘政策文本语义,为政策内容解读提供新模式。【方法/过程】利用LDA2Vec主题模型实现基于上下
文的政策文本主题识别,同时借助位置和语法规律提取外部属性,以此构建政策文本结构化解析的描述框架。【结
果/结论】“互联网+”政策文本解读的实证分析发现,本文所提框架有助于直观展现政策要素,有效揭示政策文本主
题分布,以及进行大规模政策领域文本的批量分析和解读。【创新/局限】通过结构化解析框架展现政策文本的形式
化特征和主题性特征,帮助政策相关群体把握政策制定的特点和侧重点,目前深层次内容解读有待进一步研究。 相似文献
19.
运用文本挖掘技术发现网络新闻报道中潜在的、有价值的信息是情报研究的一个新尝试。笔者探讨了网络新闻的文本挖掘方法,以上海世博新闻媒体网络版报道为例,进行实证研究,并对报道差异进行对比分析。本文选取香港、台湾、境外媒体华语版、上海本地媒体对世博会相关报道,基于文本挖掘、特征提取对报道内容的差异进行阐述,并得出结论。 相似文献