首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
针对传统TF-IDF在文本过滤时存在的缺点,提出一种基于特征词抽取的文本过滤算法。简要分析文档信息过滤原理和流程,重点讨论文档信息过滤算法设计及技术实现。实验结果表明,所提出的算法可有效对文档信息进行过滤,能够提高信息检索质量。  相似文献   

2.
基于协同过滤算法的高校图书馆图书推荐系统研究   总被引:3,自引:0,他引:3  
针对当前高校图书馆主动式图书推荐服务存在的对服务对象信息需求挖掘、分析不足的问题,提出构建基于协同过滤算法的个性化图书推荐系统。通过引入读者专业、角色、学历、借阅记录等影响和反映读者信息需求的因素构建读者特征模型,基于该模型采用优化的协同过滤算法挖掘读者信息需求并产生个性化图书推荐信息,并通过实验证明该方法的有效性和实用性。  相似文献   

3.
一种面向语义的信息检索方法   总被引:1,自引:0,他引:1  
传统的信息检索技术忽视了语义对检索过程的影响,这是造成查准率不高的一个重要原因.论文提出了一种面向语义的信息检索方法,该方法强调使用基于知网的语义处理技术实现对用户查询需求和目标文档的语义标注,使用基于知网的词汇链技术实现对文档特征词汇的过滤.一方面可以实现语义级别的检索匹配,另一方面可以降低大量无关词对检索结果的干扰.论文描述了一个实现该方法的信息检索系统SOIRS,并且利用该系统与传统检索系统做了对比实验.实验结果表明面向语义的信息检索方法在查准率方面要明显优于传统信息检索方法.  相似文献   

4.
提出一种基于词汇链的关键词抽取方法。该方法通过构造词汇链来描述技术路线图的技术领域主题内容,并将词汇链作为表征技术路线图中领域关键词、核心技术关键词及其语义关系的词汇序列。实验表明该方法抽取的关键词能够更全面地揭示技术路线图的技术领域主题内容,其抽词结果的准确率和召回率较TF-IDF方法有明显的提高。  相似文献   

5.
黎楠  杜永萍  何明 《情报工程》2015,1(3):090-097
LDA 主题模型可用于识别大规模文档集中潜藏的主题信息,本文提出了一种基于LDA 建立发明人兴趣主题模型的方法,合并每位发明人的专利数据,专利信息基于发明人进行划分,将标准的文档- 主题-词的三层LDA 模型变为专利数据中的发明人- 主题- 词的发明人兴趣模型,实现发明人的主题发现,并利用该模型中主题分布之间的相似性进行发明人的个性化推荐。在采集真实专利数据集上的实验结果表明该方法相比传统的向量空间模型方法和隐马尔科夫模型方法具有更高的准确率,推荐效果更优。  相似文献   

6.
基于自然语言词对法的文献主题新颖性探测研究   总被引:1,自引:0,他引:1  
[目的/意义] 提出一个全新的量化指标--文档主题新颖度,通过自然语言词对方法对文献主题内容的新颖性进行探测研究,并探讨其可行性和优缺点以及新颖度与F1000推荐文献和引文指标之间的关系。[方法/过程] 以F1000为基础,选取hematology主题近一个月内推荐的文献,在Pubmed中查找并获取该推荐文献发表之前6个月内密切相关的文献,构成整个文献集。定义自然语言法新颖度的概念、计算公式并利用Oracle数据库PL/SQL语言进行编程,通过MetaMap软件提取自然语言词汇进行文献主题新颖度的运算。[结果/结论] 自然语言法在文献主题新颖性探测的运算上具有一定的可行性;文档主题新颖度与F1000推荐文献、引用情况并非成等价关系,分属于科技论文评价的不同维度、不同范畴,不可一概而论。应将文档主题新颖度这一新指标与同行评议情况和文献计量学等其他相关论文评价指标结合起来对文献进行综合评价分析,选取优质文献给予推荐。  相似文献   

7.
[目的/意义]信息过载一直是知识工作者在搜集、处理和创造知识的过程中所面临的主要困境。这种困境导致的结果之一是很难回忆起曾经使用过的文档的内容细节及具体位置,而推荐系统则能减少这样的困难。通过研究对比不同推荐系统在这一任务下的优缺点,可以帮助知识工作者更好地完成回忆任务。[方法/过程]基于相关理论,在同一场景(知识找回)模拟实现并测试了4种不同类型的推荐过程,包括基于内容的推荐CBR、基于协同过滤的推荐CFR、基于推理网络的推荐INR与融入了情境感知的推荐CAS,根据所确定的若干指标(精确性、情境相关性、预测性、多样性)对推荐效果进行比较。[结果/结论]结果显示,以上推荐系统在帮助用户回忆并找回文档过程中都有各自的优势,而基于情境感知的推荐系统在情境相关性与预测用户行为方面具有较好的效果。  相似文献   

8.
为揭示数字文旅领域关键技术,促进文旅融合及产业高质量发展,文章通过系统挖掘数字文旅技术专利,运用TF-IDF、LDA主题模型、ROST等方法和工具,从专利计量、技术热点、技术主题、技术关联4个方面展开研究并预测其趋势。研究发现:数字文旅技术现处于成熟初期;专利主题可分为交互式人工智能技术、电子导航技术、智能传感技术、3D建模技术、虚拟现实技术5类;发展方向以挖掘5G信息技术潜力、注重以人为本提升游客体验、突破信息壁垒为主。  相似文献   

9.
王亮  孙昱 《科技与出版》2012,(10):99-101
分析了信息挖掘的概念、方法。结合图书电子商务的特点,提出了一种通过对图书电子商务网站的客户浏览、购买等行为记录进行数据挖掘而建立的客户身份信息模型。此模型可以应用于图书电子商务的个性化推荐和出版物精准营销中。  相似文献   

10.
基于协作过滤的Web智能信息推荐方法   总被引:1,自引:0,他引:1  
何波 《图书情报工作》2010,54(19):115-110
传统的协作过滤方法存在的主要问题是需要人为地提供评价,论文设计的协作过滤方法对其进行了改进,根据用户模式自动获取用户评价,构建评价矩阵。将设计的协作过滤方法应用到个性化信息推荐,提出一种基于协作过滤的Web智能信息推荐方法(WIIRM)。WIIRM考虑用户访问页面的时间特性,不需要用户注册,在推荐时考虑页面的新颖性,同时实现离线处理与在线推荐的结合。实验结果表明,WIIRM是有效的。
  相似文献   

11.
12.
曾文  徐红姣  李颖  王莉军  赵婧 《情报工程》2016,2(3):037-042
文本相似度的计算方法以采用TF-IDF的方法对文本建模成词频向量空间模型(VSM)为主,本文结合科技期刊文献和专利文献特点,对TF-IDF的计算方法进行了改进,将词频的统计改进为科技术语的频率统计,提出了一种针对科技文献相似度的计算方法,该方法首先应用自然语言处理技术对科技文献进行预处理,采用科技术语的自动抽取方法进行科技文献术语的自动抽取,结合该文提出的术语权重计算公式构建向量空间模型,来计算科技期刊文献和专利文献之间的相似度。并利用真实有效的科学期刊和文献数据进行实验测试,实验结果表明文中提出的方法优于传统的TF-IDF计算方法。  相似文献   

13.
推荐系统已成为数字图书馆个性化服务不可缺少的一项重要技术。目前的推荐方法主要是基于规则的推荐和协同过滤方法,这两种方法都有其优缺点,它们共同的缺点是没有考虑语境信息对推荐的影响,从而导致推荐结果不佳。在分析语境信息在推荐过程中的作用的基础上,把语境信息集成到多维推荐模型中,利用数据仓库和OLAP处理层级式聚合计算的能力,建立具有多维信息收集与分析的推荐框架,并做了模块的分析。  相似文献   

14.
信息抽取是从海量网页获取有价值信息的重要方式,对目标网页内容进行主题相关性判断是提高信息抽取效率和准确性的关键环节。目前的相关性判断主要采用人工筛选和文档训练的方法,这其中存在效率低、重复训练等问题,而本文尝试针对抽取任务引入主题描述模型用于网页内容的主题相关性判断。从任务的主题描述模型的角度出发,计算模型中的关键词基于标记信息的加权频率,将网页内容进行量化表示,然后分析关键词加权频率关于任务主题描述模型的变化来判断网页内容的主题相关性。最后通过对比该方法在国防产品信息抽取中结果,实验证明该方法大大提高了网页信息抽取的效率和准确性。  相似文献   

15.
基于C-value与TF-IDF的文献簇主题识别研究   总被引:1,自引:0,他引:1  
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一.引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征.本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法.实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别.  相似文献   

16.
 针对网页主题信息抽取不够精确的问题,提出一种新型的定义和量化主题信息的方法,即把主题信息分为三种信息形式并对不同形式的信息采用不同的方法进行量化计算。基于上述思想,结合DOM规范和分块思想,在DOM树的基础上提出IB-DOM树,并采用分治思想,先定位到包含主题信息的区域,后过滤噪音信息。实验证明本文提出的方法能够较好地解决主题信息自动提取存在的信息完整性和准确性的矛盾。  相似文献   

17.
提出一种新的政务本体术语自动抽取的方法。首先通过中文分词技术和单字合并法提取政务文本中的词作为候选术语;通过C-value求解法和TF-IDF算法对候选术语进行过滤抽取,从而实现政务领域术语的自动抽取。通过实验比较,发现该方法在不影响领域术语抽取召回率的同时可以提高抽取术语的正确率。  相似文献   

18.
文献推荐系统:提高信息检索效率之途   总被引:2,自引:0,他引:2  
Traditional Information Retrieval (IR) systems have limitations in improving search performance in today’s information environment. The high recall and poor precision of traditional IR systems are only as good as with the accuracy of search query, which is, however, usually difficult for the user to construct. It is also time-consuming for the user to evaluate each search result. The recommendation techniques having been developed since the early 1990s help solve the problems that traditional IR systems have. This paper explains the basic process and major elements of document recommender systems, especially the two recommendation techniques of content-based filtering and collaborative filtering. Also discussed are the evaluation issue and the problems that current document recommender systems are facing, which need to be taken into account in future system designs. Traditional Information Retrieval (IR) systems have limitations in improving search performance in today’s information environment. The high recall and poor precision of traditional IR systems are only as good as with the accuracy of search query, which is, however, usually difficult for the user to construct. It is also time-consuming for the user to evaluate each search result. The recommendation techniques having been developed since the early 1990s help solve the problems that traditional IR systems have. This paper explains the basic process and major elements of document recommender systems, especially the two recommendation techniques of content-based filtering and collaborative filtering. Also discussed are the evaluation issue and the problems that current document recommender systems are facing, which need to be taken into account in future system designs.  相似文献   

19.
由于一对一定制化沟通的实现,能最好满足消费者需求的"推荐信息"日趋重要.传统网络推荐技术在支持个人决策行为的过程中非常有效,但却很难运用于群体决策过程之中.在本项研究中,我们提出了一种全新的方法来为群体成员进行商品推荐.这种方法考虑到群体决策过程中会受到群体成员间交互作用的影响,不同意见在群体中的重要性存在的差异.基于商品的协同过滤算法,通过使用GA方法用来学习群体偏好解决子群体的未知评分问题.实验的结果显示,我们提出的方法能够提供高质量的群体推荐意见,并可以广泛运用于群体推荐过程中.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号