首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
文献隐性关联知识发现研究   总被引:1,自引:0,他引:1  
首次提出并从发现和复现两方面定义了文献间的隐性关联,即原本存在联系,但尚未被发现或出于某种目的,被人为去除、主观隐藏或弱化后的关联.针对上述特点,提出了基于文献的隐性关联知识发现方法以及三种发现模式和发现流程.选取国防领域关于"新型隐身技术"的情报研究实例,设计实验发现了"半导体技术"与"隐身技术"间的关联,复现了"等离子体技术"与"隐身技术"间的关联,提供了"超结晶格子"与"激子"两个备选研究方向,验证了隐性关联知识发现方法的可行性和有效性,并针对实验过程中发现的问题,采取基于NASA叙词表上位概念映射及基于战略坐标的共词聚类方法对发现过程进行改进,提高发现效率,使隐性关联知识发现方法在情报研究实践中更具可操作性.  相似文献   

2.
数字图书馆信息资源发现模式研究   总被引:1,自引:0,他引:1  
认为数字图书馆的信息资源发现随着新信息环境的发展及图书馆服务理念与用户信息行为的变革而演化,总结目前数字图书馆信息资源发现的三种模式:信息资源揭示发现模式、直接式信息资源发现模式、间接嵌入式信息资源发现模式,并阐述各种信息资源发现模式的涵义、特征,对其进行比较,最后就数字图书馆信息资源发现模式的发展进行探讨,提出学术"情境发现"模式。  相似文献   

3.
目前,生物医学文献的数量正以爆炸性的速度增长,这些文献中隐含着大量有用的信息,挖掘这些文献可以形成医学假设.然而,传统的基于简单共现的方法会产生大量的目标词,从而导致准确率下降.本文提出一种新的选取连接词的方法,使用统计特征和文本特征来代替每一个连接词并表示为向量形式,然后把这些词分类为相关和不相关.使用相关的连接词发现目标词,可以提高知识发现的准确率.本文通过Swanson的两组经典实验--雷诺氏病和鱼油、偏头痛和镁,使用有效连接词的比例变化作为依据验证了方法的有效性.最后,本文以H1N1为初始词,进行开放式和闭合式知识发现研究,得到了较好的效果.  相似文献   

4.
新闻发现的思维模式辨析   总被引:3,自引:0,他引:3  
张征 《国际新闻界》2006,(3):36-40,60
本文通过对记者编辑在发现新闻过程中常用的思维模式的反思,展示这些思维模式在具体操作过程中的优势特征,并重点剖析了两种思维模式容易出现的实践偏差。它限制了记者编辑发现新闻时的创造性,也容易导致不合理的新闻实践。  相似文献   

5.
针对知识发现系统建设时只重视数据挖掘技术,而忽视对系统流程控制,缺乏对知识发现系统流程的模式研究问题。通过相关案例比较,提出基于系统思考的知识发现一般流程模式;分析科学研究以及商业应用中知识发现系统和公共管理决策系统模式之间的差异;归纳不同类型的知识发现系统流程的特点和关键控制点,并针对公共决策支持系统中的证伪障碍给出一个基本应对策略。  相似文献   

6.
黎楠  杜永萍  何明 《情报工程》2015,1(3):090-097
LDA 主题模型可用于识别大规模文档集中潜藏的主题信息,本文提出了一种基于LDA 建立发明人兴趣主题模型的方法,合并每位发明人的专利数据,专利信息基于发明人进行划分,将标准的文档- 主题-词的三层LDA 模型变为专利数据中的发明人- 主题- 词的发明人兴趣模型,实现发明人的主题发现,并利用该模型中主题分布之间的相似性进行发明人的个性化推荐。在采集真实专利数据集上的实验结果表明该方法相比传统的向量空间模型方法和隐马尔科夫模型方法具有更高的准确率,推荐效果更优。  相似文献   

7.
[目的 /意义]施引作者在引用过程中会概括、提炼被引论文成果价值点,发现此类信息有助于全面、深入地了解被引论文的学术价值。[方法 /过程]提出一种无监督多特征加权的价值点识别方法,进一步发现原文中未提及或未显著提及的价值点;对Athar引用语料库中高被引的20篇文献进行实验。[结果 /结论 ]实验结果表明,原文中未显著提及但引用中却强调的价值点可揭示被引论文发表后同行的共识与认可、引导跨库检索应用化成果、更新与补充被引论文关键词、收集被引论文主题缩写词等功能,实现对被引论文动态标引,提高论文显示度、检索效率以及跨库关联能力。由此,基于引用内容发现的价值点可以作为一种描述被引论文价值的动态生成的新型元数据即引用标签,发挥重点提示、检索与推荐等功能,丰富引用内容服务。未来将在更多领域、语种、类型以及更大的论文数据集上验证价值点发现的可行性和实用性。  相似文献   

8.
面向信息检索的词汇知识发现   总被引:1,自引:0,他引:1  
针对信息检索中词汇知识发现问题,提出面向信息检索的词汇知识发现框架结构,对面向信息检索的词汇的定义、同义词、相关词、排除词等词汇知识获取与挖掘进行详细的介绍,为后续的语义检索研究打下基础。  相似文献   

9.
发现力是经过深入研究与探索,敏感地寻求到别人没有看到的新鲜事物、揭示别人没有揭示的内在意义的能力。新闻发现力并非与生俱来的,并和从事新闻工作时间的长短也没有直接的关系。有的人从事新闻工作很长时间,对新闻发现的能力却不一定很强,只是敏感于显性新闻;而有  相似文献   

10.
俞琰  赵乃瑄 《图书情报工作》2018,62(21):118-126
[目的/意义]针对专利主题分析中以词为基本单位会造成专利中的多词术语难以被识别、主题模型结果不佳的问题,提出融入术语的专利主题发现模型,以解决该问题。[方法/过程]模型首先引入类别熵,有效地识别出专利文献中的术语;然后利用泛化波利亚瓮模型增加语义相似术语分配到同一主题的概率,以缓解术语作为基本主题模型分析单位所带来的数据稀疏性问题。[结果/结论]实验结果表明本文提出的模型包含的术语信息提高了主题生成的质量,使主题表示具有更强的可读性和主题判别性。  相似文献   

11.
基于非相关文献的知识发现原理研究   总被引:10,自引:7,他引:10  
从Swanson最早提出非相关文献的知识发现方法开始到现在,很多研究人员都投入到这个新兴的领域中去,概括起来分为以下几种方法:基于单词的词频统计方法、基于短语的词频统计方法、基于概念的知识发现方法、基于概念的词频统计方法,本文详细介绍了这些方法基本原理,并对其进行了简单的比较分析。  相似文献   

12.
周雷  李颖  石崇德 《情报工程》2015,1(3):064-075
基于机器学习的分词模型可以借助科技词汇构词特征分析提升其在科技领域的适应性,本文对传统语言学的句法构词、韵律构词、语义构词几个方面理论进行总结归纳,融合术语学研究理论,围绕提升分词准确率的目的,提出了适用于科技词汇的构词特征标注系统,并对标注系统的结构进行了规划。这为科技词汇构词特征标注工作完成了前期的探索,为后期批量标注,辅助分词等环节提供了基础依据。  相似文献   

13.
[目的/意义]探索热点事件评论网络中话题社群及网民的情感波动,掌握舆情事件发展过程,对于整体把握热点事件的发展方向,做好新时期网络舆论的引导工作具有重大意义。[方法/过程]以复杂网络理论为基础,基于评论词语间的共现关系构建基于事件发展的子事件网络,通过社群发现算法来识别子事件评论网络中的话题社群,将情感词依据情感词典赋予情感分类属性,基于事件的演化过程动态地跟踪网民意见以及情感波动。[结果/结论]研究结果表明,评论网络群落发现以及变异系数方法可以有效地衡量网民话题讨论的规模与集中程度;评论网络中赋予情感词节点情感分类属性方法可以体现事件演化过程中网民的情感变化;舆论衍生话题对事件的舆情发展有持续性影响;网民话题讨论内容对于事件演化具有一定程度上的前瞻性。  相似文献   

14.
[目的/意义]针对当前知识发现服务中存在的个性化程度不高和推荐效果不佳等问题,提出一种基于用户兴趣度量和内容分析的推荐算法。[方法/过程]文章通过特征词分布、LDA主题分布、引文结构网络三个维度构建学术资源模型,并通过对用户行为的度量,计算用户对其浏览学术资源的兴趣度,结合学术资源模型构建用户兴趣模型。将用户兴趣模型与学术资源模型匹配,计算其相似度,得到用户对每条学术资源的兴趣值,最后将兴趣值最高的TOP-N学术资源推荐给用户。[结果/结论]通过实验检验算法的有效性和推荐准确率,结果显示,本文从实时动态度量兴趣的角度,提出的推荐算法能较好地预测用户兴趣,推荐效果显著,为实现发现服务精准推荐提供思路。  相似文献   

15.
基于WordScore原理的信息政策价值评价模型与方法   总被引:1,自引:0,他引:1  
文章基于WordScore的基本原理和信息政策价值分类整合方法,构建了政策价值TESCO模型及词表,并以工信部和科技部的信息政策为样本,将政策文本进行语词切分,按照语词的价值属性建立“语词-政策价值”映射,从而提取文本的政策价值取向,并确定该文本或该领域的政策价值结构,比较不同领域的政策价值差异。  相似文献   

16.
This is the first of a series of columns on the emerging new role of the academic library as a center for learning—but learning in a new sense, with a new focus on what the student actually actively incorporates rather than on teaching method. The new perspective is captured in the concept of student-centered or inquiry-based learning, with special emphasis on reading and better utilization of the extensive print resources carefully collected by academic libraries over the decades.  相似文献   

17.
BBS中文新词语自动挖掘*   总被引:1,自引:0,他引:1  
针对从BBS文本中自动挖掘新词语的问题,提出一种结合统计和规则的简单易行的方法,采用中文分词、频数统计、词性过滤、词语碎片组合等关键技术。据此方法开发的系统可以自动挖掘不限长度、不限领域、不限类别的与上下文无关的任意新词语。  相似文献   

18.
将本体论和语义计算的相关技术引入到网络群体性事件的主题发现研究中,并通过构建食品安全领域本体进行实证研究。实验结果表明,该方法能够有效地获取主题信息,有助于实现网络群体性事件的主题发现。  相似文献   

19.
[目的/意义] 基于新时代人民日报分词语料库从不同维度统计分析句子长度和词汇分布,有助于了解当代汉语文本的语言学特征,进而开展自然语言处理和文本挖掘研究。[方法/过程] 在2018年1月人民日报分词语料的基础上,结合1998年1月人民日报分词语料,确定统计中所使用的6种句子类别,统计和分析字与词单位上的句子长度分布,并基于齐普夫定律揭示词汇静态分布情况。[结果/结论] 从字词维度上的句子长度分布情况和词汇的齐普夫分布状态上看,随着时间的推移,在1998和2018两个语料上,句子的长度和词汇的分布均发生变化,但这种变化又是延续的、有关联的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号