共查询到19条相似文献,搜索用时 156 毫秒
1.
研究发现,非相关文献知识发现有三个理论基础:检索理论、文献计量学理论和逻辑学理论.其中目标性检索策略、共现理论与三段论的逻辑推理是非相关文献知识发现的实际应用理论.目标性检索策略总的原则是缩小范围,提高主题关联度与准确性,这决定了非相关文献知识发现过程中过滤和排序方法的改进方向;而基于三段论逻辑推理的非完全形式化,非相关文献知识发现应改变目前的以完全自动化为目标的研究方向,实现高阶共现框架下的非相关文献知识发现的过滤和排序方法的优化,从而形成人工辅助下的更具实际应用价值的知识发现系统. 相似文献
2.
3.
介绍了Swanson基于非相关文献知识发现的原理及国内外学者在此基础上进行的研究与进展情况,重点阐述了多种非相关文献知识发现过程的算法模型,提出了把该原理应用与汉语文献进行非相关文献知识发现的设想,并对算法模型进行了初步探讨。 相似文献
4.
基于文献内聚度的非相关文献知识发现排序方法研究 总被引:1,自引:0,他引:1
在对现有非相关文献知识发现中间集排序方法进行分析的基础上,以共现理论为基础,以主题关联度为着眼点,提出基于文献内聚度加权的B排序方法.并以Swanson的早期发现之一为基础,考察经文献内聚度加权和逆文献频率加权两种方法排序筛选后B的范围以及目标关联词和目标关联对的出现情况,以此作为评价其对B影响的依据.结果表明基于文献内聚度加权法能显著提高B的质量,从而提高发现效率. 相似文献
5.
基于非相关文献的知识发现原理研究 总被引:10,自引:7,他引:10
从Swanson最早提出非相关文献的知识发现方法开始到现在,很多研究人员都投入到这个新兴的领域中去,概括起来分为以下几种方法:基于单词的词频统计方法、基于短语的词频统计方法、基于概念的知识发现方法、基于概念的词频统计方法,本文详细介绍了这些方法基本原理,并对其进行了简单的比较分析。 相似文献
6.
本文对非相关文献知识发现方法从产生背景、基本概念、研究历程、知识发现过程进行了简要概述,并着重对非相关文献知识发现方法的研究进展进行了总结,分别对该研究领域的杰出研究人员如Swanson、Z.Chen、Gordon、Lindsay、Cort、Weeber、Padmini Srinivasan、Wren等人的研究成果进行了概述,最后从情报学的学科建设、情报学的应用以及情报工作人员的角度探讨了非相关文献知识发现方法的研究意义。 相似文献
7.
基于文献关键词的三元共词分析方法——以知识发现领域为例 总被引:2,自引:1,他引:1
共词分析是一种有效地文献内容分析方法,已经在各种情报研究工作中得到了广泛的应用.共词分析方法本身也在应用过程不断被改进和发展,但是目前共词分析研究主要关注二元词对共现的研究,对三元甚至多元词组的共现很少涉及.研究参考国内外共词分析研究成果,借鉴DLG关联挖掘算法,提出基于位向量的三元共词分析算法和基于坐标图的三元共词结果分析方法.并以国内知识发现研究的期刊论文关键词为对象进行三元共词分析实证研究,发现三元共词结果具有一定的实际意义,三元共词分析有一定的应用价值. 相似文献
8.
9.
面向非相关文献的知识关联能够促进新知识的产生,为科学研究寻找新的线索提供了一种便捷、有效的辅助手段。本文首先设计了面向非相关文献的知识关联发现系统,该系统以《中国分类主题词表》为主题词受控词表,通过对文献摘要的中文分词处理,提取主题词并标引,提取文档特征矩阵并利用计量分析技术和聚类技术分析文献间特征的相似、相异水平,从词的粒度层面对非相关文献之间的关系进行挖掘,揭示非相关文献的知识关联。其次,基于该系统为用户精确匹配相关的知识库,采用TOP?K算法反馈与用户相关的文献集,为用户提供满意度更高的知识发现及相关扩展服务。图5。参考文献29。 相似文献
10.
汉语社会科学文献非相关文献知识发现的实证研究——以农业经济学文献为例 总被引:3,自引:0,他引:3
将非相关文献知识发现方法应用于汉语社会科学文献,并具体以1989-2008年间国内核心期刊上发表的农业经济学论文为文献源,实施非相关文献知识发现运算,筛选得到"世界贸易组织"与"原教旨主义"、"马尔萨斯"与"生态学"、"区域农业保险费率"与"地理信息系统"等三对有意义的关联概念.验证结果表明,这些概念间的关联是正确的,可作为农业经济领域的新知识.由此证明,在社会科学领域非相关文献知识发现方法可以为寻找研究方向与研究课题提供新思路. 相似文献
11.
12.
基于 UMLS医学本体的挖掘文献间潜在联系的设计与实现 总被引:1,自引:0,他引:1
以Swanson的非相关文献知识发现的原理为依据,采用自然语言处理技术,将不规范的自然语言转换为UMLS中的概念,同时引入语义过滤系统,开发出非相关医学文献潜在联系的挖掘工具,同时用Swanson发现镁与偏头痛的数据做验证,结果表明,该方法能很好地重现Swanson的研究结果,并且能发现更多的有潜在价值的中介词,具有较高的效率。 相似文献
13.
非相关文献知识发现的关键技术研究 总被引:3,自引:0,他引:3
本文在对非相关文献知识发现中的关键技术进行界定的基础上,对11个国外主要的非相关文献知识发现研究中所涉及的关键技术,即初始文本集的构建、信息抽取及中间关联词的确定与排序等进行了比较研究,认为B集合质量低是非相关文献知识发现目前存在的主要问题.针对该问题,作者提出以提高B集合的质量为主要目标,从B集合形成的前过程,即初始文本集的质量以及B集合本身的质量,即B词的排序两个方面的改进策略.前者包括初始文本集的合理结构及综合过滤机制,后者包括双向词频法、基于MeSH加权和基于文献内聚力加权.并对部分改进策略进行了试验. 相似文献
14.
The primary goal of the present study is to discover new drug treatments by topology analysis of drug associations and their therapeutic group network. To this end, we collected 19,869 papers dated from 1946 to 2015 that are related to autism treatment from PubMed. We extracted 145 drugs based on MeSH terms and their synonyms (the total number is 6624) within the same ATC classification hierarchy and used them to find drug associations in the collected datasets. We introduced a new topology-driven method that incorporates various network analyses including co-word network, clique percolation, weak component, pathfinding-based analysis of therapeutic groups, and detection of important drug interaction within a clique. The present study showed that the in-depth analysis of the drug relationships extracted from the literature-based network sheds new light on drug discovery research. The results also suggested that certain drugs could be repurposed for autism treatment in the future. In particular, the results indicated that the discovered four drugs such as Tocilizumab, Tacrolimus, Prednisone, and Sulfisoxazole are worthy of further study in laboratory experiments with formal assessment of possible effects on symptoms, which may provide psychologists, physicians, and researchers with data-based scientific hypotheses in autism-drug discovery. 相似文献
15.
从用户、信息源和数字化手段等方面总结嵌入式知识发现情报分析服务的发展特点,研究分析嵌入式知识发现情报分析服务所涉及的人才队伍建设、需求调研、知识发现系统、综合分析方法和用户反馈机制等关键内容,并从商业化和机构已研发的知识发现系统角度,研究融入科研数字环境的情报分析服务,对情报分析可开展的服务内容进行探究。 相似文献
16.
17.
[目的/意义] 以数据集成过程中异构信息的集成为研究目标,在保证文献综合集成系统对信息提取的准确性要求的基础上,以资源环境学科为例,提出一种异构信息的标准化处理方式。[方法/过程] 采用团队自建的资源环境学科知识本体为依据,通过对资源环境学科异构信息在地理空间、时间单位及属性提取中的标准化分析,提出异构信息标准化处理的思路,指导搭建实现信息集成、支持综合集成的人机交互的文献综合集成平台。[结果/结论] 最终主要针对不同数据格式、不同来源的文献进行知识格式化提取及处理,完成文献综合集成的数据准备阶段的工作。异构信息标准化处理仅仅是知识发现过程的起点,后续将重点关注标准化的信息统计分析及可视化展示,完整实现文献综合集成的知识发现过程。 相似文献
18.
[目的/意义]分析并提出虚拟健康社区文本数据的知识发现策略,构建虚拟健康社区文本数据知识发现模型。[方法/过程]通过总结分析虚拟健康社区文本数据特点,针对其特点带来的数据挖掘困难制定相应的知识发现策略,并在DIKW体系指导下,依据提出的知识发现策略构建虚拟健康社区文本数据知识发现模型。通过应用计算机编码、自然语言处理技术、句法分析、制定推理规则等方法实现从自由文本数据到药物不良反应智慧的数据价值升华过程。[结果/结论]通过实证研究验证提出的知识发现策略和知识发现模型的有效性和可操作性,为后续虚拟健康社区文本数据知识发现的相关理论与实证研究提供参考。 相似文献
19.
中文文本解构与知识发现研究 总被引:2,自引:0,他引:2
中文文本是一个结构化的、综合性的信息和知识集合体,对中文文本的结构和特征进行分析,并对文本结构中所包含的各类要素进行分析,或重新排列和组织,以便发现文本中蕴含的知识和信息,是文本知识发现的重要途径之一.文章通过对中文文本的基本结构、主要特征、知识来源、知识组织等的探讨,以期达到文本知识发现的目的. 相似文献