首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 753 毫秒
1.
关键词同现网络结构研究   总被引:1,自引:0,他引:1  
通过对关键词同现网络结构的研究,有助于我们分析研究领域内的一些科研特征.以<情报资料工作>为例,建立了2004~2008年间发表研究论文的关键词同现网络,并使用复杂网络理论方法对该网络进行了研究.数据分析表明,该关键词同现网络是一个无标度网络,具有高聚类特性和小世界特性,并根据这些特性,对图书情报领域的科研特点进行了分析.  相似文献   

2.
郭玲 《科技通报》2015,(3):216-219
对可产生潜在威胁的网络数据进行挖掘的过程中,采用传统关联规则方法无法运算潜在威胁数据的关联性,降低潜在威胁数据挖掘的准确性,提出一种基于区域频繁扩展树的支持向量机回归算法,用于挖掘网络潜在威胁数据,构建潜在威胁下网络数据的区域频繁扩展树,获取潜在威胁下网络数据间的关联性,依据潜威胁下网络数据的关联性塑造基于支持向量机回归网络潜在威胁数据挖掘模型,模型利用支持向量回归估计模型分析数据回归曲线的平稳度,对比回归预测值同真实值间残差,对检测数据中的潜在威胁数据进行识别,完成潜在威胁下网络数据的准确挖掘。实验结果说明,采用所提方法对不同复杂度潜在威胁下的网络数据进行挖掘,具有较高精确度。  相似文献   

3.
随着网络技术的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.常采用向量空间模型来表示文本,将文本看作特征空间的一个向量,使用TF·IDF方法对特征加权.但是这种加权方法简单地认为文本频数少的单词就重要,文本频数多的单词就不重要,使它不可能很好地反映单词的有用程度,从而导致分类准确率下降.针对TF·IDF方法存在的问题,提出了一种基于特征基尼指数的特征加权方法TF·GINI.实验结果显示,这种加权方法具有很好的分类性能.  相似文献   

4.
英语单招考试题型中的"单词拼写"并不是单一地检测背写英语单词,而是将单词应用在句子中,即注重单词在语言中的实际运用。因此,我们不仅强调学英语必须背记单词,更要引导学生将词学活用活,并强化这方面能力的培养与训练。  相似文献   

5.
小学语文作文教学对学生日后语文能力的发展至关重要,小学是学习语言的开始,其主要是将单词组成句子,再将句子组成文章表达意思,学好小学语文可提高学生日后对语文的兴趣。本次研究先导式教学模式在小学语文作文教学中的应用效果,主要从先导式教学语境积累方面研究其运用到语文活动当中成效。  相似文献   

6.
本文为自动编制文摘的理论研究,对统计学法、数理逻辑法及语言学法在自编文摘中的运用进行了探讨,并以英文文献为例研究了却何在传统加权理论上,运用语言分析法建立提示性句子结构、对文献中提示性句子进行摘录,并对文摘自动组织规则进行了讨论。  相似文献   

7.
分析了词向量在自然语言处理中的作用。使用已经训练好的词向量进行了简单类比推理、词语间离和句子相似度分析。给出一种结合词向量和传统语义解析两者优点的句子相似度计算WCos公式,通过传统语义分析将程度词单独提取处理,使用权值修改对照表进行权值设置,然后对余弦相似度公式进行修正。该方法在句子相似度分析方面明显优于单纯依赖于词向量的句子相似度分析方法。  相似文献   

8.
[目的/意义]专利关键词提取是专利挖掘任务中非常重要的前置子任务,基于图模型的关键词提取是目前最有效的算法。传统图模型只考虑了单词的局部上下文信息,为了捕获单词的全局信息,提出一种基于图神经网络的专利关键词提取算法,结合词向量与图模型实现专利关键词的提取。[方法/过程]首先,用专利数据集构建异构网络,以专利分类号为标签,训练图神经网络模型,使得同一主题下的单词具有相似的向量表示,获取包含主题信息的词向量;然后,根据专利摘要在滑动窗口内的单词共现关系和词向量相似度,构建融合了单词主题信息的文本图,利用词向量中的主题信息捕获单词的全局联系;最后,在文本图上使用PageRank算法,获取关键节点,构成专利的关键词。[结果/结论]与基线方法相比,该算法在提取专利关键词时,能够检测到新颖性与准确性更高的关键词。  相似文献   

9.
介绍一个航班预定口语对话系统的设计与实现,该系统允许用户通过普通话进行航班信息查询与预定.重点介绍口语对话系统中的口语语言理解.为了克服语音识别引入的识别错误导致语义理解错误的问题,提出基于词混淆网络的两阶段中文口语语言理解方法:首先从词混淆网络中选择N元文法作为分类特征,进行主题分类,并通过语义分类模型解析获取对应的语义树结构;然后利用基于规则的语义槽填充器抽取相应的语义槽属性-值.该方法是数据驱动的,训练数据的标记比较容易.实验在汉语航班预定领域进行,结果表明,在语音识别字错误率很高的情况下,该方法比传统的基于语法规则的语言理解方法更加鲁棒,在语义理解正确率方面有明显改善.  相似文献   

10.
陈英 《科教文汇》2008,(3):53-54
针对许多人因为记不住英语单词而学不好英语,本文提出了巧记英语单词的四种方法:根据音标记单词、把单词放到句子里去记、根据构词法来记单词、根据词义记单词。  相似文献   

11.
用R语言分析关键词集共现网络研究   总被引:1,自引:0,他引:1  
袁润  李莹  王琦  王婧怡 《现代情报》2018,38(7):88-94
[目的/意义]提出关键词集的概念,探索R语言编程实现关键词集共现网络的创建和可视化,为进一步研究基于关键词集的数据挖掘和知识发现提供更为通用的途径和方法。[方法/过程]运用R语言编程技术及igraph等贡献包,自编了关键词集共现网络的创建和可视化函数,分析了图情学科领域的18种CSSCI源刊的载文数据。[结果/结论]计算了关键词集共现网络的中心性等特征参数,绘制了关键词集共现网络图。研究表明,关键词集共现网络揭示了关键词集的分布、聚类和关系特征,能更为直观的揭示分析对象的主题内容及其关联关系,其特征参数的构建及其表征等理论问题值得系统而深入的研究。  相似文献   

12.
【目的/意义】通过概念层次关系自动抽取可以快速地在大数据集上进行细粒度的概念语义层次自动划分, 为后续领域本体的精细化构建提供参考。【方法/过程】首先,在由复合术语和关键词组成的术语集上,通过词频、篇 章频率和语义相似度进行筛选,得到学术论文评价领域概念集;其次,考虑概念共现关系和上下文语义信息,前者 用文献-概念矩阵和概念共现矩阵表达,后者用word2vec词向量表示,通过余弦相似度进行集成,得到概念相似度 矩阵;最后,以关联度最大的概念为聚类中心,利用谱聚类对相似度矩阵进行聚类,得到学术论文评价领域概念层 次体系。【结果/结论】经实验验证,本研究提出的模型有较高的准确率,构建的领域概念层次结构合理。【创新/局限】 本文提出了一种基于词共现与词向量的概念层次关系自动抽取模型,可以实现概念层次关系的自动抽取,但类标 签确定的方法比较简单,可以进一步探究。  相似文献   

13.
李旭晖  周怡 《情报科学》2022,40(3):99-108
【目的/意义】关键词抽取的本质是找到能够表达文档核心语义信息的关键词汇,因此使用语义代替词语进 行分析更加符合实际需求。本文基于TextRank词图模型,利用语义代替词语进行分析,提出了一种基于语义聚类 的关键词抽取方法。【方法/过程】首先,将融合知网(HowNet)义原信息训练的词向量聚类,把词义相近的词语聚集 在一起,为各个词语获取相应的语义类别。然后,将词语所属语义类别的窗口共现频率作为词语间的转移概率计 算节点得分。最后,将TF-IDF值与节点得分进行加权求和,对关键词抽取结果进行修正。【结果/结论】从整体的关 键词抽取结果看,本文提出的关键词抽取方法在抽取效果上有一定提升,相比于TextRank算法在准确率P,召回率 R以及 F值上分别提升了 12.66%、13.77%、13.16%。【创新/局限】本文的创新性在于使用语义代替词语,从语义层面 对相关性网络进行分析。同时,首次引入融合知网义原信息的词向量用于关键词抽取工作。局限性在于抽取方法 依赖知网信息,只适用于中文文本抽取。  相似文献   

14.
By the development of the computer in recent years, calculating a complex advanced processing at high speed has become possible. Moreover, a lot of linguistic knowledge is used in the natural language processing (NLP) system for improving the system. Therefore, the necessity of co-occurrence word information in the natural language processing system increases further and various researches using co-occurrence word information are done. Moreover, in the natural language processing, dictionary is necessary and indispensable because the ability of the entire system is controlled by the amount and the quality of the dictionary. In this paper, the importance of co-occurrence word information in the natural language processing system was described. The classification technique of the co-occurrence word (receiving word) and the co-occurrence frequency was described and the classified group was expressed hierarchically. Moreover, this paper proposes a technique for an automatic construction system and a complete thesaurus. Experimental test operation of this system and effectiveness of the proposal technique is verified.  相似文献   

15.
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。  相似文献   

16.
Traditional topic models are based on the bag-of-words assumption, which states that the topic assignment of each word is independent of the others. However, this assumption ignores the relationship between words, which may hinder the quality of extracted topics. To address this issue, some recent works formulate documents as graphs based on word co-occurrence patterns. It assumes that if two words co-occur frequently, they should have the same topic. Nevertheless, it introduces noise edges into the model and thus hinders topic quality since two words co-occur frequently do not mean that they are on the same topic. In this paper, we use the commonsense relationship between words as a bridge to connect the words in each document. Compared to word co-occurrence, the commonsense relationship can explicitly imply the semantic relevance between words, which can be utilized to filter out noise edges. We use a relational graph neural network to capture the relation information in the graph. Moreover, manifold regularization is utilized to constrain the documents’ topic distributions. Experimental results on a public dataset show that our method is effective at extracting topics compared to baseline methods.  相似文献   

17.
【目的/意义】从海量微博信息中提取准确的主题词,以期为政府和企业进行舆情分析提供有价值的参考。 【方法/过程】通过分析传统微博主题词提取方法的特点及不足,提出了基于语义概念和词共现的微博主题词提取 方法,该方法利用文本扩充策略将微博从短文本扩充为较长文本,借助于语义词典对微博文本中的词汇进行语义 概念扩展,结合微博文本结构特点分配词汇权重,再综合考虑词汇的共现度来提取微博主题词。【结果/结论】实验 结果表明本文提出的微博主题词提取算法优于传统方法,它能够有效提高微博主题词提取的性能。【创新/局限】利 用语义概念结合词共现思想进行微博主题词提取是一种新的探索,由于算法中的分词方法对个别网络新词切分可 能不合适,会对关键词提取准确性造成微小影响。  相似文献   

18.
学术论文的关键词与引文共现关系分析及实证研究   总被引:3,自引:0,他引:3  
文章设计了用于文献不同特征交叉共现关系的分析算法,并将这种方法应用于关键词与引文的交叉共现关系研究。实验以计量研究为实证领域,通过微观的交叉共现对、宏观的可视共现网络这两个层次,对关键词与引文的交叉共现结果进行分析与解释,发现关键词与引文的交叉共现分析可用于发现领域的研究方向、识别论文的研究主题、查找某一研究方向的经典文献等。  相似文献   

19.
刘海涛 《情报科学》1994,15(5):37-43
本文首先回顾了多语现象带给人类的种种不便。计算机网络的出现使得这一古老的问题更加突出。为解决这一问题,本文简要介绍了一种基于网络的机器翻译系统DLT(分布式语言翻译系统)。考虑到这一系统的复杂性和FAHQ在近期内是难以实现的。作者提出了一这基于国际语学中通用语法概念的网络语言通讯方法。  相似文献   

20.
宋秀芬 《科技广场》2014,(5):142-145
本文以CNKI为数据源,基于文献计量的角度,对2000-2013年国内馆际互借领域发表的论文进行分析,利用社会网络分析方法生成国内馆际互借的研究成果年限分布表、关键词共现矩阵和关键词共现图谱,剖析了国内馆际互借领域的研究前沿与研究热点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号