排序方式: 共有74条查询结果,搜索用时 250 毫秒
11.
语言是科学交流的载体,科学交流的语言分布反映了全球科技话语权的格局,本文基于科学推文视角揭示了非正式科学交流中的语言分布,并与基于科技文献的正式科学交流语言分布做了对比分析。研究发现:①科学推文语言集中分布在英语(91%)、日语(24%)和西班牙语(17%),而科技文献语言集中分布在英语(942%)、中文(43%)和土耳其语(04%);②科学推文和科技文献的语言分布均存在学科差异,体现出不同语言作者对特定学科关注度的不同;③除了沙特阿拉伯之外,世界各国即使母语不是英语,均以英语科学推文占主导地位,母语科学推文屈居第二;④英语、德语、日语、法语等语种的科技文献获得科学推文最多,而科技文献量和质量名列前茅的中文和土耳其语文献获得的科学推文很少。结果表明,英语俨然已经成为非正式科学交流中的通用语,提高中文在科学交流中的国际影响力任重道远。图3。表3。参考文献15。 相似文献
12.
[目的/意义]社交媒体下非正式学术交流逐渐成为学者们学术交流的又一新天地,探索社交媒体下具有综合交叉学科性质的图书情报领域的跨学科特性,可以作为传统学术交流研究的一个补充与参考。[方法/过程]以科学网博客为代表,从用户好友关系、评论关系及推荐关系三个角度构造学科亲缘树,然后借用亲缘树的多样性指标分析了图书情报的跨学科特性。[结果/结论]通过本文研究,发现图情领域用户学科亲缘树与好友学科亲缘树之间存在强相关性,推荐对象的学科亲缘树与评论对象的亲缘树存在极强相关性;此外,本文还发现"计算机科学""管理科学与工程""宏观管理与政策"是社交媒体上图情领域用户最亲缘学科。 相似文献
13.
[目的/意义]问题和方法是学术论文的重要组成部分。将散落在学术论文中的问题与方法进行有效组织,例如问题与方法识别及其之间的关系抽取,可挖掘学术论文中的隐性知识,促进学科的方法体系和问题体系构建。对学术论文中问题与方法识别及其关系抽取的相关研究工作的梳理,有助于把握该研究的发展趋势、发现该研究中存在的不足,并为未来的工作提供借鉴和指导。[方法/过程]在学术论文的问题和方法的挖掘方面,现有研究围绕4个研究点展开,分别是问题与方法及其关系定义、问题与方法及其关系标注数据集构建、问题与方法识别及其关系抽取的模型设计以及问题与方法及其关系的应用。本文分别对这4个研究点进行梳理,归纳总结现有学术论文中问题和方法知识挖掘的现状。[结果/结论]分析发现,在问题与方法的相关定义中,较少结合科学哲学中的问题学等理论进行定义;在问题与方法数据集构建中,存在数据集重复标注的现象,另外,开源数据集集中在自然科学领域且一般为英语语料,中文开源语料稀缺;在问题与方法识别及其关系抽取中,现有抽取模型性能较低;有关问题和方法的研究不应止步于词语识别和关系抽取,需对挖掘出的知识进行深入分析和应用。 相似文献
14.
[目的/意义]从全文本内容分析的角度对算法的学术影响力进行分析。[方法/过程]以自然语言处理领域十大数据挖掘算法使用为例,分析不同算法在特定领域的影响力。通过对1965年-2006年间发表的自然语言处理领域10 922篇学术论文的调研,从其全文内容中抽取6 001条包含十大数据挖掘算法的句子(简称算法句);针对算法句从提及论文数、总提及次数、提及位置等3个方面,对不同算法的影响力进行比较分析。[结果/结论]以不同特征作为影响力衡量标准,十大数据挖掘算法在自然语言处理领域学术论文中的影响力有明显区别,在基于论文数、提及数和提及位置的评估标准中,SVM算法表现出较高的影响力,Apriori算法的影响力则明显低于其他算法。本研究为量化评估算法的影响力提供了新思路。 相似文献
16.
专利技术互补性作为各类组织进行技术创新的重要参考,近年来受到国内外学者的广泛关注。本文回顾了技术互补性概念的发展沿革,从产业/行业分类、专利分类、专利引用关系以及专利内容特征关联四个角度归纳其测度方法,最后综述专利技术互补性的多种应用。基于此,总结形成专利技术互补性的概念内涵,发现相关研究主要利用专利分类或专利引用网络来形成技术互补测度指标和方法,并主要应用于创新绩效因素判定、企业并购决策制定以及潜在合作伙伴发现等。未来,建议继续细化和具体化技术互补性概念,综合利用专利文本、图表、市场信息等多模异构数据,设计细粒度定量测度指标,引入深度学习等方法,提升专利技术互补测度的准确性,进一步拓宽专利技术互补性的应用范围,提升应用效果。 相似文献
17.
挖掘社交媒体舆论中隐含的观点有助于人们快速有效地了解社交媒体舆论,避免主观和随意地发表评论,传播错误信息进而引发恶性事件。目前,社交媒体观点挖掘主要从观点主题、倾向性或某方面内容等单个维度分析舆论,人们难以全面认识舆论并掌握这些观点内容之间的逻辑关联等多维度信息,且各子任务的相关性能还有待提高。为了更准确地了解且综合地分析不同维度的舆论信息,促进人们对社交媒体舆论的深入认知,本文提出了一种面向社交媒体短文本,体现各维度观点内容之间逻辑关系的层次观点树构建方法,并选取推特(Twitter)中有关羟基氯喹治疗COVID-19疾病的话题内容,进行层次观点树构建的实证研究。结果表明,本文提出的层次观点树构建方法能够提供多维度、易理解的社交媒体观点信息。 相似文献
18.
基于百科资源的多策略中文同义词自动抽取研究 总被引:3,自引:1,他引:2
采用实证的方法,以百度百科语料库为实验抽取对象,在对同义词自动抽取技术分析比较的基础上,提出了多策略的中文同义词抽取的思路.综合利用字面相似度方法、特征模式匹配方法和PageRank链接分析方法对中文百科语料库中的同义词进行自动获取,具有多领域适用性、获取同义词类型多样性等特点.实验结果表明,该方法具有可行性,并可应用于其它语种的同义词自动获取中.未来的研究应进一步实现模式的自动定义、完善抽词词典、有效排除噪音数据并构建能真实反映语义关系的词汇矩阵.图1.表6.参考文献13. 相似文献
19.
基于样本加权的文本聚类算法研究 总被引:3,自引:0,他引:3
样本加权聚类算法是一种最近才引起人们注意的算法,还存在一些需要解决的问题,例如,聚类对象之间的结构信息对样本加权聚类是否有帮助,如何将结构信息自动转换为样本或对象的权重?针对该问题,本文以学术论文为聚类对象,以K-Means算法为聚类算法基础,利用论文之间的引用关系计算每篇论文的PageRank值,并将其作为权重,提出一种基于样本加权的新的文本聚类算法.实验结果表明,基于论文PageRank值加权的聚类算法能改善文本聚类效果.该算法可推广到网页的聚类中,利用网页的PageRank进行加权聚类,来改善网页的聚类效果. 相似文献
20.
Deep Web中包含着大量高质量内容,当前的搜索引擎技术还不能对其进行搜索,研究Deep Web的大小、质量及分布情况将有助于找到对其进行有效搜索的方法和技术.以网络蜘蛛采集的2006年10月的数据为样本,利用统计、概率等定量方法和定性方法,首次对中文Deep Web的大小、质量及分布情况进行调查,得出概况如下:① Deep Web大小比Surface Web 的大240倍以上;②包含的文件总数量和总存储量分别为507亿、11 700TB;③可搜索数据库数量超过3万个;④内容质量较高;⑤内容主题分布不均匀. 相似文献