首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对网页文本结构信息少、噪声大的特点,将句子看作点,将句子间的相似性看作边,用句子关系图描述文本中句子间的关系。抽取文本主题句的任务转化为搜索图中边最多的点。利用语义词典,将句子相似度定义为句子语义相似度,解决短文本词频相似度低的问题。选用互联网公开语料进行测试,抽取的主题句达到平均80.6%的可接受性。  相似文献   

2.
在句组中,那种只由两个或三个简短单句组成的简单句组,意思比较单纯,结构也简单,一般说来,组织和使用都比较容易。可是,复杂的句组,情况就不同了。这种句组,思想内容多,结构也复杂:它往往由众多的句子构成,而句子,可能是结构复杂的单句,以及复杂的多重复句,复句的分句又可能是复杂的句子形式;同时,它的结构层次也多,结构关系也复杂。这种句组,无论是  相似文献   

3.
(4)结构不当,造成歧义 标题都是由词组或者句子(有的是单词)来充当的。词组或者句子都是一种语言结构;而语言结构都是有层次的,组成词组或句子的词语就处在这种语言结构的不同层面上,处在不同的结构关系中,表达某种特定的语义,起着不同的作用。如果结构不当,可做两种或者多种不同的结构层次分析,自然就会表达多种不同的语义和语法关系,固而造成题意歧解。例如:  相似文献   

4.
一个复句,是由两个或两个以上的分句组成的:一个句组(也称句群)或文章段落,是由两个或两个以上的句子(单句,以及复句)组成的。无论是分句,还是句子,当它们多个连在一起组成复句或句组、段落时,它们之间就在意义上或结构上发生这种或那种关系而有机地密切地联系在一起。但其中的每个分句,或者每个句子,却仍有相对完整的意思,和表达这种意思所必备的结构形式,它们之间的界限是分明的。例如:  相似文献   

5.
在词与词的偏正式组合中,或者在句中的定语之后,有时并不需要使用助词“的”,或者是可用可不用。这种情况下,一般是不再使用“的”。例如:“巨大力量”、“紧急任务”、“进口汽车”、“新鲜蔬菜”、“试点企业”;“这种病人特别需要新鲜空气”、“毕业班学生要进行社会调查”,等等。如果在并不需要使用“的”的地方,硬是使用了“的”,就往往会错误地改变本来正确的语法关系,并使语义发生错误,这就是助词“的”的滥用了。例如将“特价书市”说成“特价的书市”,将“高速公路”说成“高速的公路”,将“我们哥俩住一间客房”说成“我们的哥俩住一间的客房”等等,都是不通的,都改变了定中关系的性质,使词语或句子成分搭配不当,使语义发生错误,都属结构助词  相似文献   

6.
句组既然是一种由若干个句子构成的语言结构,自然就有一个句子安排与层次组织的问题。句子的安排无非是句子先后顺序的排列以及句子之间的连接和相互关系的处理;层次的组织主要是指哪些句子间的关系更密切,可以结合在一起,以及层次的安排,连接和过渡等。结合在一起,以及层次的安排,连接和过渡等。句子安排与层次组织是密不可分地联系在一起的。这两者处理得好,那就会使句组成为一个层次分明、结构严谨、浑然和谐的整体,从而更清楚更有力地表达中心思想。例如: ①抵御风沙袭击的方法是培植防护林。1防护  相似文献   

7.
针对文本聚类分析结果表达中缺乏语义关系的缺陷,本文利用人们在可视化形式下对模型和结构的理解和获取能力,提出了一种新的可视化表达方法。通过改进的Force-directed模型对聚类分析结果进行文本布局,表现文本间的语义相似关系;使用等值线生成算法构建层次性主题图,聚集和提炼文本主题;最终实现文本聚类分析结果的语义直观表达。实验结果表明,这种可视化方法不仅能够有效地表达聚类结果,体现类间、文本间的语义相关程度,而且还有助于发现隐含的信息,并通过类别之间的关联实现有效的信息导航。  相似文献   

8.
在科技文献中,需要描述的事物和概念远比可用的符号多,现实中符号的合理应用和表达是相当复杂的。研究符号描述句的重点是,探讨符号的应用(语义)和符号的表达形式之间的关系。结果表明:就符号的语义可有指称概念符号和表述功能的符号;就符号的形式可有文字符号、数字符号、标点符号和特种符号。文章探讨符号的语义与形式之间存在的某些规律,如指称符号必须以文字符号作主符号并配以相应的字体或变化;功能符号多使用特种符号和标点符号;等等。探讨了编辑人工语言与标准化规范化加工的关系。  相似文献   

9.
助词“的”运用中的错误,除前几篇短文分析过的几种以外,还有一些;本文再补充分析以下几种: 第一、助词“的”连用不当 在有的语言结构中,有时需要连续使用多个“的”,这时,就一定要弄清楚由“的”所联系的各项词语之间的关系,以准确地表达它们之间的语法、语义关系。否则,就往往会造成助词“的”连用不当的错误,而使所联系的各项词语之关系错乱,语义不通或者错误。例如:  相似文献   

10.
归纳总结语义分析方法的发展概况,在本体构建中,提炼出一种语义分析方法,并对该方法的要素进行详细分析,结合产品分类开展本体构建的语义分析方法实验,着重于解决现有很多本体中语义表达过于简单的问题,建立大量的概念间关系、属性间关系、概念与属性间关系、实例间关系、概念与实例间关系,并进行形式化逻辑表达。  相似文献   

11.
“水平”置于其他词语之后,除做中心词,与相关词语构成定中关系外,还可做宾语,与相关词语构成动宾关系。如果对这种动宾关系处理不当,就会造成动宾关系不调的错误。这种错误,常见的有两种形式:一种是全句的动宾关系不调,另一种是句子成分内部的动宾关系不调。 (1)全句的动宾关系不调 这主要是指“水平”做全句宾语时,与  相似文献   

12.
本文从句子级的角度进行了中文文本的情感倾向分析,提出以HowNet中的情感词表为种子情感词集,采用基于CRF模型的半监督学习迭代方法获取大量评价词,然后依据中文词间的语义规则判断句子的极性的方法.将该方法应用于COAE2011中任务2-观点句识别,在评价词的识别和观点句极性判断都取得了很好的结果.  相似文献   

13.
基于概念外延的Folksonomy语义关系挖掘方法   总被引:4,自引:0,他引:4  
为改善Folksonomy中的资源利用效率,对Tag间的语义关系挖掘进行研究,提出一种利用大众标引关系、通过界定概念外延挖掘Tag间语义关系的方法。在del.icio.us真实数据上所进行的实验验证该方法是可行的。  相似文献   

14.
本体中同种语义关系间的可传递规律研究   总被引:2,自引:2,他引:0  
语义传递是研究知识组织、语义相关度以及知识挖掘与推理等信息科学领域的关键因素,但是由于缺乏语义传递判断的计算机模拟限制了其在信息科学领域的应用.语义关系间的可传递性是语义传递判断的关键因素,其规律性特质反映出了语义传递的相对稳定性,这种稳定性使得语义传递判断的计算机模拟成为可能.本文主要围绕同种语义关系间的可传递性规律获取方法,基本获取方法的经典型语义关系的传递规律,规律检测以及传递规律应用四个方面展开了研究,目的在于为语义传递判断的计算机模拟以及语义传递在信息领域中的应用提供基础.  相似文献   

15.
分众分类标签的语义模糊性和标签无序性使得检索效率越来越低,为准确定位标签语义,旨在研究一种新的方法,从主题词表的词间关系判断标签间的语义关系。以《中国分类主题词表》教育类主题词搜索Delicious网站得到的相关标签作为数据源,分析标签与主题词的重叠度,选择《中国分类主题词表》和ERIC在线教育词表作为标签的语义关系抽取工具,认为相关标签集中语义关系较为丰富。  相似文献   

16.
在句组的组织安排中,除上文所说的结构断层的错误外,还有结构层次混乱这类毛病。我们知道,每个句组的中心思想,都是由一层一层的意思来加以说明的。这一层一层意思的安排、衔接,必须“有序”、紧密。即合乎其内在的逻辑关系。否则,层次界线不清,前后相互纠缠,或眉毛胡子一把抓,理不清头绪,或东拉西扯,颠三倒四,敲不正点上筹等,都会造成结构层次混乱。这样,自然就不能正确地表达其中心思想。例如:  相似文献   

17.
“多问一句”与“少问一句”其实是一种采访作风。“多问一句”,或许能使新闻事实愈加真实.甚而臻于完美;“少问一句”,或许将使新闻事实发生变异.甚而失实。  相似文献   

18.
在语言运用中,有些句组常常以设问的方式将所要论述或说明的中心思想提出来,其后的部分就是对所提问题(即所要阐明的中心思想)的阐释或说明。这种组织句组的方式有其突出的优点:可很快将读者的注意力集中到所要阐明的中心思想上来,并给读者以鲜明深刻的印象;便于展开阐释和说明,也便于将对问题的论述一层层地深入下去;可  相似文献   

19.
科技文稿歧义句辨析   总被引:1,自引:0,他引:1  
歧义句是指一句话有两种或几种可能的解释。科技文稿中的歧义句,无论对作者,对编者,还是对读者,都是一种困扰。歧义句应视为语言表达中的一类弊病,当为科技写作中一个值得重视的问题。1时空、数量条件交待不清造成歧义例1提倡横排。确需竖排时,文中所涉及的数字除...  相似文献   

20.
本文针对客观知识体系中相邻的语义关系对组合的可能性问题即语义关系可组合性问题,以WordNet为背景,基于客观知识体系中概念间语义关系网的构架特点,设计了语义关系对可组合性函数,并通过统计实验获得了可组合性强度,最后对实验结果进行了共现聚类分析,分析并得出了语义关系对可组合的一些结论和规律.这种组合后语义关系的相关性研究克服了语义关系对的组合爆炸现象,并为实现基于客观知识体系来研究语义关系间可组合的有效性、信息科学领域的相关性奠定了基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号