排序方式: 共有8条查询结果,搜索用时 234 毫秒
1
1.
事件检测与描述(Event Detection and Characterization,EDC)自2005年作为自动内容抽取(Automatic ContentExtraction,ACE)评测的一个重要子任务出现以来,中文事件的标注、检测与描述越来越成为研究热点。本文就自动内容抽取中的中文事件标注进行详细、系统地研究,主要包括:在ACE会议定义中文事件相关概念的基础上,给出事件标注中事件的可标注内容,包括事件范围及事件触发词等;根据生活中的事件分类在人工事件标注中对EDC的事件进行类别划分及其子类的详细区分,以降低事件检测的复杂度;对每个事件类别(包括子类别)中构成事件的元素进行研究,综合事件类别及其元素信息完成中文事件的标注。本文的研究成果在中文文本信息抽取、自动摘要及主题检测与追踪中得到了很好的应用。 相似文献
2.
3.
4.
5.
时间信息在事件检测与描述中起着决定性作用,对自动内容抽取中的事件检测进行研究,就应该首先对时间信息进行详细、系统地研究。本文致力于事件检测中的时间信息研究,对文本中有明显标记和无明显标记的时间进行区分;在明确要提取时间具体内容的基础上对时间进行详细分类并阐明其含义,其中包括精确时间、模糊时间、修饰类时间、时间集及其他不确定时间等;在此基础上对涉及时间信息的名词修饰语、时间间隔、嵌入式时间表达和时间定位词等时间范围信息进行研究;最后引入时间戳的概念,并对时间戳的类型及涉及时间戳与事件的关系进行详细研究,从而引出如何在时间戳研究的基础上,更好地进行事件检测与描述。本文的研究成果可以很好地应用于自动内容抽取、自动问答系统、话题追踪结果及自动文摘系统中。 相似文献
6.
基于条件随机场与自定义规则的时间表达式识别 总被引:1,自引:0,他引:1
本文致力于信息抽取中时间表达式的识别与提取研究.首先针对基于规则方法时间识别的缺点,将统计序列标注模型--条件随机场应用于时间识别中,充分利用时间表达式的内部和外部特征进行时间识别,提高了时间识别的准确率.然后通过对识别结果进行分析,自定义规则对识别错误结果进行后处理,进一步提高时间识别的召回率,弥补了机器学习模型获取知识不够全面而导致的召回率偏低的问题.实验结果表明,本文方法开放测试的准确率、召回率和F-值分别到达了91 65%、88 13%和89 85%,较传统方法均有所提高,是一种有效的时间表达式识别方法. 相似文献
7.
8.
自动文摘系统的评测是自动文摘技术研究与发展的关键部分.随着摘要技术的快速发展,国外学者十分重视评测技术,研究工作也如火如荼,而国内相关工作相对贫乏.文摘评测对文摘系统的性能有重大影响,对自然语言处理、信息检索等相关技术有着促进作用.本文详细介绍了文摘评测的两大方法:内部评测和外部评测,并对多年来文摘评测中应用的关键技术做了简要总结,最后指出文摘评测面临的挑战及未来需要努力的方向. 相似文献
1