首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
介绍了一种新的基于汉语篇章结构的自动方法。在文本物理结构的基础上,利用汉语复句研究理论、RST理论和各种汉语语言特征的融合方法对文本内容进行了深入的分析,确定了文本的各层次语言单元之间的逻辑关系,得到了文本的逻辑结构。经过加权规则抽取文摘,并通过消歧规则使文摘连贯流畅,最后给出了系统测评。  相似文献   

2.
介绍了一种新的基于汉语篇章结构的自动摘要方法.在文本物理结构的基础上,利用汉语复句研究理论、RST理论和各种汉语语言特征的融合方法对文本内容进行了深入的分析,确定了文本的各层次语言单元之间的逻辑关系,得到了文本的逻辑结构.经过加权规则抽取文摘,并通过消歧规则使文摘连贯流畅,最后给出了系统测评.  相似文献   

3.
廖建军 《情报科学》2018,36(7):123-129
【目的/意义】为给数字出版知识服务系统提供高质量的文本语料以供知识抽取,本文提出了基于标签样式 和密度模型来抽取网页正文的方法。【方法/过程】该方法先根据标签样式将网页文本进行分块,再根据各块文本内 容的文本密度、标点密度、非超链接密度计算出综合密度,最后通过阈值判断抽取出网页中信息含量高的正文。【结 果/结论】该方法简单高效无需人工编写规则或训练,能完整地抽取出网页正文。通过随机选取新闻网页进行实 验,结果表明该方法能有效地自动抽取网页正文,适用于不同设计风格的网站,而且准确率和召回率优于基于统计 的 CEPR抽取方法。  相似文献   

4.
周莹 《科教文汇》2007,(5S):198-199
论文设计实现中文搜索网页分类系统,包括:关键字搜索结果网页类型判断方法,网页主题内容提取。对于不容易分类的网页,采用基于摘要的网页搜索结果聚类和基于学习的网页搜索结果分类器设计方法。最后,构造中文文本分类器,并编程实现,通过实例测试分类器性能。  相似文献   

5.
对Web网页抓取是实现Web文本特征数据检索的最佳方式,Web网页抓取路径损耗误差的优化估计可以提高对Web数据的挖掘性能。传统方法中,对Web网页抓取采用基于线性滤波检测的单模匹配抓取方法,受弱信号幅度和临界阈值约束,路径损耗较大,且无法有效实现路径损耗误差有效估计。提出一种基于叠加编码特征统计的Web网页抓取路径损耗误差估计算法。构建Web网页文本特征抓取的目标函数,进行Web网络路径损耗模型构建,设计叠加编码算法进行特征统计,得到Web网页抓取路径概念格。仿真实验表明,该算法能有效提高Web网页抓取路径损耗误差估计精度,进而提高了Web网页文本数据抓取的查准率和文本特征数据的挖掘性能。  相似文献   

6.
自动文摘综述   总被引:2,自引:0,他引:2  
刘挺  吴岩  王开铸 《情报科学》1998,16(1):63-69
本文回顾了自动文摘技术的发展历史,介绍了三种主要的文摘方法,即基于文本物理信息分析的方法、基于自然语言理解的方法以及基于文本结构分析的方法。同时指出了自动文摘技术目前存在的问题,包括摘要内容冗余的问题、摘要的语言缺乏连贯性的问题等,并探讨了文摘技术未来的发展方向。  相似文献   

7.
程娟  平西建  童莉  杨洋 《情报杂志》2006,25(4):69-70,73
在网络文本图像的自动提取过程中,计算机难以直接实现基于高层语义特征的文本图像提取,因此文本图像提取技术的性能很走程度上依赖于底层统计特征的提取。广义归一化图像信息度量(GNPIM)和Lorenz信息度量(LIM)在灰度级上描述了图像的分布,在语义层上反映了图像的内容,是区分文本图像和一般连续色调图像的有效统计特征,作为支持向量机(SVM)的输入向量。可区分文本图像与连续色调图像,从而实现网络中文本图像的自动提取。实验结果表明,基于GNPIM、LIM与SVM的文本图像提取技术能够有效提取网络中的文本图像。且正确率高,速度快。  相似文献   

8.
阐述了针对中小型企业供需信息自动化Web信息抽取技术的研究。自动化是指不需要人工标注网页抽取规则学习样本,系统能够从不同的求购信息网站的网页里自动获取相应的信息抽取规则,通过引入领域特征来净化抽取到文本字段而获得较高的查准率。  相似文献   

9.
苏志响  邵志清 《情报探索》2006,(12):60-61,64
在介绍经典统计量互信息和t-测试的基础上,提出一种基于上下文统计反馈模型的特征词自动抽取方法,使之更好地满足对大规模中文文本进行处理的需求。实验表明,在无需词典和语料库的前提下.该方法能够快速、准确地对大规模中文文本进行特征词抽取。  相似文献   

10.
朱学芳  冯曦曦 《情报科学》2012,(7):1012-1015
通过对农业网页的HTML结构和特征研究,叙述基于文本内容的农业网页信息抽取和分类实验研究过程。实验中利用DOM结构对农业网页信息进行信息抽取和预处理,并根据文本的内容自动计算文本类别属性,得到特征词,通过总结样本文档的特征,对遇到的新文档进行自动分类。实验结果表明,本文信息提取的时间复杂度比较小、精确度高,提高了分类的正确率。  相似文献   

11.
卢小平 《现代情报》2009,29(10):221-225
自动编制文摘不仅可以避免人工编制文摘的偏差,更能满足现代人对信息的快速获取需求。本文分析了自动文摘技术研究的进展,介绍了自动文摘的6种技术,即简单词频统计法、相对测度法、词组测度法、标题词法、特殊位置法和提示短语法,探讨了其存在的问题和未来的发展趋势。  相似文献   

12.
The SALOMON system automatically summarizes Belgian criminal cases in order to improve access to the large number of existing and future court decisions. SALOMON extracts relevant text units from the case text to form a case summary. Such a case profile facilitates the rapid determination of the relevance of the case or may be employed in text search. In a first important abstracting step SALOMON performs an initial categorization of legal criminal cases and structures the case text into separate legally relevant and irrelevant components. A text grammar represented as a semantic network is used to automatically determine the category of the case and its components. In this way, we are able to extract from the case general data and to identify text portions relevant for further abstracting. It is argued that prior knowledge of the text structure and its indicative cues may support automatic abstracting. A text grammar is a promising form for representing the knowledge involved.  相似文献   

13.
Compact graphic display of phrases from the original text is among abstracting assistance features being prototyped in the TEXNET text network management system. Compaction is achieved by embedding subphrases and by enabling the user to select rapidly word by word. Phrases displayed would not necessarily be those selected for automatic indexing.  相似文献   

14.
射频卡数据读写及其在软件设计中的应用   总被引:1,自引:0,他引:1  
本文提出了一种对射频卡读写器提供的接口函数进行抽象和封装的方法,通过抽象与封装向应用系统提供独立于硬件的射频卡读写操作,使得应用系统的开发可以独立于射频卡硬件系统。文章通过对实验室管理系统的设计说明该方法的应用。  相似文献   

15.
自动文摘的逻辑解释   总被引:2,自引:0,他引:2  
The paper attempts to use the logic method to unify several abstracting methods under one model. It' s beneficial to the under standing of the nature of the abstracting process and the invention of more effective abstracting method.  相似文献   

16.
In image retrieval, most systems lack user-centred evaluation since they are assessed by some chosen ground truth dataset. The results reported through precision and recall assessed against the ground truth are thought of as being an acceptable surrogate for the judgment of real users. Much current research focuses on automatically assigning keywords to images for enhancing retrieval effectiveness. However, evaluation methods are usually based on system-level assessment, e.g. classification accuracy based on some chosen ground truth dataset. In this paper, we present a qualitative evaluation methodology for automatic image indexing systems. The automatic indexing task is formulated as one of image annotation, or automatic metadata generation for images. The evaluation is composed of two individual methods. First, the automatic indexing annotation results are assessed by human subjects. Second, the subjects are asked to annotate some chosen images as the test set whose annotations are used as ground truth. Then, the system is tested by the test set whose annotation results are judged against the ground truth. Only one of these methods is reported for most systems on which user-centred evaluation are conducted. We believe that both methods need to be considered for full evaluation. We also provide an example evaluation of our system based on this methodology. According to this study, our proposed evaluation methodology is able to provide deeper understanding of the system’s performance.  相似文献   

17.
登机桥全自动接机中飞机舱门运动模糊图像恢复研究   总被引:1,自引:0,他引:1  
在基于计算机视觉的登机桥全自动接机过程中,成像设备采集的图像由于和目标之间存在相对运动,会导致图像模糊,提出了一种登机桥在不同运动模式下的点扩散函数(PSF)的参数估计方法,以及对运动模糊图像恢复的方法。试验表明,本文的方法在登机桥全自动接机过程中表现出了很高的性能。  相似文献   

18.
将社会网络分析中的位置分析引入作者同被引分析,改进科学共同体测度方法.实证得出我国经济学领域存在四大科学共同体,并分析了共同体之间的关系.认为,基于个体的统计分析与基于关系的网络分析相融合的新方法能够更本质地揭示科学共同体的形成与发展,在避免数据信息丢失,提取作者同被引行为模式,区分共同体层次结构,识别特殊团体,细分团体以及范式可视化方面具有优势.  相似文献   

19.
谭淑琴 《现代情报》2009,29(8):164-165
本文着眼于高校科研院所对科学评价的需要,为提高计量分析效率,满足科研人员对计量分析结果实时的需要,提出一种基于自建数据库的文献自动计量分析系统的设计开发,并对系统功能实现进行了阐述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号