首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
本文通过研究新Web标准网页的数据结构,并在信息抽取技术的基础上,提出了一种基于HTML5语义化标签的网页正文提取技术.该技术能够有效的过滤掉与网页主题无关的噪音信息,从而能有效提取有价值文本信息.  相似文献   

2.
由于当前信息抽取系统因知识库结构和内容的不同带来的搜索质量问题,将本体引入信息抽取中,有助于信息抽取系统对领域内的概念和概念之间的联系的统一认识,为用户提供更有价值的信息。提出了基于本体的文本信息抽取算法,通过本体元素描述抽取的文本信息。最后,利用此算法对某领域样本Web页面进行抽取并分析。实验表明性能有所提高。  相似文献   

3.
研究淘宝网和百度有啊这两个国内有代表性的C2C电子商务平台上的销售记录及其用户信息的抽取.针对两个网站上的店铺销售数据,设计一个基于JerichoHtmlParser的、以Html数据标签为地标的Web数据抽取算法;针对两个网站上的用户信息,设计一个基于正则表达式的Web数据抽取算法.设计实现了一个Web抽取系统,可以按不同的抽取规则实现对不同站点上数据的抽取.最后通过对上述2个平台上实际数据的抽取,验证了设计方案的有效性,实验证实了所设计的原型系统具有较高查全率和准确率.  相似文献   

4.
对基于中文的Web文本分类技术进行了研究,介绍了web文本分类的基本过程和Web文本预处理及文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法KNN。最后通过实验测试了使用KNN算法的中文Web文本分类技术的效果。  相似文献   

5.
随着信息化的深入发展,各应用领域积累了大量采用半结构化方式记录的文本数据。为了快速有效地从大规模面向领域的半结构化文本中抽取有用信息,信息抽取技术应运而生。文本信息抽取的核心算法之一是计算词或短语的相似度,针对面向领域的半结构化文本中的中文短语相似度计算,先采用模式匹配算法从原始半结构化文本中抽取中文短语,然后结合领域语义依存关系,对基于公共子串的短语相似度计算方法进行改进,以此提高短语相似度计算的可靠性。实验结果表明,所提算法具有较好的计算效果。  相似文献   

6.
随着网络招聘的普及,求职者需要浏览和筛选的数据越来越多,如何从大量的、非结构化的网络信息中快速而准确地抽取需要的信息非常重要。基于VIPS视觉分割算法,利用网页所呈现出来的布局结构和视觉特征,对招聘页面进行视觉分割处理,在页面分割的基础上,抽取特定块内的文本信息,实现了关键词查找抽取感兴趣的视觉块内信息。实验结果表明,基于VIPS的职位信息抽取技术能够有效抽取出招聘页面内重要的文本信息,优化了信息抽取结果。  相似文献   

7.
基于HTMLParser对网页进行解析,可抽取标签间的Link、image、meta和title等信息。使用HTMLParser来提取Web文献中的题名、关键字、摘要、作者、来源等信息,清洗后存入MySql数据库当中,以备后续数据挖掘使用。对此进行了论述。  相似文献   

8.
在已有的基于Dom Tree的网页信息提取算法基础上,通过对Html标签进行分类,逐个分析各Html标签所包含的结构信息,设计了一种自底向上的网页分块方法,并在此基础上,实现了文本相似度比较的网页主题内容信息块识别算法,提高了主题内容信息块的识别精确度。  相似文献   

9.
文本信息的隐藏技术   总被引:1,自引:0,他引:1  
文本信息隐藏技术是继利用图像、音频、视频为载体的信息隐藏技术之后一个新的隐藏技术,本文介绍了信息隐藏技术的基本知识,分析了文本信息隐藏技术,结合目前几种基于文本的信息隐藏方法的特性,提出了一种基于文本颜色的信息隐藏算法,并对此算法进行了分析.  相似文献   

10.
www为用户提供了丰富的信息资源。然而,超文本的结构复杂且超链结构无方向性,因此很难将其用来Web可视化。本文就Web站点结构及网页特征信息的抽取技术进行了详细的阐述,其中包括网页内容读取算法、网页URL提取算法、超链路径转换算法等。  相似文献   

11.
在最后一场雪纷纷扬扬时,我们的小学青年教师教学理论读书班,正春意盎然地进行着。拿起苏霍姆林斯基《给教师的建议》轻轻地抚摩,爱不释手,因为它有一种积淀了丰富教育思想的厚重感;翻开施良方先生的《教学理论》、《学习论》, 高屋建瓴的理论框架也曾让我望而生畏;《新课程标  相似文献   

12.
探讨学习的两种性质:天性学习和规定性学习为研究起点,分析两种学习认识的异同和产生的作用,试图从二者的集合相生作用中找出对教育异化现象的解释和解决思路。  相似文献   

13.
爱好成就事业 耿成群站在监视器前,对着新郎喊:"踢球的时候不要看新娘,你是第一次见到她,怎么能老看她.眼神运用不对!你这样看不怕人家当你是流氓啊!"然后他走到新郎面前,拿起足球边踢边跑边示范,这样,很自然地跑过,让足球自然地滚到她脚边.一队人马在郑州市人民公园忙碌着,摄像、灯光、化妆……  相似文献   

14.
网络与未成年人健康成长之思考   总被引:1,自引:0,他引:1  
未成年人正成为网络用户中的一支不容忽视的群体.网络的"双刃剑"作用明显,特别是网络对未成年人的负面影响引起了全社会的关注.加强网络管理,提供健康文明的网络环境.推进网络德育,提高未成年人的免疫力.社会、学校、家庭密切配合,让网络成为他们的良师益友,促进未成年人健康成长.  相似文献   

15.
分析哲学家赖尔批判了笛卡尔的身心二元论,否认了独立的心的存在,将心灵还原为行为,具有一定理论价值,但同时也面临方法论和本体论上的困难。由于其包含了物理主义的本体论,故成为一种"无头脑"的心理学。行为主义如何对待精神存在的事实?这也正是唯物主义必须直面的问题。  相似文献   

16.
埃里克森将人格发展视为自我调整顺利度过每个阶段的"危机",实现每个阶段的"平衡"。后悔往往伴随消极的情绪体验,与内部"不平衡"状态联系紧密,是人格发展需要处理的任务。接受后悔的程度、自我调整以及年龄差异影响个体的生活状态。适应和接受人生后悔经历对人最终实现人格自我完善具有重要意义。  相似文献   

17.
赫尔巴特主张在教学中和教学外都要给予学生最大程度的自由,但又反对教育者对学生放任自流。在对学生的态度上,他力图保持“压制”与“约束”、“自由”与“放任”间的平衡,这对当今教育有很大的警示作用。  相似文献   

18.
关于重建教师评价工作的思考   总被引:1,自引:0,他引:1  
教师评价工作既复杂又重要.反思教师评价工作现状,积弊甚多,应以"三个代表"重要思想为指导,重建教师评价工作.重建,是继承、借鉴和创新.发展教育生产力是教师评价工作的根本目的.评价工作应遵循先进性、科学性、客观性、全面性、群众性和法制性等基本原则.要用多元化的标准评价教师工作.构建强调了指导和权重的教师教学工作评价表是开展教师评价工作的关键.师德、课堂教学、教科研、身心健康、继续教育、学科成绩、学生测评等是特别要加强研究的教师工作评价子指标.  相似文献   

19.
考试作弊在我国越来越严重,屡禁不止。本文以问卷调查形式对考试作弊进行了一次考查,内容涉及作弊原因和防止作弊的措施等。通过统计分析,我们认为,恰当的方法和得力的措施还是能减少作弊的发生,但要从根本上杜绝考试作弊,还需要尽可能取消作弊有利的考试,提高决策质量。  相似文献   

20.
作文教学是综合语文学科的各种能力 ,培养思考 ,提高表达能力的重要一环 ,是由感知到内部语言(加工酝酿)再到外部语言的心理过程 ,是运用语言文字准确而有条理地反映客观事物 ,表达思想感情的高级思维活动。多年以来 ,作文教学一直是语文教学改革中研究探索的着力点 ,许多有识之士为改变作文教学停步不前、学生作文水平没有真正提高的局面 ,进行了不懈的努力 ,提出了许多新的理论 ,产生了一些新的教学模式和教学方法 ,使得作文教学研究领域里呈现出百花齐放、百家争鸣的景象。但是 ,在诸多研究中 ,人们更多地着眼于作文教学的过程研究和方…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号