排序方式: 共有4条查询结果,搜索用时 31 毫秒
1
1.
相似重复记录清理方法研究综述 总被引:3,自引:0,他引:3
介绍相似重复数据清理的步骤、框架和衡量标准。重点对检测和清除算法按照算法类型及相关改进思路进行分类综述,给出算法的适用范围和优缺点,概括现有的数据清理工具(如Merge/Purge)。对相似重复记录清理领域的研究问题进行展望,将知识和语义的概念引入到数据清理框架中是未来重要的发展趋势。 相似文献
2.
本文简述了传统边界式防火墙与分布式防火墙的区别,提出了全方位、多层次、分布式的立体网络安全方案的概念。并简述针对Windows NT/2000的安全解决方案CyberwallPLUS的基本特点。 相似文献
3.
信息技术由于其专业本身的特点,必须重视和正确认识外语教学和双语教学,文章从师资、学生、教材以及教学、考核与评估等方面探讨了信息技术外语教学和双语教学中存在的问题及应采取的措施。 相似文献
4.
基于改进编辑距离的相似重复记录清理算法 总被引:1,自引:0,他引:1
相似度计算是相似重复记录清理过程中的一个关键问题,编辑距离算法在其中具有广泛应用。在传统编辑距离算法的基础上,通过分析影响相似度计算结果的序列长度、同义词等因素,得到一种同时引入同义词词库和归一化处理思想的改进的基于语义编辑距离的相似重复记录清理算法,适用于相似记录的识别过程。实验分析表明,改进算法计算结果更符合句子的语义信息,绝大部分结果符合人们的认知经验,从而可以有效地提高相似重复记录识别的准确率和精确度。 相似文献
1