首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Huffman编码的XML文件压缩存储算法研究与实现
引用本文:周伟.基于Huffman编码的XML文件压缩存储算法研究与实现[J].人天科学研究,2014(7):41-43.
作者姓名:周伟
作者单位:厦门理工学院计算机与信息工程学院,福建厦门361021
摘    要:XML(可扩展标记语言)是一种广泛应用于网络的数据存储交换格式,采用通用标记语言,具有良好的数据存储和分析能力,其缺点是XML文档存在结构冗余。伴随着XML在网络上应用的扩展,XML压缩成为目前关注的研究问题。从压缩、存储两方面研究了XML文件的压缩算法。根据重复出现权重,基于Huffman树生成对应的编码(0、1数字表示),减少XML文件结构重复导致的冗余。存储文件时,把n位编码(二进制)转化为一个ASCII字符存储(n不是8倍数即补位),节省了存储空间。大量实验证明:算法具有良好的可行性和研究价值。

关 键 词:XML  Huffman树  压缩算法  存储  编码
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号