基于Huffman编码的XML文件压缩存储算法研究与实现 |
| |
引用本文: | 周伟.基于Huffman编码的XML文件压缩存储算法研究与实现[J].人天科学研究,2014(7):41-43. |
| |
作者姓名: | 周伟 |
| |
作者单位: | 厦门理工学院计算机与信息工程学院,福建厦门361021 |
| |
摘 要: | XML(可扩展标记语言)是一种广泛应用于网络的数据存储交换格式,采用通用标记语言,具有良好的数据存储和分析能力,其缺点是XML文档存在结构冗余。伴随着XML在网络上应用的扩展,XML压缩成为目前关注的研究问题。从压缩、存储两方面研究了XML文件的压缩算法。根据重复出现权重,基于Huffman树生成对应的编码(0、1数字表示),减少XML文件结构重复导致的冗余。存储文件时,把n位编码(二进制)转化为一个ASCII字符存储(n不是8倍数即补位),节省了存储空间。大量实验证明:算法具有良好的可行性和研究价值。
|
关 键 词: | XML Huffman树 压缩算法 存储 编码 |
本文献已被 维普 等数据库收录! |
|