GZIP y BZIP2

Anonim

GZIP vs BZIP2

GNU zip (también conocido como GZIP) es una aplicación de software con el propósito de comprimir archivos. Originalmente fue pensado para reemplazar el programa de compresión utilizado en los primeros sistemas Unix, que se usará en el Proyecto GNU (un proyecto de software libre).

BZIP2 es un algoritmo de compresión de datos sin pérdida de código abierto, básicamente, una clase de algoritmos de compresión de datos que hace posible que los datos originales de un archivo comprimido se reconstruyan completamente a partir de los datos comprimidos.

GZIP se basa en un algoritmo conocido como DEFLATE. Este es también un algoritmo de compresión de datos sin pérdida. Utiliza tanto el algoritmo LZ77 como la codificación de Huffman. Esencialmente, GZIP se refiere al formato de archivo del mismo nombre. Este formato es un encabezado de 10 bytes que contiene un número mágico (lo que significa un valor numérico o de texto que nunca cambia y se usa para indicar un formato de archivo o protocolo, un valor numérico sin nombre que nunca cambia o valores distintos que no pueden ser erróneos) para cualquier otra cosa), encabezados adicionales que pueden o no ser realmente necesarios (nombre del archivo original, por ejemplo), un cuerpo que contiene una carga útil DEFLATE -compresada (que es la información que contienen los encabezados), y un pie de página de 8 bytes que contiene una suma de comprobación CRC-32, así como la longitud real de los datos originales sin comprimir.

Hay una variedad de técnicas de compresión que utiliza el formato BZIP2, que se apilan unas sobre otras en varias capas. Se producen en un orden muy distintivo: codificación de longitud de ejecución (que es cualquier secuencia de cuatro a 255 símbolos duplicados que se reemplaza por los primeros cuatro símbolos y una longitud de codificación que se repite entre 0 y 251), transformada de Burrows-Wheeler (que es el tipo de bloque reversible que constituye el núcleo mismo del BZIP2), Mover al frente (deja el tamaño del bloque procesado inalterado), Codificación de longitud de ejecución (que consiste en largas cadenas de símbolos, generalmente ceros, que constantemente se repite en la salida, y se reemplazan tanto por el símbolo como por una secuencia de dos códigos), la codificación de Huffman (que es un proceso que reemplaza los símbolos de longitud fija de bytes de 8 bits con códigos de longitud cambiantes), la codificación múltiple de Hoffman (que consiste en múltiples tablas Hoffman de tamaño idéntico), codificación de base 1 unaria, codificación delta y matriz de bits dispersos.

Resumen:

1. GZIP es una aplicación gratuita utilizada para comprimir archivos; BZIP2 es un algoritmo de compresión de datos sin pérdida de código abierto que permite recuperar los datos originales de un archivo comprimido.

2. GZIP consta de un encabezado de 10 bytes, encabezados opcionales, un cuerpo y un pie de página de 8 bytes; BZIP2 consiste en no menos de nueve capas de técnicas de compresión.