Diferença entre GZIP e BZIP2 Diferença entre

Anonim

GZIP vs BZIP2

O zip GNU (também conhecido como GZIP) é uma aplicação de software com o objetivo de comprimir arquivos. Inicialmente, foi destinado a substituir o programa de compressão usado nos sistemas Unix iniciais - para ser usado no Projeto GNU (um projeto de software livre).

BZIP2 é um algoritmo de compactação de dados sem perda de código aberto - basicamente, uma classe de algoritmos de compressão de dados que permite que os dados originais de um arquivo comprimido sejam completamente reconstruídos a partir dos dados compactados.

O GZIP é baseado em um algoritmo conhecido como DEFLATE. Este também é um algoritmo de compressão de dados sem perdas. Ele usa o algoritmo LZ77 e a codificação Huffman. Essencialmente, o GZIP se refere ao formato do arquivo do mesmo nome. Este formato é um cabeçalho de 10 bytes que contém um número mágico (o que significa um valor numérico ou de texto que nunca muda e é usado para significar um formato de arquivo ou protocolo, um valor numérico sem nome que nunca muda ou valores distintos que não podem ser confundidos para qualquer outra coisa), cabeçalhos adicionais que podem ou não ser necessários (nome do arquivo original, por exemplo), um corpo que contém uma carga útil comprimida DEFLATE (quais são os dados que os cabeçalhos carregam) e um rodapé de 8 bytes que contém uma soma de verificação CRC-32, bem como o comprimento real dos dados originais não comprimidos.

Há uma variedade de técnicas de compressão que o formato BZIP2 usa, que são empilhadas umas nas outras em várias camadas. Eles ocorrem em uma ordem muito distintiva: codificação de duração (que é qualquer sequência de quatro a 255 símbolos duplicados que são substituídos pelos quatro primeiros símbolos e um comprimento de codificação que se repete entre 0 e 251), Burrows-Wheeler transform qual é o tipo de bloco reversível que compõe o núcleo do BZIP2), mova para a frente (deixa o tamanho do bloco processado inalterado), codificação de duração (que consiste em longos fios de símbolos - geralmente zeros - que constantemente repetir na saída e são substituídos pelo símbolo e uma seqüência de dois códigos), a codificação de Huffman (que é um processo que substitui símbolos de comprimento fixo de bytes de 8 bits com códigos de comprimento em mudança), a codificação de Hoffman múltipla (que consiste em múltiplas tabelas Hoffman de tamanho idêntico), codificação Unary base 1, codificação Delta e matriz de bits esparsas.

Resumo:

1. O GZIP é um aplicativo gratuito usado para compactar arquivos; BZIP2 é um algoritmo de compactação de dados sem perda de código aberto que permite recuperar os dados originais de um arquivo compactado.

2. O GZIP consiste em um cabeçalho de 10 bytes, cabeçalhos opcionais, um corpo e um rodapé de 8 bytes; BZIP2 consiste em no menos nove camadas de técnicas de compressão.