Les archiveurs sont des programmes qui peuvent compresser des informations dans des fichiers. Les archiveurs modernes vous permettent de combiner plusieurs fichiers en une seule archive et d'afficher le contenu de ces archives. La taille de l'archive créée avec leur aide s'avère beaucoup plus petite que la taille du fichier d'origine.
Instructions
Étape 1
Le principe général de fonctionnement de la plupart des archiveurs est basé sur un algorithme développé par les chercheurs A. Lampel et J. Ziv dans les années 80 du siècle dernier. L'algorithme créé par Ziv et Lampel permet de calculer du code dupliqué dans un fichier et ainsi de réduire sa taille. Pour cela, un dictionnaire est compilé à partir de séquences de données. Par exemple, le code binaire du fichier contient la combinaison suivante: 10111011101110110011. Il est facile de voir que le code 1011 y est répété plusieurs fois. L'archiveur détecte un tel code et l'écrit dans l'archive une seule fois, et lors de sa décompression, il remplace à nouveau le code aux endroits nécessaires dans le fichier.
Étape 2
L'efficacité de la compression du fichier par l'archiveur dépend de la taille du dictionnaire source. Si le dictionnaire est trop volumineux, cela affectera la taille de l'archive. Si la taille du dictionnaire est trop petite, des erreurs peuvent se produire dans l'archive créée. Vous pouvez augmenter le taux de compression d'un fichier en utilisant le codage entropique (la méthode dite de Huffman). Avec le codage entropique, les morceaux binaires répétés sont écrits à l'aide d'un shortcode. Dans les archiveurs modernes, le codage entropique est utilisé comme méthode de codage supplémentaire.
Étape 3
Sur les systèmes Unix, gzip est l'archiveur le plus populaire. Cet archiveur compresse les données sans perte et est basé sur l'algorithme Deflate. La compression des fichiers ici se fait selon deux approches - d'abord, les morceaux de code en double sont remplacés, puis les caractères qu'ils contiennent sont remplacés par de nouveaux caractères à l'aide de la méthode Huffman. Les archiveurs pour systèmes Unix présentent un certain nombre d'inconvénients. Ils sont principalement destinés aux archives composées de nombreux fichiers, il est donc difficile de décompresser un seul fichier. C'est parce que les archiveurs Unix voient une archive comme un tableau continu de tous les fichiers qu'elle contient. L'archive est constituée sur la base des informations contenues dans chaque fichier.
Étape 4
Sur les systèmes Windows, des archiveurs tels que WinZip, 7-zip et WinRAR sont courants. Contrairement aux systèmes Unix, ces archiveurs se concentrent sur le travail à la fois avec des fichiers individuels et avec des archives continues composées de nombreux fichiers. La plupart des archiveurs Windows modernes « comprennent » de nombreux formats d'archives, prennent en charge le cryptage et sont capables de compresser des fichiers très volumineux (par exemple, la taille de fichier maximale pour l'archiveur WinRAR est supérieure à huit milliards de gigaoctets).