Архиватор
– это программа, которая сжимает файл или группу файлов в один
архивный файл с целью уменьшения их размера. При этом не теряется
ни бита информации, и любой файл можно из архива извлечь. |
Что дает
архивация? Во-первых, экономия места на диске, во-вторых, на съёмном
носителе можно перенести большой объём информации, в-третьих, есть
возможность пересылать большие файлы по электронной почте [5].
Наиболее известные архиваторы – это архиваторы zip, arj, rar, gzip,
lha, ha, ace. Архив, созданный тем или иным архиватором, имеет расширение,
соответствующее названию архиватора. Например, расширение файла archive.rar
говорит о том, что он был создан с помощью архиватора rar.
Архиваторы различаются возможностями и качеством сжатия, которое зависит
также и от типа сжимаемых данных. Некоторые архиваторы лучше работают
с одними типами данных, но плохо показывают себя с другими. К важным
функциям архиваторов относят создание многотомных архивов и самораспаковывающихся
архивов.
Многотомные архивы – это архивы, разбитые на несколько отдельных файлов.
Их применяют, когда необходимо перенести большой объём информации
на съёмном носителе маленького размера, например, дискете: на каждую
дискету помещается отдельный том архива. При извлечении данных из
многотомного архива архиватор будет последовательно обрабатывать том
за томом и запрашивать смену дискеты.
Самораспаковывающиеся архивы используются в тех случаях, когда необходимо
перенести информацию на другой компьютер, но неизвестно, установлен
ли там соответствующий архиватор. Самораспаковывающийся архив представляет
собой исполняемый (.exe) файл, который включает в себя заархивированные
данные и программу для их распаковки.
Алгоритмов
сжатия данных существует великое множество. Некоторые алгоритмы подходят
для одних типов данных, другие – для других. Хорошо сжимаются простые
растровые изображения, не содержащие большого количества деталей (.bmp,
.psd и др.). Коэффициент сжатия во многом зависит от используемого
алгоритма и сложности изображения.
Например, чёрно-белое изображение чертёжного качества может быть сжато
даже в сотню раз, цветные рисунки – в пять-десять раз, а цветные изображения
высокого фотографического качества сжимаются менее чем в два раза.
Хорошо
сжимаются текстовые файлы (.txt, .doc, .pas и др.). Если файл содержит
текст, написанный на естественном языке, например, повесть или рассказ,
то коэффициент сжатия будет равен двум-трём, а если в файле записан
текст программы, то коэффициент сжатия может достигать пяти и выше.
Коэффициент сжатия исполняемых файлов(.exe, и др.) также сильно колеблется,
однако, в среднем он равен примерно трём.
В отношении звука (.wav, .au), использование универсальных методов
сжатия редко даёт хорошие результаты – звуковой файл сокращается всего
на 20–40 %. То же самое касается и высококачественных изображений,
имеющих много деталей. Поэтому для этих типов изображений используются
специальные методы сжатия, особо хорошие результаты дают так называемые
алгоритмы сжатия с потерями.
Одна из идей этих алгоритмов состоит в том, что человеческий глаз
и ухо не очень восприимчивы к некоторым мелким деталям изображения
или звука, поэтому лишнюю информацию можно просто отбросить.
Разумеется,
кроме отбрасывания лишней информации, используются и другие алгоритмы,
в результате чего достигается несравнимый коэффициент сжатия при минимальных
потерях качества (с точки зрения восприятия человека). Такой подход
используется в файлах форматов jpeg, предназначенного для хранения
статичных изображений, и mpeg, предназначенного для хранения видео-
и аудиоинформации.
Сегодня
особенно популярны такие форматы, как mpeg-3 (или mp3), предназначенный
для хранения аудиоинформации и позволяющий достигнуть десятикратного
сжатия почти без потери качества, и mpeg-4, используемый для хранения
видеофильмов.
Плохо архивируются либо вообще увеличиваются в размере файлы, данные
в которых уже сжаты, в том числе архивы (.rar, .zip, .arj и др.),
графические файлы тех форматов, которые имеют собственное сжатие (.gif,
.jpg, .png и др.), аудиофайлы (.mp3), видеофайлы (.mpg, .avi и др.),
самораспаковывающиеся архивы (.exe).