ЧАСТЬ 2

ИНФОРМАТИКА

Электронное учебно-методическое пособие

 

 
 

 

7.4. Архивация

 

Архиватор – это программа, которая сжимает файл или группу файлов в один архивный файл с целью уменьшения их размера. При этом не теряется ни бита информации, и любой файл можно из архива извлечь.


Что дает архивация? Во-первых, экономия места на диске, во-вторых, на съёмном носителе можно перенести большой объём информации, в-третьих, есть возможность пересылать большие файлы по электронной почте [5].

Наиболее известные архиваторы – это архиваторы zip, arj, rar, gzip, lha, ha, ace. Архив, созданный тем или иным архиватором, имеет расширение, соответствующее названию архиватора. Например, расширение файла archive.rar говорит о том, что он был создан с помощью архиватора rar.

Архиваторы различаются возможностями и качеством сжатия, которое зависит также и от типа сжимаемых данных. Некоторые архиваторы лучше работают с одними типами данных, но плохо показывают себя с другими. К важным функциям архиваторов относят создание многотомных архивов и самораспаковывающихся архивов.

Многотомные архивы – это архивы, разбитые на несколько отдельных файлов. Их применяют, когда необходимо перенести большой объём информации на съёмном носителе маленького размера, например, дискете: на каждую дискету помещается отдельный том архива. При извлечении данных из многотомного архива архиватор будет последовательно обрабатывать том за томом и запрашивать смену дискеты.

Самораспаковывающиеся архивы используются в тех случаях, когда необходимо перенести информацию на другой компьютер, но неизвестно, установлен ли там соответствующий архиватор. Самораспаковывающийся архив представляет собой исполняемый (.exe) файл, который включает в себя заархивированные данные и программу для их распаковки.

Алгоритмов сжатия данных существует великое множество. Некоторые алгоритмы подходят для одних типов данных, другие – для других. Хорошо сжимаются простые растровые изображения, не содержащие большого количества деталей (.bmp, .psd и др.). Коэффициент сжатия во многом зависит от используемого алгоритма и сложности изображения.

Например, чёрно-белое изображение чертёжного качества может быть сжато даже в сотню раз, цветные рисунки – в пять-десять раз, а цветные изображения высокого фотографического качества сжимаются менее чем в два раза.

Хорошо сжимаются текстовые файлы (.txt, .doc, .pas и др.). Если файл содержит текст, написанный на естественном языке, например, повесть или рассказ, то коэффициент сжатия будет равен двум-трём, а если в файле записан текст программы, то коэффициент сжатия может достигать пяти и выше. Коэффициент сжатия исполняемых файлов(.exe, и др.) также сильно колеблется, однако, в среднем он равен примерно трём.

В отношении звука (.wav, .au), использование универсальных методов сжатия редко даёт хорошие результаты – звуковой файл сокращается всего на 20–40 %. То же самое касается и высококачественных изображений, имеющих много деталей. Поэтому для этих типов изображений используются специальные методы сжатия, особо хорошие результаты дают так называемые алгоритмы сжатия с потерями.

Одна из идей этих алгоритмов состоит в том, что человеческий глаз и ухо не очень восприимчивы к некоторым мелким деталям изображения или звука, поэтому лишнюю информацию можно просто отбросить.

Разумеется, кроме отбрасывания лишней информации, используются и другие алгоритмы, в результате чего достигается несравнимый коэффициент сжатия при минимальных потерях качества (с точки зрения восприятия человека). Такой подход используется в файлах форматов jpeg, предназначенного для хранения статичных изображений, и mpeg, предназначенного для хранения видео- и аудиоинформации.

Сегодня особенно популярны такие форматы, как mpeg-3 (или mp3), предназначенный для хранения аудиоинформации и позволяющий достигнуть десятикратного сжатия почти без потери качества, и mpeg-4, используемый для хранения видеофильмов.

Плохо архивируются либо вообще увеличиваются в размере файлы, данные в которых уже сжаты, в том числе архивы (.rar, .zip, .arj и др.), графические файлы тех форматов, которые имеют собственное сжатие (.gif, .jpg, .png и др.), аудиофайлы (.mp3), видеофайлы (.mpg, .avi и др.), самораспаковывающиеся архивы (.exe).

 

 


© Сибирская государственная геодезическая академия (СГГА), 2011