Работа с программами-архиваторами
Что такое архивный файл? Каждый исходный файл содержит довольно много избыточной
информации. Если на жестком диске текстовый файл, то в начале документа
находится заголовок, перед которым имеется большое количество пробелов,
допустим 30, затем непосредственно символы заголовка. В текстовых файлах информация
хранится из расчета один байт - один символ. Поэтому для 30 пробелов будет
использоваться 30 байт. Можно хранить эту информацию в другом виде, например,
первый байт - управляющий символ, второй содержит число 30, а третий байт -
символ пробел. Таким образом, в трех байтах будет храниться информация, которая
эквивалентна текстовому файлу, содержащему тридцать символов. Следующая строка
может быть пустая, и так далее. Можно закодировать часто встречающиеся последовательности
символов, слово “распечатать” и хранить информацию не в одиннадцати байтах, а,
например, в двух, то есть хранить не само слово, а его код. Существует много алгоритмов,
каким образом уменьшить размер файлов, причем в несколько раз. Программа, которая
сжимает файлы, называется архиватором. Операция, при которой происходит
создание архивного файла, называется архивированием. Для того, чтобы
восстановить данные с исходном виде, при помощи программ -архиваторов создается
файл, который полностью идентичен исходному. Данная операция называется разархивацией.
Для чего нужны архивные файлы? Как уже было сказано, архивные файлы - это файлы,
которые содержат сжатую информацию. С такими файлами программы (например,
текстовые редакторы) непосредственно работать не могут. Поэтому, чтобы
откорректировать информацию в них, файл нужно сначала разархивировать. Архивируются
редко используемые файлы. Допустим, имеется файл Rab.doc размером 50 килобайт.
При помощи программы-архиватора создается сжатый файл с именем, задаваемым
пользователем, часто с тем же названием, что и один из архивируемых файлов, но
имеет другой формат, то есть расширение файла. Он уже имеет размер 22 килобайта,
а первоначальный файл уничтожается. В результате на жестком диске сохранится 28
килобайт (50-22). А если имеется несколько сотен файлов, притом значительно большего
размера, которыми редко пользуются, то экономия пространства на жестком диске
может быть еще существеннее. Следующим распространенным случаем является создание
копии файлов на другом носителе информации.
Процедуры сжатия могут быть
использованы при передаче файлов между компьютерами. Как правило, файлы
переносятся при помощи дисков и флешек, которые могут быть считаны практически
на любом компьютере. Однако их емкость ограниченна. Чтобы эффективно использовать
память на ней, файлы, которые нужно перенести, сначала архивируются, затем переписываются
на дискету, и после того как информация с них будет переписана на другом
компьютере, файлы разархивируются. Использование архивирования позволяет обойтись
меньшим количеством дисков. Кроме того, процедуры сжатия могут использоваться модемом
при переносе данных через телефонную сеть.
Отметим, что некоторые файлы
имеют свои форматы, которые включают сжатие данных. Это прежде всего относится
к видеофильмам (например, .avi), звуковым файлам (.mp3) и
фотографиям (.png, .jpeg, кроме .bmp). Их
сжимать при передаче данных не обязательно. Как правило, сжимаются текстовые
файлы, архив электронной почты и другие.
Программа-архиватор
применяется не только для того, чтобы иметь копию данных для сохранности. С
течением времени, даже если у вас объемный жесткий диск, на нем становится все
меньше места. Существуют файлы, которые требуются очень редко, например,
переписка за прошлый год или документы по законченному проекту. Эти файлы можно
архивировать и хранить в двух-трех копиях, причем желательно это сделать так,
чтобы при необходимости можно было довольно быстро извлечь требуемый файл (документ).
Программы-архиваторы позволяют довольно сильно сократить размер файла, и те файлы,
которые редко используются, можно сжать и держать на жестком диске. А когда
данные файлов потребуются пользователю, их можно распаковать и вернуть в исходный
вид.
Случается, что при
резервировании данные, которые находятся на дискете, ленте или другом носителе,
невозможно потом прочитать, поэтому при первой операции архивации нужно проверить, как записаны данные. Потом
для надежности нужно время от времени проверять записанные данные. Только если
все восстановленные файлы полностью соответствуют оригиналу, можно быть
уверенным в сохранении данных. Необходимо проконтролировать сам процесс архивации,
то есть проверить целостность файлов на носителе при помощи специальных опций.
Программы-архиваторы выполняют проверку файлов не со стопроцентной гарантией,
поэтому нужно использовать и такую проверку, при которой файлы
восстанавливаются и сравниваются с исходными.
Желательно один набор
носителей с архивом хранить вне помещения, где находится компьютер. В этом
случае при пожаре и других непредвиденных ситуациях можно будет восстановить
информацию. При резервном копировании можно скопировать образ диска, то есть
данные сохраняются последовательно сектор за сектором, включая FAT, либо
файл-ориентированным, когда происходит копирование файл за файлом.
Какое выбрать устройство для
архивации, решает сам пользователь в зависимости от того, сколько места будет
занимать архивный файл, от частоты этой операции. В настоящее время существует
довольно много видов носителей для этих целей. Это внешний жесткий диск,
флешки, оптические диски и другие устройства. Кроме того, можно поставить второй
внутренний жесткий диск, использовать диски, могут быть и другие варианты.
Степень сжатия. Программы-архиваторы сжимают информацию по-разному, одни лучше
текстовую информацию, другие – графическую, третьи - исполняемые модули.
Поэтому имеются разные таблицы, указывающие, какой архиватор для какого вида
программ имеет среднюю степень сжатия. Степень сжатия определяется числом, равным
размеру исходного файла, деленному на размер сжатого, и может иметь значение от
10 до 90 % для разных видов файлов, причем среднее значение колеблется в
пределах от 40 до 60%. Часто преимущество одного архиватора по сравнению с
другим не очень велико, поэтому на практике пользователи работают с одним видом
архиватора для создания архива или несколькими, в зависимости от того, какие
типы файлов наиболее часто ему встречаются в работе.
Формат архивного
файла. Архивный файл, как правило, получает то же имя, что и исходный,
когда архивируется один файл, или запрашивает имя, которое должен ввести пользователь.
Для файлов с расширением “.zip” работают почти все архиваторы, но могут быть и
другие форматы, например, с расширениями .rar, .arj, .fb2, .epub и так далее. В настоящее время
почти все архиваторы могут открыть эти распространенные форматы. Но в силу лицензирования
не все могут создать файла с таким расширением.
Содержимое архивного файла. Архивный файл содержит три основные части:
- оглавление, где хранятся имена файлов и
директорий, дата создания, размер и другая информация;
- содержимое сжатых файлов;
- контрольные суммы, используемые для проверки
сохранности информации.
Отсюда можно сделать вывод, что основным
недостатком данных файлов является изменение оглавления при хранении. Если произошла
ошибка при хранении или записи информации в файл, то при восстановлении теряется
часть данных файла. При ошибке в оглавлении вся информация в файле может быть
недоступна для восстановления.
Саморазворачивающийся
архив. Этот архив создается в виде исполнимого файла и имеет расширение
.exe. При переносе на другой компьютер не нужно иметь программу для работы с
архивом, достаточно поместить его на выполнение, например, установив на нем
курсор в Проводнике, и нажать на клавишу Enter.
При этом файлы, которые содержатся в архиве, появятся в текущей директории.
Иногда такие файлы называют также SFX-архивами.
Замечание.
1. Далее параллельно с понятием архивный файл будет использоваться синоним архив.
Аналогично, для разархивирования - понятие извлечение файла.
2. Работа с
программами архиваторами будет описана далее во второй части сайта. Отметим,
что наиболее распространенными являются программы 7zip (http://sourceforge.net/projects/sevenzip/)
и TUGZip (http://www.tugzip.com/Downloads.html).
|