Конспект урока "Создание архива данных. Извлечение данных из архива. Атрибуты файла и его объем"
Тема: Создание архива данных. Извлечение данных из архива.
Атрибуты файла и его объем
Как же происходит сжатие информации?
Сжатие данных похоже на производство сухого молока или сухофруктов. То есть, это –
процесс удаления воды, которую затем можно добавить, чтобы предать продукту
первоначальный вид.
А какая в данных может быть вода? Это вода информационная. В данных встречается
много повторов. Это можно использовать для сжатия данных.
Например, сжатие текстовых файлов происходит приблизительно так. Составляется
таблица встречающихся в тексте слов и выражений. Затем всем словам и выражениям в
этой таблице даются номера. И весь текст в файле заменяется номерами из таблицы слов и
выражений. Такой способ позволяет уменьшить размер текстового файла в 2-3 раза. Иногда
текст сжимается и в 10 раз, если в нём много повторов.
Программа, переводящая текстовый файл в "сжатый" вид, называется упаковщиком. А
полученный в результате сжатия файл называется упакованным или сжжатым файлом.
Очень часто сжатые файлы называют архивами или архивными файлами, что, если
подходить строго к терминологии, неверно. Изначально архивами назывались файлы,
специально созданные во время процессов резервного копирования. В ходе такого процесса
создавался один файл, который содержал в себе несколько исходных файлов и папок. Это
и был архив. Никакого сжатия при этом не производилось. Подобная ситуация до сих пор
существует в операционной системе Linux, где архивация данных и сжатие данных
являются двумя независимыми процессами. В операционной системе MS-DOS, а затем и в
MS Windows программы сжатия данных с самых первых своих версий стали поддерживать
как сжатие, так и архивацию данных, то есть создавали сжатый файл, содержащий не один,
а несколько исходных (архивируемых) файлов и папок. С той поры в этих операционных
системах понятие "архивация" означает и архивацию (сбор в один файл-архив), и
одновременное сжатие данных.
Поскольку архивный файл записан не в текстовом формате, с ним не могут работать
редакторы текстов. Перед открытием архивного файла редактором текстов этот файл
необходимо разархивировать. Разархивацию производит та же самая программа –
архиватор. После разархивации текстовый файл приобретает точно такой же вид и размер,
как и до архивации.
Архиваторы текстов могут архивировать также файлы программ. Только программы
гораздо меньше сжимаются, чем текст.
Упаковщики, применяемые для сжатия текстов и программ, не могут эффективно
сжимать звуковые, графические или видео файлы. Для их сжатия были разработаны другие,
более сложные, алгоритмы. Правда, после распаковки полученные файлы немного
отличаются от оригиналов (такое сжатие называется сжатием с потерями). Но этого не
улавливает обычное человеческое ухо и не замечает обычный глаз на экране монитора.
А как же другие, не текстовые данные?
Рассмотрим графические файлы. Незаархивированная графика – это рисунок, состоящий
из множества разноцветных точек. В таком формате для каждой точки рисунка или
фотографии задаётся цвет. Графический файл такого рисунка имеет расширение «BMP».
Но такие файлы обладают довольно солидным размером. Даже небольшая фотография в
формате «BMP» будет иметь размер в несколько мегабайт. То есть, она не поместится на
дискету, и по сети Интернет передать её будет нелегко.
Для уменьшения размера графического файла его сжимают специальными
математическими методами. Таким образом графический файл можно уменьшить в размере
в 20-30 раз. Сжатый графический файл нельзя полностью восстановить. При
распечатывании на хорошем принтере будет заметно ухудшение качества рисунка. Но на
экране монитора этого видно не будет.
Наиболее распространённые форматы сжатия изображения – это «GIF» и «JPEG» (или
«JPG»). Создать такие форматы графических файлов может, например, графический
редактор «ФотоШоп» или уже знакомый нам «ФайнРидер». Чем глубже сжатие рисунка,
тем больше теряет он в качестве.
Гораздо позже появились эффективные методы сжатия звука. Если Вы зайдёте на
обычный музыкальный компакт-диск, то обнаружите там файлы с расширением «CDA». В
таких файлах содержится несжатый цифровой звук. Такие файлы имеют очень большой
размер. На компакт-диск помещается 80 минут музыки в незаархивированном виде. Сжатие
звуковых файлов потребовало специальных исследований человеческого слуха. Оказалось,
что часть звуков можно убрать из звукового файла, и это будет незаметно для слуха
человека.
Самый распространённый формат сжатого звука – это «MPEG3» (или «MP3»). Его
создают специализированные редакторы звука и программмы-перекодировщики из других
звуковых форматов. Проигрывание на компьютере сжатых звуковых файлов в формате
«MP3» требует мощности процессора не менее 100 мегагерц. Можно сжимать звуковой
файл в десятки раз. Но при большом сжатии начинает безвозвратно теряться качество звука.
Видеофильм объединяет в себе звук и графику. Помимо звука – это ещё 24 кадра на
каждую секунду. Отсюда понятны огромные размеры файлов с видеофильмами и
необходимость их сжатия.
При появлении компакт-дисков художественный фильм не помещался на один диск. Эту
задачу решил сжатый формат «MPEG4». Показ сжатого видео ещё больше повышает
требования к мощности процессора. Для проигрывания MPEG4 уже недостаточно 200
мегагерц.
Архивация (упаковка) — помещение (загрузка) исходных файлов в архивный файл
в сжатом или несжатом виде.
Архивация предназначена для создания резервных копий используемых файлов, на
случай потери или порчи по каким-либо причинам основной копии (невнимательность
пользователя, повреждение магнитного диска, заражение вирусом и т.д.).
Для архивации используются специальные программы, архиваторы,
осуществляющие упаковку и позволяющие уменьшать размер архива, по сравнению с
оригиналом, примерно в два и более раз.
Архиваторы позволяют защищать созданные ими архивы паролем, сохранять и
восстанавливать структуру подкаталогов, записывать большой архивный файл на
несколько дисков (многотомный архив).
Сжиматься могут как один, так и несколько файлов, которые в сжатом виде
помещаются в так называемый архивный файл или архив. Программы большого объема,
распространяемые на дискетах, также находятся на них в виде архивов.
Информатика - еще материалы к урокам:
- Презентация "Кодирование и декодирование информации"
- Презентация "Знак. Знаковые системы. Кодирование" 8 класс
- Тест "Систематизация информации. Списки" 5 класс
- Проверочная работа "Хранение информации в базах данных" 11 класс
- Презентация "Устройства ввода графической информации" 10 класс
- Презентация "Редактирование текста. Поиск и замена информации" 5 класс