Резервное копирование информации. Архиваторы

Разделы: Информатика


Тема урока: Резервное копирование информации. Архиваторы.

Цели урока:

  • ознакомление с функциями, методами работы и видами программ-архиваторов;
  • дальнейшее развитие познавательного интереса, внимания, самостоятельности при выполнении заданий, совершенствование  умения  работать в коллективе;
  • формирование логического мышления и адаптация учащихся в современном информационном пространстве.

Объекты: урок предназначен для учащихся 10-го класса, рассчитан на 2 учебных часа.

Место темы в курсе: тема изучается в разделе «Компьютер и программное обеспечение».

Форма проведения урока: лекция – беседа.

Этапы урока:

  1. Организационный момент.
  2. Постановка проблемной ситуации.
  3. Объяснение нового материала с активным привлечением учащихся.
  4. Первичный контроль освоенности материала.
  5. Постановка домашнего задания.
  6. Адаптация полученных сведений с уже имеющимися знаниями учащихся; подведение итогов.

ХОД УРОКА

1 этап. Организационный момент

Приветствие, объявление темы, целей и плана урока.

2, 3 этапы. Постановка проблемной ситуации и объяснение нового материала с использованием презентации «Резервное копирование информации. Архиваторы» (см. Приложение)

Объяснение учителя. Попробую убедить вас в необходимости резервного копирования.Архив (в информатике) – резервная копия какой-либо информации.

Слайд 2. Необходимость использования резервного копирования.

Пусть некоторый пользователь достаточно долго работал над написанием какой-либо работы и эта работа достаточно значима для него, скажем, что это реферат, проект или диплом. И вот он включает компьютер и при запуске системы пользователь видит на экране сообщения Invalid system configuration (неправильная конфигурация системы) или Hard disk failure (жесткий диск вышел из строя). Как показывает практика, такие ситуации достаточно часты.

Вопрос: Почему возникают такие ситуации?
Предполагаемый ответ: Такие ситуации возможны из-за:

  • Скачков электропитания;
  • Некорректной работы некачественных приложений;
  • Вирусных атак;
  • Износа носителей.

Что можно сделать после таких сообщений? Практически ничего.
Что можно было сделать до появления подобных сообщений? Сделать резервную копию важной информации для ее восстановления после сбоев.

Слайд 3. Необходимость использования резервного копирования.

Необходимость резервного копирования (архивирования) информации и ее восстановление после сбоев, вирусных атак и поломок аппаратуры – одно из главных условий работы на компьютере.
Рассмотрим следующую ситуацию. На компьютере хранится большой объем редко используемой информации. Помня о знаменитом принципе компьютерщиков «Памяти никогда не бывает много», имеет ли смысл хранить малоиспользуемую информацию на жестком диске? Естественно, нет.
Резервное копирование (архивирование) целесообразно использовать для записи малоиспользуемой информации.
Однако при этом резервные копии занимают столько же места, сколько занимают исходные файлы, и для копирования нужных файлов может потребоваться достаточно большие ресурсы.
Поэтому обычно копированную информацию хранят не в первоначальном виде, а в сжатом для экономии ресурсов накопителей. Можно ли уменьшить объем файла, не теряя содержащуюся в нем информацию? Можно с помощью специальных программ – архиваторов.
И еще один аспект применения архивирования информации. Это ситуации, когда объем информации должен быть уменьшен, например, при переносе информации с одного компьютера на другой (в том числе средствами электронной почты, пересылка большого по объему файла вызывает рост затрат на оплату времени и уменьшает надежность передачи).

Слайд 4. Определение.

Архиватором (упаковщиком) называется программа, позволяющая за счет применения специальных методов сжатия информации создавать копии файлов меньшего размера.

Вопрос: Назовите функции архиваторов.
Предполагаемый ответ: копирование и сжатие.

Основными характеристиками архиваторов являются:

  • степень сжатия или отношение объемов исходного и результирующего файлов;
  • скорость сжатия – время, затрачиваемое на сжатие некоторого объема информации.

Слайд 5.  Виды архиваторов.

Весь спектр существующих сегодня архиваторов можно разделить на две группы:

  • файловые;
  • дисковые.

Файловые архиваторы: ZIP, ARJ,LHARC, LHA, ICE, AIN, RAR, РАК, ZOO, EXPAND.
Такие архиваторы позволяют упаковывать один или несколько файлов в единый архивный файл.

Слушаем сообщение учащегося о наиболее распространенных на современном этапе файловых архиваторах. Сообщение готовится учащимся самостоятельно по плану:

  1. Три наиболее скачиваемых в Internet архиватора (обычно выбираются WinRar, WinZip, WinAce);
  2. Последняя версия программы;
  3. Разработчик программы;
  4. Сайт программы;
  5. Способ распространения;
  6. Ценовой диапазон;
  7. Работа под управлением операционных систем.

Дисковые архиваторы позволяют программным способом увеличить дисковое пространство на винчестере (DblSpace из комплекта DOS, DrvSpace из комплекта Windows, Microsoft Backup, Norton Ghost, PowerQuest Drive Image).
Принцип работы: формируется единый сжатый файл, в котором содержится образ диска. Затем этот файл записывается на сменный носитель либо в отдельный раздел того же жесткого диска. Впоследствии программа может восстановить образ диска на том же или на другом накопителе.

Замечание: Файлы NTFS имеют атрибут – "сжатый". NTFS имеет встроенную поддержку сжатия дисков. Любой файл или каталог в индивидуальном порядке может хранится на диске в сжатом виде.

Учитель показывает на демонстрационном компьютере работу атрибута «сжатый», вместе с учащимися оцениваем степень сжатия файла.

Слайд 6. Методы работы архиваторов

Рассмотрим два метода архивирования: метод замены одинаковых последовательностей (на примере сжатия текстовых, числовых и графических данных) и метод удаления избыточной информации (на примере сжатия графического формата JPEG и оцифрованных видеозаписей).

Слайд 7. Метод замены одинаковых последовательностей. Отступление 1.

Пример 1: стенографистка заменяет при записи какой-либо информации большинство общеупотребительных слов условными значками. Это самый простой метод архивирования информации.
Приведите свои примеры использования обозначений для сжатия информации (смайлики, математические обозначения).

Слайд 8. Метод замены одинаковых последовательностей.

Пример 2: сожмем фразу: КОЛ_ОКОЛО_КОЛОКОЛА
Оцените размер фразы до сжатия: 18 байт
Проанализируем текст и заменим совпадающие участки данных специальным символом, например *.
*_О*О_*О*А
Оценим размер фразы после применения алгоритма сжатия: 10 байт
НО: к сжатому файлу прибавляется информация о кодировке последовательности символов КОЛ специальным символом *.

Слайд 9. Метод замены одинаковых последовательностей.

Вопрос: каков алгоритм сжатия текстового файла?
Предполагаемый ответ: алгоритм состоит в поиске совпадающих участков данных и последующей их заменой специальными символами.

Задание №1. Заархивируйте фразу и оцените ее размер до и после сжатия:
КЛАРА_У_КАРЛА_УКРАЛА_КОРАЛЛЫ,_ КАРЛ_У_КЛАРЫ_УКРАЛ_КЛАРНЕТ

Слайд 10. Метод замены одинаковых последовательностей

Пример 3. Предположим, что мы имеем строку текста, в конце строки стоит 40 пробелов. Налицо явная избыточность имеющейся информации. Решим проблему сжатия этой строки.
Решение: 40 пробелов (40 байт) сжимаются в 2 байта с помощью упаковки их по методу повторяющихся символов. Первый байт, стоящий вместо 40 пробелов в сжатой строке, фактически будет являться пробелом, (последовательность была из пробелов). Второй байт – байт счета (в нашем случае – 40).
Суть методов данного подхода состоит в замене цепочек или серий повторяющихся байтов или их последовательностей на один кодирующий байт и счетчик числа их повторений.

Задание №2:

Пример 4. Заархивируйте числовую последовательность как последовательность из повторяющихся байтов с использованием счетчика числа их повторений:

33        33        33        11        11        11        11        11        10

Слайд 11. Таким образом, метод сжатия заменой одинаковых последовательностей  изменяет только способ представления входных данных, приводя их к форме, которая более компактно кодируется и является методом сжатия без потерь, поскольку исходные данные из сжатого массива восстанавливаются достаточно точно.
Характерные форматы файлов, хранящих сжатую без потерь информацию, являются:

  • GIF, TIF, PCX, PNG – для графических данных;
  • AVI – для видеоданных;
  • ZIP, ARJ, RAR, CAB – для любых типов данных.

Слайд 12. Метод замены одинаковых последовательностей. Принцип сжатия графического формата PCX.

Пусть исходный файл представляет собой некоторый рисунок на одноцветном фоне.
Цвет каждой точки рисунка закодирован некоторым числом, причем в файле эти числа записаны подряд одно за другим в виде построчной развертки рисунка. Для многих участков такая запись будет содержать достаточно длинные последовательности одинаковых байтов. Для уменьшения размера заменяются с помощью архиватора подобные последовательности всего двумя байтами, первый из которых представляет собой тот самый повторяющийся байт-образец, а второй – количество одинаковых байтов в последовательности.
При разархивации программа считает информацию из закодированного файла и повторит байт образец нужное количество раз.

Слайд 13. Метод удаления избыточной информации. Отступление 2.

Характерной особенностью большинства «классических» типов информации, с которыми работают люди, является их избыточность.

Пример 1. В русском языке существуют слова, однозначно прочитываемые в случае «потери» некоторых букв.
Например, Т_ТР_ДЬ, КВАД_Т,  Д_Р_ВО. Кроме того, имея текст на русском языке с «потерянными» буквами, человек, достаточно хорошо владеющий русским языком, может однозначно восстановить его. Например, вы без труда прочитаете предложение с пропущенными буквами:
Дм_т_ий Ива_ов__Менд_ле_в – в_л_ки__рус_кий_х_мик.
Таким образом, для носителя языка обычный связный текст на его родном языке содержит избыточную информацию – ее можно удалить, но смысл текста для него сохранится.
Были проведены исследования, которые установили, что избыточность литературного английского языка составляет около 50%. Это означает, что если в английском тексте стереть наугад около половины букв, то по оставшимся буквам человек, знающий английский язык, почти наверняка сможет восстановить текст. Избыточность языка выполняет очень важную функцию – обеспечивает человеку надежность ее восприятия, особенно в неблагоприятных условиях (просмотр телепередач при наличии помех, чтение текстов в условиях недостаточной освещенности, разговор в вагоне метро и т.п.)
Степень избыточности зависит от типа информации: у видеоинформации она в несколько раз больше, чем у графической, а степень избыточности последней в несколько раз больше, чем текстовой. Как оказалось, для аудио- и видеоинформации абсолютно точное восстановление необязательно. Например, в ходе исследований, было установлено, что глаз человека наиболее чувствителен к зеленому цвету, чувствительность к красному ниже примерно в 4 раза, а к синему – почти в 10 раз! Это означает, что на хранение красной и синей составляющих цвета можно отводить меньше битов, а не кодировать цветовые компоненты одинаковым количеством бит.

Слайд 14. Метод удаления избыточной информации

Характерной особенностью методов сжатия аудио- и видеоинформации является возможность удаления маловажной (для человеческого восприятия) информации. Поэтому такие алгоритмы сжатия называют алгоритмами с регулируемой потерей информации.
Наиболее известными методами сжатия с регулируемой потерей информации являются:

  • JPEG – метод сжатия графических данных;
  • MP3– метод сжатия звуковых данных;
  • MPEG– метод сжатия видеоданных;

Поэтому существуют методы выделения во входных данных той части, которой можно пренебречь, после чего оставшиеся существенные данные подвергаются дальнейшему сжатию.

Слайд 15. Принцип сжатия графического формата JPEG (метод удаления избыточной информации и метод различий)

Рисунок раскладывается на отдельные строки пикселов. Затем в каждой второй строке и в каждом втором столбце матрицы пикселей информация о красном и синем цветовых компонентах просто удаляется.
Первая строка записывается в файл целиком, вторая сравнивается с первой, и в файл записывается только информация о различиях между ними. Все строки последовательно сравниваются с предыдущими.
Формат JPEG способен упаковывать графические изображения в несколько десятков раз, при этом потери качества становятся заметными только при очень высоких коэффициентах сжатия.

Слайд 16. Принцип сжатия видеозаписей

При упаковки оцифрованных видеозаписей так же используют метод различий. Каждый кадр – многоцветный рисунок, и в каждой секунде видеозаписи 24 таких кадра. В одном и том же сюжете различие между изображениями на соседних кадрах очень небольшое, а то и вовсе отсутствует. Следовательно, достаточно записывать в файл целиком только первые кадры каждого нового сюжета, а вместо всех последующих кадров сохранять информацию только о смещении заснятых предметов.

Слайд 17. Рекомендации

  • Если нужно упаковать графические файлы, лучше не прибегать к помощи архиваторов, а просто сохранить эти файлы в формате JPEG. В результате занимаемое ими место окажется гораздо меньше, чем при упаковке самого лучшего архиватора, а сами файлы останутся готовыми к просмотру в любой понимающей этот формат программе просмотра или графическом редакторе.
  • Не забывайте о вирусах! Вирус, содержащийся в заархивированном файле не опасен до распаковки и запуска зараженной программы на выполнение.

5 этап. Постановка домашнего задания.

Домашнее задание по теме «Резервное копирование информации. Архиваторы»

Задание №1

Изучите конспект лекции «Резервное копирование информации. Архиваторы».

Вы должны:

  • обосновать необходимость резервного копирования;
  • знать определение программ – архиваторов и их основные характеристики;
  • знать виды архиваторов и наиболее используемые архиваторы;
  • знать методы архивирования информации и форматы файлов, работающих по каждому из методов.

Задание №2

  1. Заархивируйте текст: Теоретически теория и практика есть одно и то же, практически – нет.

Какой метод архивирования вы использовали? Сравните размер фразы до и после сжатия.

  1. Заархивируйте последовательность чисел:

44        44        44        11        11        11        11        11        01        33        FF       22        22

Какой метод архивирования вы использовали? Сравните размер последовательности до и после сжатия.

Задание №3

Перечислите аппаратный комплекс для копирования информации.

Задание №4* (оценивается отдельно)

Какой метод вы бы использовали для упаковки оцифрованного звука?

6 этап. Подведение итогов; адаптация полученных сведений с уже имеющимися знаниями учащихся

Слайды с 18 по 23. Как ты усвоил материал урока? Проверь себя.

Учащиеся сначала отвечают на предложенные вопросы самостоятельно, используя конспект лекции, затем происходит совместное обсуждение.

Вопрос

Ответ

1.

Как часто необходимо производить резервное копирование (архивирование) информации? Решаем сами, руководствуясь  принципом целесообразности

2.

К какому классу программного обеспечения относятся архиваторы? Специальное сервисное обеспечение

3.

Укажите способ размещения архиваторов в оперативной памяти. Файловые архиваторы загружаются нерезидентно, дисковые – резидентно.

4.

Где найти программы – архиваторы? Существуют встроенные и распространяемые архиваторы.

5.

От чего зависит эффективность работы архиватора? От характеристик архиватора (скорость и степень сжатия), от типа сжимаемого файла, от степени избыточности информации.

6.

*Возможна ли парадоксальная ситуация: архивный файл будет весить больше, чем исходный? Напишите такой файл Возможна такая ситуация (объем файла мал; в файле нет повторяющийся информации; файл уже сжат форматом)

Учитель объявляет оценки за урок и благодарит за работу.

Список используемой литературы:

Усенков Д.Ю. «Архиваторы», журнал «Информатика и образование»,  № 3, 2000 г.