Цели:
- Обучающие:
- понимать принцип кодирования текстовой информации;
- осознавать проблемы, связанные с кодировкой символов русского алфавита, и пути их решения;
- Развивающие: развивать внимание, логику;
- Воспитательные: воспитывать умение распределять время выполнения самостоятельной работы.
ХОД УРОКА
I. Организационный момент (1 мин)
Проверка готовности рабочего места (учебник, тетрадь, дневник, ручка, карандаш).
II. Актуализация опорных знаний
№2.
В кинотеатре 16 рядов по 32 места в каждом. Какое количество информации в битах содержит сообщение о том, что продан один билет в 8-м ряду место № 4?
1) 5 2) 8 3) 9 4) 16
N = 16 • 32 = 29
29 = 2I;
I = 9 бит
Ответ: 3
№10
В одном из способов представления Unicode каждый
символ закодирован 2 байтами. Определите
информационный объем следующего предложения в
данном представлении:
Попрыгунья Стрекоза лето красное пропела.
1) 41 байт 2) 74 байта 3) 592 бита 4) 656 бит
Решение:
41 * 2 = 82 байта = 656 бит
Ответ: 4
III.Самостоятельная работа
Первый вариант
Задание 1.
Загадано число из промежутка от 1 до 64. Какое количество информации необходимо для угадывания числа из этого промежутка?
Задание 2.
При составлении сообщения использовали 128-символьный алфавит. Каким будет информационный объем такого сообщения, если оно содержит 2048 символов?
Задание 3.
Сообщение занимает 2 страницы. На каждой странице по 80 строк. В каждой строке по 32 символа. Найдите информационный объем такого текста, если при его составлении использовали 256-символьный алфавит.
Второй вариант
Задание 1.
Загадано число из промежутка от 1 до 128. Какое количество информации необходимо для угадывания числа из этого промежутка?
Задание 2.
При составлении сообщения использовали 64-символьный алфавит. Каким будет информационный объем такого сообщения, если оно содержит 3072 символа?
Задание 3.
Сообщение занимает 3 страницы. На каждой странице по 48 строк. В каждой строке по 64 символов. Найдите информационный объем такого текста, если при его составлении использовали 256-символьный алфавит.
IV. Изучение нового материала
Приложение. Слайд 1
Начиная с конца 60-х годов, компьютеры все больше
стали использоваться для обработки текстовой
информации и в настоящее время большая часть
персональных компьютеров в мире (и наибольшее
время) занято обработкой именно текстовой
информации.
Традиционно для кодирования одного символа
используется количество информации, равное 1
байту, то есть I = 1 байт = 8 битов.
Если рассматривать символы как возможные
события, то можно вычислить, какое количество
различных символов можно закодировать: N = 2I
= 28 = 256.
Такое количество символов вполне достаточно для
представления текстовой информации, включая
прописные и строчные буквы русского и латинского
алфавита, цифры, знаки, графические символы и пр.
Кодирование заключается в том, что каждому
символу ставится в соответствие уникальный
десятичный код от 0 до 255 или соответствующий ему
двоичный код от 00000000 до 11111111. Таким образом,
человек различает символы по их начертаниям, а
компьютер – по их кодам.
При вводе в компьютер текстовой информации
происходит ее двоичное кодирование, изображение
символа преобразуется в его двоичный код.
Пользователь нажимает на клавиатуре клавишу с
символом, и в компьютер поступает определенная
последовательность из восьми электрических
импульсов (двоичный код символа). Код символа
хранится в оперативной памяти компьютера, где
занимает один байт.
В процессе вывода символа на экран компьютера
производится обратный процесс – декодирование,
то есть преобразование кода символа в его
изображение.
Приложение. Слайд 2
Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода (с 0 по 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и так далее). Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Коды с 128 по 255 являются национальными, то есть в национальных кодировках одному и тому же коду соответствуют различные символы.
Приложение. Слайд 3
Кодовая таблица – это таблица соответствий
символов и их компьютерных кодов. Исторически
сложилось так, что в России есть несколько
несовместимых кодировок, то есть одинаковые
символы имеют различные коды в разных
кодировках.
К сожалению, в настоящее время существуют пять
различных кодовых таблиц для русских букв (КОИ8,
СР1251, СР866, Mac, ISO), поэтому тексты, созданные в
одной кодировке, не будут правильно отображаться
в другой.
Windows-1251 – набор символов и кодировка, являющаяся
стандартной 8-битной кодировкой для всех русских
версий Microsoft Windows. Пользуется довольно большой
популярностью. Windows-1251 выгодно отличается от
других 8-битных кириллических кодировок
(таких как CP866, KOI8-R и ISO-8859-5) наличием
практически всех символов, использующихся в
русской типографике для обычного текста
(отсутствует только значок ударения); она также
содержит все символы для близких к русскому
языку языков: украинского, белорусского,
сербского и болгарского.
Имеет два недостатка:
• строчная буква я имеет код 0xFF (255 в десятичной
системе). Она является виновницей ряда
неожиданных проблем в программах без поддержки
чистого 8-го бита, а также использующих этот
код как служебный;
• отсутствуют символы псевдографики, имеющиеся
в CP866 и KOI8 (хотя для самих Windows, для которых она
предназначена, в них не было нужды, это делало
несовместимость двух использовавшихся в них
кодировок заметнее).
Для кодирования текстовой информации принят международный стандарт ASCII (American Standard Code for Information Interchange), в кодовой таблице которого зарезервировано 128 семиразрядных кодов для кодирования:
- символов латинского алфавита;
- цифр;
- знаков препинания;
- математических символов.
Для включения символов, например, русского
алфавита возникла необходимость включения 8-го
разряда, что позволило увеличить количество
кодов таблицы ASCII до 255. Оставшуюся часть кодов
использовали для кодирования символов
псевдографики, которые можно использовать,
например, для оформления в тексте различных
рамок и текстовых таблиц.
В настоящее время широкое распространение
получил новый международный стандарт Unicode,
который отводит на каждый символ не один байт, а
два, поэтому с его помощью можно закодировать не
256 символов, а N = 216 = 65536 различных символов.
Процесс кодирования и декодирования является
взаимообратной операцией. В схеме передачи
информации должен присутствовать блок,
отвечающий за кодирование передаваемого
сообщения и за его декодирование для получателя.
В этом случае схема коммуникации выглядит так:
Полный набор символов, используемый для кодирования текста, называется алфавитом или азбукой. Этот алфавит представлен в кодовых таблицах.
V. Вычислительный практикум
– Сегодня мы займемся кодированием и декодированием текстовой информации, используя различные кодировки русского алфавита.
1. С использованием кодовой таблицы Windows (CP-1251) закодируйте слова «информатика», «АЛГОРИТМ», «система счисления».
2. Закодируйте с помощью кодировочной таблицы ASCII и представьте в шестнадцатеричной системе счисления следующие тексты:
а) Password; б) Windows; в) Norton Commander.
Ответ:
а) 50 61 73 73 77 6F 72 64;
б) 57 69 6Е 64 6F 77 73;
в) 4С 6F 67 69 6Е.
3. Декодируйте с помощью кодировочной таблицы ASCII следующие тексты, заданные шестнадцатеричным кодом:
а) 54 6F 72 6Е 61 64 6F;
б) 49 20 6С 6F 76 65 20 79 6F 75;
в) 32 2А 78 2В 79 3D 30.
Ответ:
a) Tornado;
б) I love you;
в) 2 * X + Y = 0
4. Декодируйте следующие тексты, заданные десятичным кодом:
а) 087 111 114 100;
б) 068 079 083;
в) 080 097 105 110 116 098 114 117 115 104.
В программе Блокнот набираем код на дополнительной клавиатуре при нажатой клавише Alt.
Ответ:
Word VOS Paintbrush
5. Представьте в форме шестнадцатеричного кода слово «БИС» во всех пяти кодировках.
6. Как будет выглядеть слово «диск», записанное в кодировке СР1251, в других кодировках.
VI. Инструктаж по выполнению домашнего задания
Задание: закодировать свое имя в двух кодировочных таблицах
VII. Итог урока (2 мин.)
Учитель: Мы учились кодировать и декодировать информацию, используя различные кодировочные таблицы русского языка.