Кодирование текстовой информации
Цели:
- Обучающие:
- понимать принцип кодирования текстовой информации;
- осознавать проблемы, связанные с кодировкой символов русского алфавита, и пути их решения;
- Развивающие: развивать внимание, логику;
- Воспитательные: воспитывать умение распределять время выполнения самостоятельной работы.
ХОД УРОКА
I. Организационный момент (1 мин)
Проверка готовности рабочего места (учебник, тетрадь, дневник, ручка, карандаш).
II. Актуализация опорных знаний
№2.
В кинотеатре 16 рядов по 32 места в каждом. Какое количество информации в битах содержит сообщение о том, что продан один билет в 8-м ряду место № 4?
1) 5 2) 8 3) 9 4) 16
N = 16 • 32 = 29
29 = 2I;
I = 9 бит
Ответ: 3
№10
В одном из способов представления Unicode каждый символ
закодирован 2 байтами. Определите информационный объем следующего
предложения в данном представлении:
Попрыгунья Стрекоза лето красное пропела.
1) 41 байт 2) 74 байта 3) 592 бита 4) 656 бит
Решение:
41 * 2 = 82 байта = 656 бит
Ответ: 4
III.Самостоятельная работа
Первый вариант
Задание 1.
Загадано число из промежутка от 1 до 64. Какое количество информации необходимо для угадывания числа из этого промежутка?
Задание 2.
При составлении сообщения использовали 128-символьный алфавит. Каким будет информационный объем такого сообщения, если оно содержит 2048 символов?
Задание 3.
Сообщение занимает 2 страницы. На каждой странице по 80 строк. В каждой строке по 32 символа. Найдите информационный объем такого текста, если при его составлении использовали 256-символьный алфавит.
Второй вариант
Задание 1.
Загадано число из промежутка от 1 до 128. Какое количество информации необходимо для угадывания числа из этого промежутка?
Задание 2.
При составлении сообщения использовали 64-символьный алфавит. Каким будет информационный объем такого сообщения, если оно содержит 3072 символа?
Задание 3.
Сообщение занимает 3 страницы. На каждой странице по 48 строк. В каждой строке по 64 символов. Найдите информационный объем такого текста, если при его составлении использовали 256-символьный алфавит.
IV. Изучение нового материала
Приложение. Слайд 1
Начиная с конца 60-х годов, компьютеры все больше стали
использоваться для обработки текстовой информации и в настоящее
время большая часть персональных компьютеров в мире (и наибольшее
время) занято обработкой именно текстовой информации.
Традиционно для кодирования одного символа используется количество
информации, равное 1 байту, то есть I = 1 байт = 8 битов.
Если рассматривать символы как возможные события, то можно
вычислить, какое количество различных символов можно закодировать:
N = 2I = 28 = 256.
Такое количество символов вполне достаточно для представления
текстовой информации, включая прописные и строчные буквы русского и
латинского алфавита, цифры, знаки, графические символы и пр.
Кодирование заключается в том, что каждому символу ставится в
соответствие уникальный десятичный код от 0 до 255 или
соответствующий ему двоичный код от 00000000 до 11111111. Таким
образом, человек различает символы по их начертаниям, а компьютер –
по их кодам.
При вводе в компьютер текстовой информации происходит ее двоичное
кодирование, изображение символа преобразуется в его двоичный код.
Пользователь нажимает на клавиатуре клавишу с символом, и в
компьютер поступает определенная последовательность из восьми
электрических импульсов (двоичный код символа). Код символа
хранится в оперативной памяти компьютера, где занимает один
байт.
В процессе вывода символа на экран компьютера производится обратный
процесс – декодирование, то есть преобразование кода символа в его
изображение.
Приложение. Слайд 2
Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода (с 0 по 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и так далее). Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания. Коды с 128 по 255 являются национальными, то есть в национальных кодировках одному и тому же коду соответствуют различные символы.
Приложение. Слайд 3
Кодовая таблица – это таблица соответствий символов и их
компьютерных кодов. Исторически сложилось так, что в России есть
несколько несовместимых кодировок, то есть одинаковые символы имеют
различные коды в разных кодировках.
К сожалению, в настоящее время существуют пять различных кодовых
таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO), поэтому
тексты, созданные в одной кодировке, не будут правильно
отображаться в другой.
Windows-1251 – набор символов и кодировка, являющаяся стандартной
8-битной кодировкой для всех русских версий Microsoft Windows.
Пользуется довольно большой популярностью. Windows-1251 выгодно
отличается от других 8-битных кириллических кодировок (таких
как CP866, KOI8-R и ISO-8859-5) наличием практически всех символов,
использующихся в русской типографике для обычного текста
(отсутствует только значок ударения); она также содержит все
символы для близких к русскому языку языков: украинского,
белорусского, сербского и болгарского.
Имеет два недостатка:
• строчная буква я имеет код 0xFF (255 в десятичной системе).
Она является виновницей ряда неожиданных проблем в программах без
поддержки чистого 8-го бита, а также использующих этот код
как служебный;
• отсутствуют символы псевдографики, имеющиеся в CP866 и KOI8 (хотя
для самих Windows, для которых она предназначена, в них не было
нужды, это делало несовместимость двух использовавшихся в них
кодировок заметнее).
Для кодирования текстовой информации принят международный стандарт ASCII (American Standard Code for Information Interchange), в кодовой таблице которого зарезервировано 128 семиразрядных кодов для кодирования:
- символов латинского алфавита;
- цифр;
- знаков препинания;
- математических символов.
Для включения символов, например, русского алфавита возникла
необходимость включения 8-го разряда, что позволило увеличить
количество кодов таблицы ASCII до 255. Оставшуюся часть кодов
использовали для кодирования символов псевдографики, которые можно
использовать, например, для оформления в тексте различных рамок и
текстовых таблиц.
В настоящее время широкое распространение получил новый
международный стандарт Unicode, который отводит на каждый символ не
один байт, а два, поэтому с его помощью можно закодировать не 256
символов, а N = 216 = 65536 различных символов.
Процесс кодирования и декодирования является взаимообратной
операцией. В схеме передачи информации должен присутствовать блок,
отвечающий за кодирование передаваемого сообщения и за его
декодирование для получателя. В этом случае схема коммуникации
выглядит так:

Полный набор символов, используемый для кодирования текста, называется алфавитом или азбукой. Этот алфавит представлен в кодовых таблицах.
V. Вычислительный практикум
– Сегодня мы займемся кодированием и декодированием текстовой информации, используя различные кодировки русского алфавита.
1. С использованием кодовой таблицы Windows (CP-1251) закодируйте слова «информатика», «АЛГОРИТМ», «система счисления».
2. Закодируйте с помощью кодировочной таблицы ASCII и представьте в шестнадцатеричной системе счисления следующие тексты:
а) Password; б) Windows; в) Norton Commander.
Ответ:
а) 50 61 73 73 77 6F 72 64;
б) 57 69 6Е 64 6F 77 73;
в) 4С 6F 67 69 6Е.
3. Декодируйте с помощью кодировочной таблицы ASCII следующие тексты, заданные шестнадцатеричным кодом:
а) 54 6F 72 6Е 61 64 6F;
б) 49 20 6С 6F 76 65 20 79 6F 75;
в) 32 2А 78 2В 79 3D 30.
Ответ:
a) Tornado;
б) I love you;
в) 2 * X + Y = 0
4. Декодируйте следующие тексты, заданные десятичным кодом:
а) 087 111 114 100;
б) 068 079 083;
в) 080 097 105 110 116 098 114 117 115 104.
В программе Блокнот набираем код на дополнительной клавиатуре при нажатой клавише Alt.
Ответ:
Word VOS Paintbrush
5. Представьте в форме шестнадцатеричного кода слово «БИС» во всех пяти кодировках.
6. Как будет выглядеть слово «диск», записанное в кодировке СР1251, в других кодировках.
VI. Инструктаж по выполнению домашнего задания
Задание: закодировать свое имя в двух кодировочных таблицах
VII. Итог урока (2 мин.)
Учитель: Мы учились кодировать и декодировать информацию, используя различные кодировочные таблицы русского языка.