Цель урока. Познакомить учащихся со способами представления и организации текстов в компьютерной памяти.
Изучаемые вопросы:
- Преимущества файлового хранения текстов.
- Кодирование текстов.
- Кодировочная таблица, международный стандарт ASCII.
Ход урока
I. Организационный момент
II. Объяснение нового материала
Компьютер может работать с четырьмя видами информации: текстовой, графической, числовой и звуковой. Одним из самых массовых приложений ЭВМ является работа с текстами: создание текстовых документов и хранение их на магнитных носителях в виде файлов.
Почему же работа с тестовой информацией на компьютерах нашла такое большое распространение?
Почему за очень короткий срок (10-15 лет) практически на всех предприятиях и во всех организациях, в том числе и в нашей школе, пишущие машинки заменили на компьютеры?
Чтобы ответить на эти вопросы рассмотрим отличия обработки и хранения текстов при ручной записи и при создании текстов на компьютере.
Преимущества файлового хранения текстов:
- экономия бумаги;
- компактное размещение;
- возможность многократного использования магнитного носителя для хранения разных документов;
- возможность быстрого копирования на другие магнитные носители;
- возможность передачи текста по линиям компьютерной связи.
Самое поразительное отличие компьютерного текста от бумажного, если информация в нем организована по принципу гипертекста. Гипертекст – это способ организации текстовой информации, внутри которой установлены смысловые связи (гиперсвязи) между ее различными фрагментами. С гипертекстом вы уже встречались при работе со справочной системой ОС Windows.
Иногда бывает так, что текст, состоящий из букв русского алфавита, полученный с другого компьютера, невозможно прочитать - на экране монитора видна какая-то "абракадабра".
Ребята, как вы думаете, почему это происходит?
Пока у вас еще нет точного ответа. В конце урока попробуем еще раз ответить на этот вопрос.
С точки зрения компьютера текст - это любая последовательность символов из компьютерного алфавита. Совсем не обязательно, чтобы это был текст на одном из естественных языков (русском, английском и др.). Это могут быть математические или химические формулы, номера телефонов, числовые таблицы. Самое главное, чтобы все используемые символы входили бы в компьютерный алфавит.
Включить слайд Компьютерный алфавит презентации Кодирование текстов
Для представления информации в компьютере используется алфавит мощностью 256 символов.
Чему равен информационный вес одного символа такого алфавита?
Вспомним формулу, связывающую информационный вес символа алфавита и мощность алфавита: 2i = N
Если мощность алфавита равна 256, то i = 8, и, следовательно, один символ несет 8 бит информации.
Всякая информация представляется в памяти ЭВМ в двоичном виде, а это значит, что каждый символ представляется 8-разрядным двоичным кодом.
8 бит = 1 байту, поэтому двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.
Удобство побайтового кодирования символов очевидно, поскольку байт - наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.
Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу. Понятно, что это дело условное, можно придумать множество способов кодировки.
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.
Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена). На практике можно встретиться и с другой таблицей – КОИ-8 (Код обмена информацией), которая используется в глобальных компьютерных сетях.
Рассмотрим таблицу кодов ASCII (учебник, стр.75).
Включить слайд Кодирование символов презентации Кодирование текстов
Таблица кодов ASCII делится на две части.
Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.
Символы с номерами от 0 до 31 принято называть управляющими. Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.
Символ 32 - пробел, т.е. пустая позиция в тексте. Все остальные отражаются определенными знаками.
Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.
Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.
Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита. Для букв русского алфавита также соблюдается принцип последовательного кодирования.
К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows. MS-DOS, Macintosh и ISO). Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 ("Код обмена информацией, 8-битный"). Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.
От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 ("CP" означает "Code Page", "кодовая страница").
Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.
Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.
Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251.
С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode. Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.
Ребята, какие будут вопросы по теме урока?
А теперь давайте еще раз попробуем ответить на вопрос, который был задан в начале урока:
Почему иногда текст, состоящий из букв русского алфавита, полученный с другого компьютера, мы видим на своем компьютере в виде "абракадабры"?
Ожидаемый ответ. На компьютерах применяется разная кодировка символов русского языка.
Сейчас мы решим несколько примеров.
Пример 1. Сколько бит памяти компьютера занимает слово МИКРОПРОЦЕССОР?
Прежде, чем приступить к решению примера, вспомним, какой объем памяти занимает один символ компьютерного текста.
Ожидаемый ответ. 1 байт
Решение. Слово состоит из 14 букв. Каждая буква является символом компьютерного алфавита и поэтому занимает 1 байт памяти. Слово займет 14 байт = 112 бит памяти, т.к. 1 байт = 8 бит.
В чем заключается принципа последовательного кодирования алфавита?
Ожидаемый ответ. В таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений
Знание принципа последовательного кодирования позволяет нам решать некоторые задачи без обращения к таблице кодировки символов.
Пример 2. Что зашифровано последовательностью десятичных кодов: 108 105 110 107, если буква i в таблице кодировки символов имеет десятичный код 105?
Решение. Вспомним порядок букв в латинском алфавите - … i, j, k, l, m, n, o … . Буква j будет иметь код 106, k - код 107 и и.д. Следовательно, закодировано слово link.
Что обозначает понятие "кодовая страница"?
Ожидаемый ответ. Так называется вторая половина кодовой таблицы ASCII, предназначенная для размещения национальных алфавитов, отличных от латинского.
Соблюдается ли принцип последовательного кодирования в кодовых страницах?
Ожидаемый ответ. Соблюдается
Выясним это, решив следующий пример.
Пример 3. С помощью последовательности десятичных кодов: 225 232 242 зашифровано слово бит. Найти последовательность десятичных кодов этого же слова, записанного заглавными буквами.
Решение. При решении учтем, что разница между десятичным кодом строчной буквы кириллицы и десятичным кодом соответствующей заглавной буквы равна 32. Если букве б соответствует код 225, заглавная буква Б имеет десятичный код 225-32=193. Следовательно, слову БИТ соответствует последовательность кодов: 193 200 210.
III. Самостоятельная практическая работа
(параллельно вызываются ученики для решения примеров у доски)
Пример 4. Свободный объем оперативной памяти компьютера 640 Кбайт. Сколько страниц книги поместится в ней, если на странице 16 строк по 64 символа в строке?
Ответ:(640?1024)/(16?64)=640 стр.
Пример 5. Текст занимает полных 10 секторов на односторонней дискете объемом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст?
Ответ:((180?1024)/(40?9))?10=5120 симв.
IV. Подведение итогов урока
V. Домашнее задание
Читать: § 13; выполнить ДЗ №10
Тестирование по разделу "Текстовые редакторы"
A01:
Таблица кодировки символов устанавливает соответствие между
1) символами, их десятичными номерами и двоичными кодами
2) символами разных алфавитов
3) символами и количеством байтов, которые они занимают
4) символами и номерами ячеек памяти, которые они занимают
5) символами и клавишами
A02:
Что будет меняться при представлении символа на экране монитора в различных кодировках (Windows, MS-DOS, КОИ8-Р и т.д.)?
1) гарнитура шрифта
2) размер символа
3) символ
4) начертание символа
5) изменений не будет
A03:
Код (номер) буквы "j" в таблице кодировки символов равен 106. Какая последовательность букв будет соответствовать слову "file"?
Алфавит латинских букв: abcdefghijklmn …
1) 110 107 104 111
2) 74 98 120 66
3) 132 112 90 140
4) 102 105 108 101
5) 90 102 114 86
A04:
Последовательность кодов 105 162 109 таблицы кодировки шифрует некоторые символы. Вставить вместо многоточия верное утверждение.
"Среди этих символов …"
1) не может быть букв русского алфавита
2) не может быть букв латинского алфавита
3) могут быть буквы русского и латинского алфавитов
4) не может быть букв русского и латинского алфавитов
5) может быть только одна буква латинского алфавита
A05:
Для хранения текста требуется 10 Кбайт. Сколько страниц займет этот текст, если на странице размещается 40 строк по 64 символа в строке?
1) 4
2) 40
3) 160
4) 256
5) 320
A06:
Координаты курсора текстового редактора фиксируются
1) в меню текстового редактора
2) в словаре текстового редактора
3) в строке состояния текстового редактора
4) в окне текстового редактора
5) в буфере для копирования
A07:
Выберите фразу, написание которой соответствует правилам набора текста на компьютере:
1) Во всех трамваях окна изо льда . Белы деревья, крыши, провода
2) Я светлый образ в сердце берегу:у зимней Волги Ярославль в снегу.
3) Во всех трамваях окна изо льда. Белы деревья , крыши , провода.
4) Я светлый образ в сердце берегу: у зимней Волги Ярославль в снегу.
5) Во всех трамваях окна изо льда.Белы деревья, крыши , провода.
A08:
Выбрать действие, относящееся к форматированию текста:
1) копирование фрагментов текста
2) исправление опечаток
3) проверка орфографии
4) изменение размера полей
5) перемещение фрагментов текста
A09:
При печати документа на странице умещается 60 строк по 80 символов в каждой. Какие параметры необходимо изменить, чтобы на странице умещалось меньшее количество символов?
1) изменить кодировку
2) изменить начертание шрифта
3) уменьшить размер полей страницы
4) уменьшить гарнитуру шрифта
5) увеличить интервал между строками
A10:
Какие символы могут быть зашифрованы кодами таблицы ASCII: 119 и 251?
1) "д" и "ш"
2) "j" и "s"
3) "d" и "D"
4) "я" и "t"
5) "w" и "ы"
A11:
В текстовом редакторе можно использовать только один шрифт и две кнопки для установки таких эффектов как полужирное начертание и курсив. Сколько различных начертаний символов можно получить?
1) 1
2) 2
3) 3
4) 4
5) 6
A12:
Размер окна текстового редактора – 20 строк по 64 символа в строке. Курсор находится в левом верхнем углу экрана и указывает на символ, стоящий в 25-й строке и 5 позиции текста. Какой из указанных символов будет виден в окне?
1) стоящий в 25-й строке и 70 позиции текста
2) стоящий в 35-й строке и 50 позиции текста
3) стоящий в 1-й строке и 1 позиции текста
4) стоящий в 46-й строке и 57 позиции текста
5) стоящий в 20-й строке и 5 позиции текста
A13:
В минимальный набор функций, которые должен выполнять текстовый редактор, не входит:
1) сохранение файлов
2) загрузка файлов
3) форматирование текста
4) работа с графикой
5) редактирование текста
A14:
Для редактирования неверно набранных символов используются клавиши:
1) Backspace, Delete, Insert
2) Home, End, Insert
3) Home, End
4) Backspace, Delete
5) Shift, Enter
A15:
Буфер обмена - это:
1) раздел оперативной памяти
2) раздел жесткого магнитного диска
3) часть устройства ввода
4) раздел ПЗУ
5) часть устройства вывода
A16:
Текст занимает 0,25 Кбайт памяти компьютера. Сколько символов содержит текст?
1) 32
2) 64
3) 128
4) 256
5) 512
A17:
Во время работы текстового редактора орфографический словарь
1) по мере необходимости загружается в оперативную память
2) по мере необходимости загружается во внешнюю память
3) постоянно находится в устройстве ввода
4) постоянно находится в ПЗУ
5) постоянно находится в устройстве вывода
A18:
Для перемещении фрагмента текста из одного места документа в другое необходимо выполнить команду(ы):
1) Копировать, Вставить
2) Вырезать
3) Вырезать, Вставить
4) Сохранить, Вставить
5) Вставить
A19:
Текст состоит из 50 строк по 60 символов в каждой. Размер окна текстового редактора 20 ´ 50 символов. Курсор стоит в левом верхнем углу рабочего поля и в строке состояния отображается его позиция: (11,11). Сколько символов будет видно на экране?
1) 20
2) 200
3) 100
4) 500
5) 1000
A20:
Сколько слов (с точки зрения текстового редактора)содержится в следующем тексте, содержащем ряд ошибок: "Раз,два, три, четыре, пять. Вышел зайчик по гулять. В друг охотник вы бегает."
1) 9
2) 10
3) 11
4) 12
5) 13
Литература
И. Семакин и др. Информатика. Базовый курс 7 – 9.