Презентация "Двоичное кодирование символьной информации"

Подписи к слайдам:
Двоичное кодирование символьной информации
  • <number>
  • <number>
  • При двоичном кодировании текстовой информации каждому символу ставится в соответствие своя уникальная последовательность из восьми нулей и единиц, свой уникальный код от 00000000 до 11111111 (десятичный код от 0 до 255)
  • <number>
  • Присвоение символу конкретного двоичного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода (с 0 до 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и т.д.). Коды 33 до 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.
  • <number>
  • Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы. К сожалению, в настоящее время существует 5 различных кодовых таблиц для русских букв, поэтому тексты созданные в одной кодировке, не будут правильно отображаться в другой.
  • <number>
  • Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ – 8 («Код обмена информационный – 8 битный»). Эта кодировка применяется в компьютерах с операционной системой UNIX.
  • <number>
  • Наиболее распространенная кодировка – это стандартная кириллистическая кодировка Microsoft Windows, обозначаемая сокращением CP1251 («CP» означает «Code Page»). Все Windows – приложения, работающие с русским языком, поддерживают эту кодировку.
  • <number>
  • Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft – кодировка CP 866.
  • <number>
  • Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Mac)
  • <number>
  • Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859 – 5.
  • <number>
  • КОИ-8 - UNIX
  • CP1251 («CP» означает «Code Page») - Microsoft Windows
  • CP 866 - MS-DOS
  • Mac - Macintosh
  • ISO 8859 – 5
  • Стандарты кодировок:
Таблица кодировки символов
  • <number>
  • Двоичный код
  • Десятичный код
  • КОИ8
  • CP1251
  • CP866
  • Mac
  • ISO
  • 0000 0000
  • 0
  • ………
  • 0000 1000
  • 8
  • Удаление последнего символа (клавиша Backspace)
  • ………
  • 0000 1101
  • 13
  • Перевод строки (клавиша Enter)
  • ………
  • 0010 0000
  • 32
  • Пробел
  • 0010 0001
  • 33
  • !
  • ………
  • 0101 1010
  • 90
  • Z
  • ………
  • 0111 1111
  • 127
  • ………
  • 128
  • -
  • Ъ
  • А
  • А
  • К
  • ………
  • 1100 0010
  • 194
  • Б
  • В
  • -
  • -
  • Т
  • ………
  • 1100 1100
  • 204
  • Л
  • М
  • :
  • :
  • Ь
  • ………
  • 1101 1101
  • 221
  • Щ
  • Э
  • -
  • Ё
  • Н
  • ………
  • 1111 1111
  • 225
  • Ь
  • я
  • Нераз. пробел
  • Нераз. пробел
  • п
  • <number>
  • В последнее время появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и поэтому с его помощью можно закодировать не 256 символов, 216=65 536 различных символов. Эту кодировку поддерживает платформа Microsoft Windows&Office97.
Задание : определите символ по числовому коду.
  • <number>
  • Запустите программу БЛОКНОТ
  • Нажмите ALT и 0224 (на дополнительной цифровой клавиатуре).
  • Появится символ а.
  • Повторите эту операцию для числовых кодов от 0225 до 0233.
  • Появятся символы в кодировке (CP 1251 Windows).
  • Запишите их в тетрадь.
Задание 2: определите символ по числовому коду.
  • <number>
  • Запустите программу БЛОКНОТ
  • Нажмите ALT и 161 (на дополнительной цифровой клавиатуре).
  • Появится символ.
  • Повторите эту операцию для числовых кодов 160, 169, 226.
  • Появятся символы в кодировке (CP 866 MS-DOS).
  • Запишите их в тетрадь.