Презентация "Кодирование и обработка текстовой информации" 10 класс


Подписи к слайдам:
Кодирование и обработка текстовой информации.

Кодирование и обработка текстовой информации.

Кодирование и декодирование текстовой информации

  • Для кодирования букв русского и латинского алфавита, цифр, ряда спец. знаков достаточно использовать 256 различных символов. По формуле, связывающей количество сообщений N и количество информации I, можно вычислить, какое количество информации необходимо для кодирования каждого знака.
  • N =2I => 256 = 2I => 28 = 2I => I = 8 битов = 1 байт

  • Кодирование заключается в том, что каждому символу ставится в соответствие уникальной десятичный код от 0 до 255 или соответствующий или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер – по их коду.

При вводе в компьютер текстовой информации происходит её двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну ячейку.

В процессе вывода символа на экран компьютера производится обратный процесс – декодирование, т. е. преобразование кода символа в его изображение.

Кодировки русского алфавита

  • Важно, что присваивание символу конкретного кода- это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода(с 0 по 32) этой таблицы соответствует не символам, а операциям(перевод строки, ввод пробела и так далее).
  • Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

  • Коды с 128 по 255 являются национальными, то есть в национальных кодировках одному и тому же коду соответствуют различные символы. Существуют 5 однобайтовых кодовых таблиц для русских букв(WINDOWS, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

  • В настоящее время широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, а N=216 = 65536 различных символов. Такого количества символов достаточно для кодировки не только русского и латинского алфавита, цифры, знаки и математические символы, но и другие алфавиты.