Презентация "Оценка количественных параметров текстовых документов" 7 класс

Подписи к слайдам:
Белоснежка и семь гномов… Гулливер и лилипуты… Компьютер и память… Кто владеет информацией, тот владеет миром Черный ящик ОЦЕНКА КОЛИЧЕСТВЕННЫХ ПАРАМЕТРОВ ТЕКСТОВЫХ ДОКУМЕНТОВ 7 класс Вспомним структуру текстового документа

Представление текстовой информации в памяти компьютера

Текст состоит из символов - букв, цифр, знаков препинания и т. д., которые компьютер различает по их двоичному коду.

Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц.

Кодовая таблица

0 – 32 - управляющие символы

33 – 127 – латинские буквы, знаки препинания, цифры, знаки арифметических операций

128 – 256 – буквы национального

алфавита

ASCII

Представление текстовой информации в памяти компьютера

Соответствие между изображениями символов и кодами символов устанавливается с помощью кодовых таблиц.

Фрагмент кодовой таблицы ASCII

Символ

Десятичный код

Двоичный код

Символ

Десятичный код

Двоичный код

Пробел

32

00100000

0

48

00110000

!

33

00100001

1

49

00110001

#

35

00100011

2

50

00110010

$

36

00100100

3

51

00110011

*

42

00101010

4

52

00110100

=

43

00101011

5

53

00110101

,

44

00101100

6

54

00110110

-

45

00101101

7

55

00110111

_

46

00101110

8

56

00111000

/

47

00101111

9

57

00111001

A

65

010000001

N

78

01001110

B

66

01000010

O

79

010001111

C

67

01000011

P

80

01010000

Коды русских букв в разных кодировках

Символ

Кодировка

Windows

КОИ-8

десятичный код

двоичный код

десятичный код

двоичный код

А

?

11000000

?

11100001

Б

?

11000001

?

11100010

В

194

11000010

247

11110111

Стандарт кодирования символов Unicode позволяет пользоваться более чем двумя языками.

В Unicode каждый символ кодируется шестнадцатиразрядным двоичным кодом.

Такое количество разрядов позволяет закодировать 65 536 различных символов:

216 = 65 536.

Информационный объём фрагмента текста

I = Ki

I - информационный объём сообщения

K – количество символов

i – информационный вес символа

В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:

  • 8 битов (1 байт) - восьмиразрядная кодировка;
  • 16 битов (2 байта) - шестнадцатиразрядная кодировка.

Информационный объём фрагмента текста - это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования.

Информационный объём фрагмента текста

Задача 1. Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объём следующего высказывания Жан-Жака Руссо:

Тысячи путей ведут к заблуждению, к истине - только один.

Решение

В данном тексте 57 символов (с учётом знаков препинания и пробелов). Каждый символ кодируется одним байтом. Следовательно, информационный объём всего текста - 57 байтов.

Ответ: 57 байтов.

Информационный объём фрагмента текста

Задача 2. В кодировке Unicode на каждый символ отводится два байта. Определите информационный объём слова из 24 символов в этой кодировке.

Решение.

I = 24  2 = 48 (байтов).

Ответ: 48 байтов.

Информационный объём фрагмента текста

Ответ: 3,39 Мбайт.

K = 740  80  60

N = 256

I - ?

256 = 2i = 28, i = 8

К = 740  80  60  8 = 28 416 000 бит = 3 552 000 байтов =

= 3 468,75 Кбайт 3,39 Мбайт.

I = K i

N = 2i

Решение

Задача 4. Выразите в мегабайтах объём текстовой информации в «Современном словаре иностранных слов» из 740 страниц, если на одной странице размещается в среднем 60 строк по 80 символов (включая пробелы). Считайте, что при записи использовался алфавит мощностью 256 символов.

Текст состоит из символов - _________________и т. д., которые человек различает по начертанию. Компьютер различает вводимые символы по их двоичному коду. Соответствие между изображениями и кодами символов устанавливается с помощью _______________ таблиц.

В зависимости от разрядности используемой кодировки информационный вес символа текста, создаваемого на компьютере, может быть равен:

  • __________(1 байт) - восьмиразрядная кодировка;
  • 16 битов (______байта) - шестнадцатиразрядная кодировка.
  • Информационный объём фрагмента текста - это количество битов, байтов (килобайтов, мегабайтов), необходимых для записи фрагмента оговорённым способом кодирования.

Вставьте недостающие слова

I - информационный объём сообщения

K – количество символов

i – информационный вес символа

I = K x i

8 битов

16 битов

Информационный вес символа

Windows

Unicode

ASCII

КОИ-8

Вопросы и задания

Почему кодировки, в которых каждый символ кодируется цепочкой из восьми нулей и единиц, называются иначе однобайтовыми?

Считая, что каждый символ кодируется одним байтом, определите, чему равен информационный объём следующего высказывания:

Длина данного текста - 32 символа.

  • 32 байта
  • 272 бита
  • 0.033203125 Кбайт
  • 34 байта

В текстовом режиме экран монитора компьютера обычно разбивается на 25 строк по 80 символов в строке. Определите объём текста, занимающего весь экран монитора, в кодировке Unicode.

Сообщение занимает 2 страниц по 2 строк, в каждой строке записано по 8 символов. Информационный объём всего сообщения равен 64 бита. Сколько двоичных разрядов было использовано на кодирование одного символа?

В какой кодировочной таблице можно закодировать 65 536 различных символов?

  • ASCII
  • Windows
  • КОИ-8
  • Unicode
Белоснежка и семь гномов… Гулливер и лилипуты… Компьютер и память… Что может объединять не только эти пары, но и все эти объекты?