Инфознайка
Главная

Информация вокруг нас

Виды информации
Измерения информации
Алфавитный подход
Содержательный подход
Файловая система
Кодирование графики
Кодирование звука
Скорость передачи
Электронная таблица Excel
Графы
Система счисления
Кодирование информации
Логика
Адресация в Интернете
Поиск в Интернете
Алгоритмы
Кумир
Массивы

Тема: Алфавитный подход к измерению информации

Коротко о главном

Алфавитный подход это способ измерения информационного объема текста, не связанного с его содержанием.

Алфавит — это вся совокупность символов, используемых в некотором языке для представления информации.

Мощность алфавита — это число символов в нем.

1 бит — информационный вес одного символа двухсимвольного алфавита  (N=2).

Информационный вес символа (разрядность двоичного кода)  (b)  и мощность алфавита  (N)  связаны формулой  N=2b .

Если  N  не равно двойке в целой степени, то находится большее  N,  ближайшее к  N  целое число  М=2b (b - целое), и из этого равенства определяется  b - информационный вес символа.

Информационный объем текста равен сумме информационных весов всех символов, составляющих текст.

1 байт — информационный вес символа из алфавита мощностью  28 = 256  символов, 1 байт = 8 битов. (кодировка в КОИ-8)

2 байта информационный вес символа из алфавита мощностью  216 = 65536  символов, (кодировка в UNICODE)

Байт, килобайт, мегабайт, гигабайт, терабайт — единицы измерения информации. Каждая следующая единица больше предыдущей в  1024 (210) раза.

Что нужно знать:

·    все символы кодируются  одинаковым числом бит (алфавитный подход)

·    чаще всего используют кодировки, в которых на символ отводится 8 бит (8-битные) или 16 бит (16-битные)

·    при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 Кбайт) – 1024 байта, в мегабайте (1Мбайт) – 1024 Кбайта

·    после знака препинания внутри (не в конце!) текста ставится пробел

·    чтобы найти информационный объем текста I, нужно умножить количество символов N на число бит на символ K:   I-N*K

·    две строчки текста не могут занимать 100 Кбайт в памяти

Пример задания:

Определите информационный объем текста
Бамбарбия! Кергуду!
   
Решение:
в этом тексте 19 символов (обязательно считать пробелы и знаки препинания). Если нет дополнительной информации, считаем, что используется 8-битная кодировка (чаще всего явно указано, что кодировка 8- или 16-битная)
поэтому в сообщении
      19*8 = 152 бита информации

Еще пример

Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?

Решение:

1)      обозначим количество символов через N

2)      при 16-битной кодировке объем сообщения – 16*N бит

3)      когда его перекодировали в 8-битный код, его объем стал равен– 8*N бит

4)      таким образом, сообщение уменьшилось на 16*N – 8*N = 8*N = 480 бит

5)      отсюда находим N = 480/8 = 60 символов.

 

Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке длиной в 20 символов, первоначально записанного в 2-байтном коде Unicode, в 8-битную кодировку КОИ-8. На сколько бит уменьшилась длина сообщения? В ответе запишите только число.

Решение:

1)      при 16-битной кодировке объем сообщения – 16*20 бит

2)      когда его перекодировали в 8-битный код, его объем стал равен– 8*20 бит

3)      таким образом, сообщение уменьшилось на 16*20 – 8*20 = 8*20 = 160 бит

4)      Ответ:  160 бит.

Возможные ловушки и проблемы:

·    нужно внимательно читать, в каких единицах требуется записать ответ

Проверочные задания

  1. Определить информационный объем сообщения: "Я изучаю информатику" в кодировке КОИ-8.

    20 байт
    20 бит
    40 бит
    40 байт

  2. Определить информационный объем сообщения: "Я знаю информатику." в кодировке UNICODE.

    144 бита
    38 байт
    18 байт
    152 бита

  3. Объем сообщения, содержащего 4096 символов, равен 1/512 части Мбайта. Какой объем информации несет один символ?

    2 бита
    2 байта
    4 бита
    4 байта

  4. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?

    20 символов
    40 символов
    60 символов
    89 символов


  5. В книге, набранной на компьютере, содержится 60 листов текста. На каждом листе 45 строк. каждая строка содержит 75 символов. Каков объем информации содержит книга.

    202500 бит
    1620000 бит
     1620000 байт
    2025000 байт