§ 26. Представление информации в компьютере

26.1. Кодирование информации

Для общения друг с другом люди используют естественный язык, например белорусский или русский. В основе естественного языка лежит алфавит — система графических знаков для передачи звуков устной речи. Алфавит естественного языка является универсальным кодом любой письменной культуры. При разговоре этот код передаётся звуками, пpи письме — буквами.

Кроме естественных языке» человек часто использует формальные языки со своими особыми кодами: язык математических или химических формул, ноты и др.

Код — это совокупность условных знаков, каждому из которых присваивается определённое значение (примеры 26.1-26.3).
Процесс записи или преобразования информации в соответствии с правилами, заданными некоторым кодом, называют кодированием. Процесс, обратный кодированию, называют декодированием.

Кодировать и передавать информацию можно различными способами: устно, письменно, жестами и др. Компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видеоинформацию только в цифровом формате. Для получения цифрового формата информация с помощью специальных программ преобразуется в двоичный код, понятный компьютеру.

Двоичный код — это способ кодирования, при котором каждый разряд кода принимает одно из двух возможных значений, обычно обозначаемых цифрами 0 и 1. Разряд в этом случае называется двоичным разрядом.

Такой способ кодирования позволяет создавать технические устройства, обладающие двумя устойчивыми состояниями: включено/выключено, соединено/разъединено и др.

Для кодирования числовой информации в компьютере вместо известной всем десятичной системы счисления используется двоичная система счисления. В ней для записи чисел используют две цифры: 0 и 1.

Кодирование текстовой информации в компьютере выполняется с помощью специальных кодовых таблиц, в которых каждому символу ставится в соответствие определённая последовательность из нулей и единиц (пример 26.4).

На разных компьютерах могут использоваться разные кодовые таблицы. В этом случае текст, набранный на одном компьютере, может неправильно читаться на другом.

26.2. Единицы измерения объёма информации

В своей деятельности человек постоянно применяет различные единицы измерения. Например, единицы измерения времени — секунды, минуты, часы; расстояния — метры, километры; температуры — градусы и т. д. Измерения производят с помощью измерительных приборов (пример 26.5).
Для определения количества информации также существуют свои единицы измерения. Минимальное количество информации, для кодирования которой достаточно одного двоичного разряда, называют битом (bit). Бит является минимальной единицей, выражающей количество информации. При этом он может принимать только одно из двух значений: 0 или 1. Более крупная единица измерения информации — байт (пример 26.6).

Байт — единица измерения количества информации, состоящая из восьми последовательных битов.

1 байт — 23 бит = 8 бит.

Для обозначения большего объёма информации используются другие единицы измерения:

1 Кбайт (килобайт) = 1024 байт = 210 байт;
1 Мбайт (мегабайт) = 210 Кбайт = 220 байт;
1 Гбайт (гигабайт) = 210 Мбайт = 230 байт;
1 Тбайт (терабайт) = 210 Гбайт = 240 байт;
1 Пбайт (петабайт) = 210 Тбайт = 250 байт;
1 Эбайт (эксабайт) = 210 Пбайт = 260 байт.

Значения данных единиц взаимосвязаны между собой различными степенями числа 2 (пример 26.7). Они позволяют измерять количество (объём) оперативной или внешней памяти компьютера, размеры файлов. В этом случае в качестве измерительного прибора используется компьютер.

В примере 26.8 показано, как можно переводить одни единицы измерения в другие: мегабайты в килобайты и в гигабайты.

Кодирование информации использовалось с глубокой древности для хранения и передачи информации. Примером кодирования информации является шумерская клинопись.

     Пример 26.1. Широко известным является шифр Юлия Цезаря — кодирование, которое применялось для записи и передачи зашифрованных сообщений. Каждый символ в тексте заменяется символом, находящимся на некотором постоянном расстоянии левее или правее него в алфавите. В шифре со сдвигом вправо на 3 позиции буква «А» была бы заменена на «Г», «Б» станет «Д» и т. д.

    Пример 26.2. Сегодня широко применяются штрих-коды на различных товарах. Товары, произведённые в Беларуси, имеют номер, начинающийся с цифр 481.

    Пример 26.3. С появлением смартфонов стали распространяться QR-коды. Они позволяют моментально заносить в свой телефон текстовую информацию, добавлять контакты в адресную книгу, переходить по веб-ссылкам, отправлять СМС-сообщения и т. д. Следующий QR-код позволяет перейти на сайт «ЮНИ-центр-ХХ1» факультета прикладной математики и информатики БГУ, посвящённый дополнительному образованию учащихся по математике и информатике.

Пример 26.4. Кодирование некоторых букв русского алфавита на компьютере.

 

Пример 26.5. Инструменты для различных измерений — времени, расстояния, температуры, массы.
Пример 26.6Соотношение между битом и байтом.
Слово «бит» произошло от двух английских слов binary (двоичный) и digit (знак).
Байт не всегда равнялся 8 битам. Термин «байт» впервые был использован в 1956 г. при проектировании первого суперкомпьютера IB M 7030 Stretch для обозначения последовательности битов числом от 1 до 6. В советских ЭВМ БЭСМ-6, М-220 байт равнялся 6 битам, а в ЭВМ Минск-32 использовался 7-битный байт.
Пример 26.7. Соотношение единиц измерения информации.
Приставки кило-, мега-, гига-, тера-, которые используются в названиях единиц измерения информации, являются общепринятыми. Однако в международной системе единиц (СИ) этим приставкам соответствуют другие числовые значения (103, 106, 109, 1012, 1015 и 1018). Д ля единиц измерения информации применяются другие приставки: киби-, меби-, гиби-, теби-, пеби-, эксби-.

Пример 26.8. Перевести 2368 мегабайт в килобайты и гигабайты:

2368 Мбайт = (2368 • 210) Кбайт = 2 424 832 Кбайт.
2368 Мбайт = (2368 / 210) Гбайт ≈ 2,3 Гбайт

1. Что такое код?
2. Какой процесс называют кодированием информации?
3. Какой код используют для кодирования информации в компьютере?
4. Какие единицы измерения информации вы знаете?

Упражнения

1. Выполните перевод единиц измерения информации.

  1. 174 байта в биты.
  2. 342,3 Кбайт в байты.
  3. 45 638 Мбайт в гигабайты.

2. Закодируйте фразу «Кто владеет информацией, тот владеет миром», используя шифр Юлия Цезаря со сдвигом на 3 позиции вправо.

3. В азбуке Морзе буквы заменяются последовательностями из коротких и длинных сигналов — точек и тире.

 

  1. С помощью азбуки Морзе запишите: «Запас беды не чинит».
  2. Расшифруйте информацию, представленную с помощью азбуки Морзе.

4.* В одном из рассказов А. Конан Дойля великий сыщик Шерлок Холмс разгадывает шифр пляшущих человечков. Расшифруйте фразу.


5.*Найдите в сети Интернет ответы на следующие вопросы.

  1. Какие шифры встречаются в литературных произведениях?
  2. Как искусственный интеллект может расшифровывать старинные книги?

Для получения ответа перейдите в редактор Яндекс Браузера или в режим ИИ в Google Chrome.