Основы алгоритмизации и вычислений: Учебно-практическое пособие, страница 4

            Для примера кодирования возьмем предмет мебели стол. Для кодирования информации об этом предмете на русском языке нам понадобиться записать последовательность символов «СТОЛ», а кодирования информации об этом предмете на английском «TABLE».

            Естественные языки очень часто имеют одинаковый код для определения различных объектов. Так например слово «коса» может означать девичью косу,  речную отмель и инструмент для скашивания травы. В формальных языках такое кодирование недопустимо. Это определяется тем, что естественные языки оперируют контекстом (набором слов) при анализе и классификации информации, а формальные непосредственно словами.

            Количество и графическое отображение символов в алфавитах естественных языков сложилось исторически и характеризуется особенностями языка (произносимыми звуками). Например русский алфавит имеет 33 символа, латинский – 26, китайский несколько тысяч.

            Минимальное количество знаков алфавита  равно единице. Допустим, что алфавит имеет один знак и пусть это будет * (звездочка). Тогда цвета радуги будут кодироваться как: * - красный, ** - оранжевый, *** - желтый, **** - зеленый, ***** - голубой, ****** - синий, ******* - фиолетовый.

2.1. Двоичный алфавит.

            В информатике и вычислительной технике широко используется алфавит, имеющий два знака, например «1» и «0». Этими символами в логике и технике приводят в соответствие понятия «да» и «нет», «есть сигнал» и «нет сигнала», «истина» и «ложь». Такой алфавит называют двоичным или бинарным (binary) в соответствии с этим вводится наименьшая единица информации бит (bit).

            Одного бита информации достаточно для кодирования текущего состояния объекта, имеющего два статических состояния, например лампочки «0» - выключено, «1» - включено. То есть одноклавишный выключатель является носителем одного бита информации, которого нам достаточно для определения состояния лампочки.

            В реальной жизни крайне редко встречаются объекты состояние которых можно закодировать одним битом информации и нет объектов, которые можно описать одним битом. Для кодирования от трех до четырех состояний или признаков объекта требуется уже два бита информации. Для кодирования от четырех до девяти состояний объекта уже требуется три бита. 9-16 состояний 4 бита, 17-32 состояний 5 бит. В общем случае количество бит, необходимых для кодирования N состояний или диапазона значений свойств объектов или явлений определяется по формуле 1:

(1)

            где

N – количество состояний или диапазон значений свойств объектов,

q – количество бит информации необходимых для кодирования требуемого количества состояний или диапазона свойств объектов.

            Было принято, что следующей базовой единицей информации будет являться байт – это последовательность бит длина которой равна 8 битам. Одним байтом можно закодировать от 1 до 256 различных объектов, например символов.

            На практике используются более объемные единицы измерения информации, приведенные в таблице 1.

Таблица 1.

1 байт

=8 бит

1 слово

=2 байта = 16 бит

1 двойное с слово

=2 слова = 4 байта=32 бита

1 килобайт (Кб)

=1024 байт

1 мегабайт (Мб)

=1024 килобайт = 

1 гигабайт (Гб)

=1024 мегабайт =

1 терабайт (Тб)

=1024 гигабайт =