Ответы на экзаменационные вопросы № 1-25 по дисциплине "Информационные системы" (Недостаточность файловых систем для инф.технологий. Представления реляционных баз данных), страница 6

12.Необходимость проведения нормализации отношений. Процедура проведения нормализации отношений.

База данных может обладать рядом недостатков, связанных, в основном, с избыточностью хранения информации. Существует ряд формальных правил, которым должна соответствовать схема базы данных для того, чтобы быть свободной от подобных недостатков. Эти правила связаны с так называемыми нормальными формами отношений, а процесс приведения схемы базы данных к ситуации, когда она подчиняется этим правилам, называется нормализацией отношений.

Понятие нормальной формы Под нормальной формой можно понимать некоторый набор ограничений, которым соответствует схема отношения, если оно находится в данной нормальной форме. Перефразируя, можно сказать, что отношение находится в некоторой нормальной форме, если оно удовлетворяет свойственному данной форме набору ограничений. Примером набора ограничений, например, является ограничение первой нормальной формы, которое состоит в том, что значения всех атрибутов отношения должны быть атомарными. В теории реляционных баз данных обычно выделяется следующая последовательность нормальных форм: •первая нормальная форма (1NF); •вторая нормальная форма (2NF); •третья нормальная форма (3NF); •нормальная форма Бойса-Кодда (BCNF);

•четвертая нормальная форма (4NF); •пятая нормальная форма (5NF). При переходе отношения в следующую нормальную форму, оно приобретает некоторые лучшие свойства, при этом свойства предыдущих нормальных форм для этого отношения сохраняются. Процесс нормализации отношения состоит в последовательном разбиении (декомпозиции) отношения, находящегося в предыдущей нормальной форме, на два или более отношения, удовлетворяющих требованиям следующей нормальной формы и обладающих лучшими свойствами при включении, изменении и удалении данных.

Окончательная цель нормализации сводится к получению такого проекта базы данных, в котором каждый факт появляется лишь в одном месте, т.е. исключена избыточность информации. Нормализация отношений базы данных позволяет устранить дублирование, уменьшает затраты на ввод и корректировку данных, и, самое главное, обеспечивает непротиворечивость хранимых данных.

Нормальные формы.

Процесс проектирования базы данных с использованием метода нормальных форм является итерационным и заключается в последовательном переводе отношений из первой нормальной формы в нормальные формы более высокого порядка по определенным правилам. Каждая следующая нормальная форма ограничивает определенный тип функциональных зависимостей и сохраняет свойства предшествующих нормальных форм.

Первая нормальная форма. Отношение находится в первой нормальной форме, если все его атрибуты являются простыми. Исходное отношение строится таким образом, чтобы оно было в первой нормальной форме. Перевод отношения в следующую нормальную форму осуществляется методом декомпозиции без потерь. Такая декомпозиция должна обеспечить то, что запросы (выборка данных по условию) к исходному отношению и к отношениям получаемым в результате декомпозиции дадут одинаковый результат. Основной операцией метода является операция проекции. Пусть дано отношение R(A, B, C, D, E…) имеется функциональная зависимость С -> D, тогда получается два отношения  R1(A, B, C, E…) и R2(C, D). Отношение R2 является проекцией отношения R на атрибуты С и D. Устраненные функциональной зависимости позволяет перевести отношение в следующую нормальную форму. Исходное отношение ПРЕПОДАВАТЕЛЬ находится в первой нормальной форме, так как все его атрибуты простые и имеет составной ключ ФИО, ПРЕДМЕТ, ГРУППА. Ранее были выделены функциональные зависимости. Мы определили частичную зависимость атрибутов: ДОЛЖНОСТЬ, ОКДАД, СТАЖ, ДСТАЖ, КАФЕДРА от ключа. Эта частичная зависимость приводит следующему: в отношении присутствует явное и неявное избыточное дублирование данных: а) повторение сведений о СТАЖЕ, ДОЛЖНОСТИ, ОКДАДЕ и так далее преподавателей проводящих занятия в нескольких группах или по разным предметам; повторение сведений об окладе для одной и той же должности или о надбавках за стаж. Следствием избыточного дублирования данных является проблема их редактирования. Часть избыточности устраняется при переводе отношения во вторую нормальную форму.