2.1.6. Моделирование данных, методология описания данных: сущность – связь. Реляционная модель данных.
Моделирование данных – анализ и проектирование информации в системе, основываясь на логических сущностях и логических зависимостях между этими сущностями.
На этапе моделирования данных строиться диаграмма «сущность-связь» (Entity Relationships, ERмодель).
ER-модель - это технология нисходящего подхода к разработке объектных моделей данных, которая содержит несколько высокоуровневых сущностей и связей и последующего нисходящего уточнения низкоуровневых сущностей, связей и относящимся к ним атрибутам.
Сущность - реальный либо воображаемый объект, имеющий существенное значение для рассматриваемой предметной области, информация о котором подлежит хранению. В будущем сущность это таблица.
Каждая сущность должна обладать уникальным идентификатором. Каждый экземпляр сущности должен однозначно идентифицироваться. Каждая сущность должна обладать некоторыми свойствами:
• каждая сущность должна иметь уникальное имя;
• сущность обладает одним или несколькими атрибутами, которые либо принадлежат сущности, либо наследуются через связь;
• сущность обладает одним или несколькими атрибутами, которые однозначно идентифицируют каждый экземпляр сущности;
• каждая сущность может обладать любым количеством связей с другими сущностями модели.
Атрибут – это отдельный элемент данных подлежащие хранению, который относятся к определенной сущности.
Каждый атрибут идентифицируется уникальным именем, описывающим представляемую атрибутом характеристику. Атрибуты изображаются в виде списка имен внутри блока ассоциированной сущности, причем каждый атрибут занимает отдельную строку.
Атрибуты бывают:
• Простые (не могут быть разделены на более мелкие компоненты) и сложные (могут быть разделены на более мелкие компоненты);
• Однозначные (атрибут может иметь только одно значение) и многозначные (может иметь несколько значений);
• Обязательные (не может принимать неопределенных значений (null)) и необязательные (может принимать неопределенные значения);
• Описательные (обычная характеристика сущности) и индикационные (являются уникальными индикаторами).
Уникальные идентификаторы (ключи) – это атрибуты, значения которых уникальным образом идентифицируют каждую сущность.
Виды:
• Первичные ключи – атрибут или группа атрибутов , который уникально идентифицирует строку в таблице. Не может иметь нулевых значений.
• Внешние (альтернативные) ключи – не ключевой атрибут сущности, которые является первичным ключом (или частью первичного ключа) в другой сущности. Не может иметь нулевых значений.
• Уникальные ключи – атрибуты, в которых не могут использоваться дублирующие значения. Может иметь нулевое значение.
• Составные ключи – группа атрибутов, в которую входят внешние ключи и хотя бы один первичный ключ или все первичные ключи.
Связь – это ассоциация между сущностями, при которой, каждый экземпляр одной сущности, называемой родительской сущностью, ассоциирован с произвольным (в том числе нулевым) количеством экземпляров второй сущности, называемой сущностью-потомком, а каждый экземпляр сущности-потомка ассоциирован в точности с одним экземпляром сущности-родителя.
Связи между сущностями обычно организуют с помощью атрибута, общего для обеих сущностей. Этот общий атрибут обычно является первичным ключом родительской сущности и внешним ключом сущности-потомка. Правила ссылочной целосности требуют, чтобы значения внешнего ключа одной сущности-потомка ссылались на значения первичного ключа другой родительской сущности.
Важной характеристикой связи является ее мощность, которая обозначает максимальное количество экземпляров одной сущности, связанных с одним экземпляром другой сущности.
Виды:
• «один к одному» (1:1) если максимальная мощность связи в обоих направлениях равна одному;
• «один ко многим» (1:М) если максимальная мощность связи в одном направлении равна одному, а в другом - многим;
• «многие ко многим» (М:М) если максимальная мощность связи в обоих направлениях равна многим;
На этапе физической реализации используется реляционная модель данных и её свойства. В реляционной модели БД обращение к данным происходит таким образом, как будто они сохранены в двумерных таблицах. Эти таблицы называются отношениями. Модель двумерной таблицы позволяет обращаться к данным как к строкам и столбцам таблицы. Реальное физическое местоположение данных не влияет на способ обращения к данным.
Реляционные отношения должны удовлетворять следующим требованиям:
1. Таблицы состоят из строк и столбцов. Строки и столбцы должны быть простой структуры (не иметь подстрок).
2. Каждый столбец должен быть уникальным и иметь уникальное имя.
3. Порядок столбцов должен быть строго установлен.
4. Таблицы состоят из любого количества строк, которые находятся в динамическом состоянии.
5. Каждая строка представляет собой набор из некоторого количества значений.
6. Строки могут обрабатываться в любом порядке.
7. Строки таблицы должны отличаться хотя бы 1 значением.
8. Строки необходимо выбирать из таблицы по некоторому признаку.
Реляционные БД обычно проектируются с использованием правил нормализации. Принцип нормализации – представление предметной области в виде реляционных отношений путем разбиения всей предметной области на объекты или на простые отношения.
1) 1НФ = все атрибуты представляют собой простые значения, т.е. среди значений нет списков.
2) 2НФ = 1НФ + каждый неключевой атрибут функционально полно зависит от ключа.
3) 3НФ = 2НФ + отношение не содержит транзитивных зависимостей (неключевые атрибуты не зависят друг от друга)
4) 4НФ = 3НФ + между реквизитами отношения нет многозначной зависимости
5) 5НФ = 4НФ + требует разбиение таблицы на наименьшие возможные фрагменты
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.