Моделирование данных, методология описания данных: сущность – связь. Реляционная модель данных

Страницы работы

3 страницы (Word-файл)

Содержание работы

2.1.6. Моделирование данных, методология описания данных: сущность – связь. Реляционная модель данных.

Моделирование данных – анализ и проектирование информации в системе, основываясь на логических сущностях и логических зависимостях между этими сущностями.

На этапе моделирования данных строиться диаграмма «сущность-связь» (Entity Relationships, ERмодель).

ER-модель - это технология нисходящего подхода к разработке объектных моделей данных, которая содержит несколько высокоуровневых сущностей и связей и последующего нисходящего уточнения низкоуровневых сущностей, связей и относящимся к ним атрибутам.

Сущность - реальный либо воображаемый объект, имеющий существенное значение для рассматриваемой предметной области, информация о котором подлежит хранению. В будущем сущность это таблица.

Каждая сущность должна обладать уникальным идентификатором. Каждый экземпляр сущности должен однозначно идентифицироваться. Каждая сущность должна обладать некоторыми свойствами: 

•  каждая сущность должна иметь уникальное имя; 

•  сущность обладает одним или несколькими атрибутами, которые либо принадлежат сущности, либо наследуются через связь; 

•  сущность обладает одним или несколькими атрибутами, которые однозначно идентифицируют каждый экземпляр сущности; 

•  каждая сущность может обладать любым количеством связей с другими сущностями модели.

Атрибут – это отдельный элемент данных подлежащие хранению, который относятся к определенной сущности.

Каждый атрибут идентифицируется уникальным именем,  описывающим представляемую атрибутом характеристику. Атрибуты изображаются в виде списка имен внутри блока ассоциированной сущности, причем каждый атрибут занимает отдельную строку. 

Атрибуты бывают:

•  Простые (не могут быть разделены на более мелкие компоненты) и сложные (могут быть разделены на более мелкие компоненты);

•  Однозначные (атрибут может иметь только одно значение) и многозначные (может иметь несколько значений);

•  Обязательные (не может принимать неопределенных значений (null)) и необязательные (может принимать неопределенные значения);

•  Описательные (обычная характеристика сущности) и индикационные (являются уникальными индикаторами).

Уникальные идентификаторы (ключи) – это атрибуты, значения которых уникальным образом идентифицируют каждую сущность. 

Виды:

•  Первичные ключи – атрибут или группа атрибутов , который уникально идентифицирует строку в таблице. Не может иметь нулевых значений. 

•  Внешние (альтернативные) ключи – не ключевой атрибут сущности, которые является первичным ключом (или частью первичного ключа) в другой сущности. Не может иметь нулевых значений.

•  Уникальные ключи – атрибуты, в которых не могут использоваться дублирующие значения. Может иметь нулевое значение.

•  Составные ключи – группа атрибутов, в которую входят внешние ключи и хотя бы один первичный ключ или все первичные ключи.

Связь – это ассоциация между сущностями, при которой, каждый экземпляр одной сущности, называемой родительской сущностью, ассоциирован с произвольным (в том числе нулевым) количеством экземпляров второй сущности, называемой сущностью-потомком, а каждый экземпляр сущности-потомка ассоциирован в точности с одним экземпляром сущности-родителя.

Связи между сущностями обычно организуют с помощью атрибута, общего для обеих сущностей. Этот общий атрибут обычно является первичным ключом родительской сущности и внешним ключом сущности-потомка. Правила ссылочной целосности требуют, чтобы значения внешнего ключа одной сущности-потомка ссылались на значения первичного ключа другой родительской сущности.

Важной характеристикой связи является ее мощность, которая обозначает максимальное количество экземпляров одной сущности, связанных с одним экземпляром другой сущности. 

Виды:

•  «один к одному» (1:1) если максимальная мощность связи в обоих направлениях равна одному;

•  «один ко многим» (1:М) если максимальная мощность связи в одном направлении равна одному, а в другом - многим;

•  «многие ко многим» (М:М) если максимальная мощность связи в обоих направлениях равна многим;

На этапе физической реализации используется реляционная модель данных и её свойства. В реляционной модели БД обращение к данным происходит таким образом, как будто они сохранены в двумерных таблицах. Эти таблицы называются отношениями. Модель двумерной таблицы позволяет обращаться к данным как к строкам и столбцам таблицы. Реальное физическое местоположение данных не влияет на способ обращения к данным.

Реляционные отношения должны удовлетворять следующим требованиям: 

1.  Таблицы состоят из строк и столбцов. Строки и столбцы должны быть простой структуры (не иметь подстрок).

2.  Каждый столбец должен быть уникальным и иметь уникальное имя.

3.  Порядок столбцов должен быть строго установлен.

4.  Таблицы состоят из любого количества строк, которые находятся в динамическом состоянии.

5.  Каждая строка представляет собой набор из некоторого количества значений.

6.  Строки могут обрабатываться в любом порядке.

7.  Строки таблицы должны отличаться хотя бы 1 значением.

8.  Строки необходимо выбирать из таблицы по некоторому признаку.

Реляционные БД обычно проектируются с использованием правил нормализации. Принцип нормализации – представление предметной области в виде реляционных отношений путем разбиения всей предметной области на объекты или на простые отношения.

1)  1НФ = все атрибуты представляют собой простые значения, т.е. среди значений нет списков.

2)  2НФ = 1НФ + каждый неключевой атрибут функционально полно зависит от ключа.

3)  3НФ = 2НФ + отношение не содержит транзитивных зависимостей (неключевые атрибуты не зависят друг от друга)

4)  4НФ = 3НФ + между реквизитами отношения нет многозначной зависимости

5)  5НФ = 4НФ + требует разбиение таблицы на наименьшие возможные фрагменты

Похожие материалы

Информация о работе