Распределенные базы данных
Основная тенденция развития информационных систем - переход от централизованных систем к распределенным. Подготовлен развитием мини-ЭВМ. Различают системы распределенных баз данных (когда база данных физически распределена между несколькими компьютерами) и системы распределенной обработки данных (функции распределены между несколькими компьютерами в сети , но база данных централизована).
Мы будем рассматривать системы распределенных баз данных.
Архитектура распределенной БД
Программное обеспечение систем управления распределенными базами данных обычно имеет многоуровневую архитектуру. В такой архитектуре существует пять уровней:
1) пользовательский
2) глобальный логический
3) фрагментный
4) распределенный
5) локальный
Каждый из этих уровней поддерживает различные представления базы данных.
Пользовательский уровень - пользователь имеет доступ к определенному подмножеству глобального логического представления данных, это подмножество и определяет его представление о данных.
Глобальный логический - соответствует структуре всей сетевой базы данных, так как она представляется с точки зрения администратора базы данных. Этот уровень подобен концептуальному уровню представления в концепции ANSI.
Существование третьего и четвертого уровней представления объясняется распределенной природой базы данных и решением использовать управляемую избыточность.
Фрагментное представление - определяет несвязанное подмножество базы данных, называемое логическими фрагментами, каждый из которых является подмножеством строк в таблице.
Распределенное представление определяет географическое расположение экземпляра каждого фрагмента. В этом представлении разрешается существование нескольких копий одного фрагмента. Хранимые фрагменты являются физической реализацией логических фрагментов.
Локальное представление - это представление части базы данных, существующей в конкретном узле. Оно описывает часть базы данных доступной локальной СУБД. Локальная СУБД в свою очередь имеет несколько уровней представления данных.
Пример.
1. Глобальный логический уровень представления.
Таблица Служащие
таб N Имя N завода тариф
100 101 102 103 104 105 |
Билл Джим Майк Хаутан Дон Стив |
1 1 2 2 3 3 |
6.00 6.00 10.00 12.00 2.90 3.00 |
Таблица |
Заводы |
N завода Название
1 Анн-Арбор
2 Детройт
3 Нью-Йорк
Таблица Сырье
N зав Элемент кол-во
1 глина 500
1 гипс 100
2 уголь 940
3 глина 50
2. Пользовательский уровень представления.
Служащие
104 Дон 3 2.90
105 Стив 3 3.00
Таблица Заводы
N завода Название
1 Анн-Арбор
2 Детройт
3 Нью-Йорк
3. Фрагментный уровень представления
Таблица Служащие
таб N Имя N завода тариф
100 101 |
Билл Джим |
1 1 |
6.00 6.00 |
фрагмент |
1 |
102 103 |
Майк Хаутан |
2 2 |
10.00 12.00 |
фрагмент |
2 |
104 105 |
Дон Стив |
3 3 |
2.90 3.00 |
фрагмент |
3 |
Таблица Заводы
N завода Название
1 Анн-Арбор |
2 Детройт | фрагмент а
3 Нью-Йорк |
Таблица Сырье
N зав Элемент кол-во
1 глина 500 | фрагмент а
1 гипс 100 |
2 уголь 940 | фрагмент в
3 глина 50 | фрагмент с
4. Распределенный уровень представления
таблица фрагмент расположение
служащие 1 1
2 1,2
3 1,3
завод а 1,2,3
сырье а 1
в 2
с 3
5. Локальный уровень представления на заводе 3
Служащие
таб N Имя N завода тариф
104 Дон 3 2.90 | фрагмент 3
105 Стив 3 3.00 |
Таблица Заводы
N завода Название
1 Анн-Арбор |
2 Детройт | фрагмент а
3 Нью-Йорк |
Таблица Сырье
N зав Элемент кол-во
3 глина 50 | фрагмент с
Особенности реализаций стратегий распределения данных определяются обычно в процессе проектирования данных. Рассмотрим четыре альтернативные стратегии распределения данных:
1. Централизованная ( единственная копия базы данных, расположенная в одном узле).
Достоинства: простота
Недостатки:
- т.к. вся база в одном узле, отсюда ограничение на рост размера БД.
- ограниченная доступность: все запросы обращаются к одному узлу, отсюда перегрузка сети, ограничения на скорость обработки
- ограниченная надежность: при выходе из строя центрального узла, вся система выходит из строя.
Любая из трех других стратегий преодолевает эти недостатки, но ценой определенных затрат.
2. Сегментация (единственная копия базы данных, непересекающиеся подмножества распределены по различным узлам сети). Существование копий не допускается.
Достоинства:
- при выходе из строя какого-либо узла система все же остается частично работоспособной
- большая часть запросов будет идти к своим локальным частям, это снизит стоимость связи
- время отклика может быть меньше по ср с централизованной БД, если система использует возможный паралеллизм.
Недостатки:
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.