Информатика и выч. техника \ Базы данных (Управление данными)

Физическое представление данных

Страницы работы

16 страниц (Word-файл)

Посмотреть все страницы

Скачать файл

Содержание работы

Тема 6 :Физическое представлене данных.

6.1 Общие положения

Современные СУБД обладают высоким быстродействием поиска информации. Базы данных, имеющие мощность (т.е. количество записей) до ≈ 10⁶ дают скорость только ≈ 2 сек. за счет чего, это быстродействие реализуется .В настоящее время существует 2 пути:

1. Использование языка SQL – для реализации запросов

SQL является реляционным языком, использующим элементы реляционной алгебры и реляционного исчисления кортежей.

В реляционных системах запросов существует возможность выбора эффективной стратегии для вычисления реляционного выражения с помощью которого сформирован запрос.

Этот процесс – выбор эффективной стратегии вычислений выполняет оптимизатор. Он позволяет в отдельных случаях, сократить количество операций, которые необходимо произвести для организации поиска на 4 порядка т.е. в 10 000 раз. То есть мы имеем редкое увеличения скорости 10⁴ раза., т.е. поиск старым оператором языка и SQL выиграл в 10⁴ раза. Изучая обработку данных с помощью ЭВМ мы постепенно обращаемся к трем выделенным областям:

1. реальному миру;

2. информации;

3. данным.

Между этими тремя областями существуют определенные взаимосвязи. Тема рассматриваемая сегодня имеет отношение к 3 – й области – к области данных.

А область данных, как вы помните состоит из 3-х компонент:

3.1. Общая логическая структура данных (или данные в представлении администратора данных);

3.2. Данные в представлении программиста;

3.3.Представление данных в памяти ЭВМ.

Т.е. логическая структура данных и представление этой структуры в памяти ЭВМ это два важных, но различных между собой понятия.

Логические структуры данных это:

· реляционные;

· древовидные;

· сетевые структуры.

Что касается представления данных в памяти, то существует два метода :

Первый метод заключается в том, что каждому элементу данных указывается адрес памяти ЭВМ. Размещение данных (т.е. их запоминание) и их выборка осуществляется по известному адресу.

Второй метод заключается в том, что содержание ключа конкретной записи преобразуется определенным методом (существует несколько методов) в адрес памяти ЭВМ. В этом случае размещение данных и их выборка осуществляются по известному значению ключа, т.е. определяются по содержимым самих данных. Этот случай хорошо реализуется в ассоциативной памяти ЭВМ или с помощью специального программного обеспечения в обычной памяти ЭВМ.

Для первого и второго метода существует общая проблема – как эффективно отобразить логическую структуру данных на физическую структуру хранения.

Т.е. речь идет о нахождении адресной функции, которая позволяла бы быстро вычислять где хранятся необходимые данные.

6.2. 1 –й метод представления данных в памяти ЭВМ.

6.2.1. Последовательное распределение памяти.

Пусть у нас есть определенный тип записи с экземпляром записей У1, У2,…, Уп.

Будем считать, что запись, состоящая из элементов данных, хранится целиком и разделение на атрибуты или элементы данных происходит после выборки записи.

Такую структуру можно определить как линейное упорядочение записей, т.е. номера записей следуют один за другим или линейный список.

В такой структуре каждая запись идентифицирована своим порядковым номером. Обозначим через:

N – количество записей в списке

m- размер записей в байтах

β – адрес базы, указывающий на начало вектора данных в памяти

i – текущая запись в списке

α – адрес физической памяти.

В этом случае адрес каждой записи можно вычислить с помощью адресной функции, отображающий логический индекс, идентифицирующий адрес в структуре, в адрес физической памяти.