Физическое представление данных

Страницы работы

Содержание работы

Тема 6 :Физическое представлене данных.

6.1 Общие положения

Современные СУБД обладают высоким быстродействием поиска информации. Базы данных, имеющие мощность (т.е. количество записей) до ≈ 106  дают скорость только ≈ 2 сек. за счет чего, это быстродействие реализуется .В настоящее время существует 2 пути:

1.  Использование языка SQL – для реализации запросов

SQL является реляционным языком, использующим элементы реляционной алгебры и реляционного исчисления кортежей.

В реляционных системах запросов существует возможность выбора эффективной стратегии для вычисления реляционного выражения с помощью которого сформирован запрос.

Этот процесс – выбор эффективной стратегии вычислений выполняет оптимизатор. Он позволяет в отдельных случаях, сократить количество операций, которые необходимо произвести для организации поиска на 4 порядка т.е. в 10 000 раз. То есть мы имеем редкое увеличения скорости 104  раза., т.е. поиск старым оператором языка и SQL выиграл в 104  раза. Изучая обработку данных с помощью ЭВМ мы постепенно обращаемся к трем выделенным областям:

1.  реальному миру;

2.  информации;

3.  данным.

Между этими тремя областями существуют определенные взаимосвязи. Тема рассматриваемая сегодня имеет отношение к 3 – й области – к области данных.

А область данных, как вы помните состоит из 3-х компонент:

               3.1. Общая логическая структура данных (или данные в представлении администратора данных);

              3.2.   Данные в представлении программиста;

              3.3.Представление данных в памяти ЭВМ.

Т.е. логическая структура данных и представление этой структуры в памяти ЭВМ это два важных, но различных между собой понятия.

Логические структуры данных это:

·  реляционные;

·  древовидные;

·  сетевые структуры.

Что касается представления данных в памяти, то существует два метода :

Первый метод заключается в том, что каждому элементу данных указывается адрес памяти ЭВМ. Размещение данных (т.е. их запоминание) и их выборка осуществляется по известному адресу.

Второй метод заключается в том, что содержание ключа конкретной записи преобразуется определенным методом (существует несколько методов) в адрес памяти ЭВМ. В этом случае размещение данных и их выборка осуществляются по известному значению ключа, т.е. определяются по содержимым самих данных. Этот случай хорошо реализуется в ассоциативной памяти ЭВМ или с помощью специального программного обеспечения в обычной памяти ЭВМ.

Для первого и второго метода существует общая проблема – как эффективно отобразить логическую структуру данных на физическую структуру хранения.

Т.е. речь идет о нахождении адресной функции, которая позволяла бы быстро вычислять где хранятся необходимые данные.

6.2. 1 –й метод представления данных в памяти ЭВМ.

6.2.1. Последовательное распределение памяти.  

Пусть у нас есть определенный тип записи с экземпляром записей У1, У2,…, Уп.

Будем считать, что запись, состоящая из элементов данных, хранится целиком и разделение на атрибуты или элементы данных происходит после выборки записи.

Такую структуру можно определить как линейное упорядочение записей, т.е. номера записей следуют один за другим или линейный список.

В такой структуре каждая запись идентифицирована своим порядковым номером. Обозначим через:

N – количество записей в списке

m- размер записей в байтах

β – адрес базы, указывающий на начало вектора данных в памяти

i – текущая запись в списке

α – адрес физической памяти.

В этом случае адрес каждой записи можно вычислить с помощью адресной функции, отображающий логический индекс, идентифицирующий адрес в структуре, в адрес физической памяти.

Похожие материалы

Информация о работе