XML (Extensible Markup Language) – це мова розмітки, що описує цілий клас об'єктів даних, називаних XML-документами. Вона використовується як засіб для опису граматики інших мов і контролю за правильністю складання документів. Тобто сама по собі XML не містить ніяких тегів, призначених для розмітки, а визначає порядок їхнього створення.
Тезаурусні моделі засновані на принципі організації словників, містять визначені мовні конструкції та принципи їхньої взаємодії у заданій граматиці. Ці моделі ефективно використовуються в системах-перекладачах, особливо багатомовних. Принцип збереження інформації у даних системах підкоряється тезаурусним моделям.
Дескрипторні моделі – найпростіші з документальних моделей, вони широко використовувалися на ранніх стадіях використання документальних БД. У цих моделях кожному документу відповідав дескриптор – описувач. Цей дескриптор мав тверду структуру й описував документ відповідно до тих характеристик, що вимагалися для роботи з документами з розроблювальної документальної БД. Наприклад, для БД, що містить опис патентів, дескриптор містив назву області, до якого відносився патент, номер патенту, його дату видачі і ще ряд ключових параметрів, що заповнювалися для кожного патенту. Обробка інформації в таких БД велася винятково за дескрипторам, тобто за тими параметрами, що характеризували патент, а не за самим текстом патенту.
1.3. Реляційна модель даних
Поява теоретико-множинних моделей у системах БД була визначена постійною потребою користувачів у переході від роботи з елементами даних, як це робиться в графових моделях, до роботи з деякими макрооб'єктами. Основною моделлю в цьому класі є реляційна модель даних. Простота й наочність моделі для користувачів-непрограмістів, з одного боку, та серйозне теоретичне обґрунтування, з іншого, визначили велику популярність цієї моделі. Крім того, розвиток формального апарата представлення та маніпулювання даними в рамках реляційної моделі зробили її найбільш перспективною для використання у системах представлення знань, що забезпечує якісно інший підхід до обробки даних у великих інформаційних системах [1,5,6,7].
Теоретичною основою цієї моделі стала теорія відношень, основу якої заклали американець Чарльз Содерс Пірс (1839 – 1914) і німець Эрнст Шредер (1841 – 1902). У посібниках з теорії відношень було показано, що безліч відношень замкнуті щодо деяких спеціальних операцій, тобто утворюють разом з цими операціями абстрактну алгебру. Ця найважливіша властивість відношень була використана в реляційній моделі для розробки мови маніпулювання даними, пов'язаної з вихідною алгеброю. Американський математик Э.Ф. Кодд у 1970 році вперше сформулював основні поняття й обмеження реляційної моделі, обмеживши набір операцій у ній сімома основними й однією додатковою операцією. Пропозиції Кодда були настільки ефективними для систем БД, що за цю модель він був визнаний гідним престижної премії Тьюринга у галузі теоретичних основ обчислювальної техніки.
Основною структурою даних у моделі є відношення, саме тому модель одержала назву реляційнної (англ. relation – відношення) [1].
N-ним відношенням R називається підмножина декартового добутку D1×D2×…×Dn () множин D1, D2, …, Dn (), необов'язково різних. Вихідні множини D1, D2, …, Dn називають у моделі доменами.
Відношення R можна записати таким чином:
де D1,× D2 × ...×Dn – повний декартовий добуток.
Повний декартовий добуток – це набір усіляких сполучень з n елементів кожен, де кожний елемент береться зі свого домена. Наприклад, маємо три домена: D1 містить три прізвища; D2 – набір із двох навчальних дисциплін і D3 – набір із трьох оцінок. Припустимо, що вміст доменів наступний:
D1 = {Іванов, Крилов, Степанов};
D2 = {ТАУ, БД і БЗ};
D3 = {3, 4, 5}.
Тоді повний декартовий добуток містить набір з 18 трійок, де перший елемент – це одне з прізвищ, другий – це назва однієї з навчальних дисциплін, а третій – одна з оцінок:
<Іванов. ТАУ. 3>: <Іванов. ТАУ. 4>: <Іванов. ТАУ. 5>
<Крилов. ТАУ. 3>: <Крилов. ТАУ. 4>: <Крилов. ТАУ. 5>
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.