Моделирование данных и XML

Страницы работы

153 страницы (Word-файл)

Фрагмент текста работы

Разумеется, любое использование в информации XML этих частных символов требует согласования их интерпретации, так что лучше избегать их в объектах данных XML. предназначенных для широкого распространения.

Имена

Структуры в языке XML почти всегда имеют имена. В языке XML все имена должны начинаться с буквы, символа нижнего подчеркивания (_) или двоеточия (:) и продолжаться только допустимыми для имен символами. К числу последних относятся все названные символы, а также цифры, знак дефиса (-) или точки (.). На практике знак двоеточия следует применять только в качестве ограничителя пространства имен. Важно помнить, что буквы не ограничены исключительно символами ASCII, так что не англо-говорящие пользователи могут применять для разметки слова из своих языков.

Помимо указанных ограничений, следует отметить, что имена не могут начинаться со строк "xml", "XML" и любой другой комбинации этих заглавных и строчных символов в указанном порядке (например, "xML" или "Xml"). Имена, начинающиеся с этих символов, зарезервированы для использования консорциумом W3C.

Части документа

Правильно оформленный документ XML состоит из трех частей

• Необязательный пролог

• Тело документа, состоящее из одного или больше элементов, имеющее форму иерархического дерева, которое может также содержать символьные данные (character data).

• Необязательный эпилог с дополнительной информацией, состоящей из комментариев, команд обработки (processing instruction, PI), а также пустого пространства, следующего за деревом элементов.

Поскольку для того чтобы объекты данных были правильно оформленными документами XML, они не обязаны содержать пролог и эпилог, поэтому сначала мы рассмотрим наиболее важную среднюю часть документа — элементы и символьные данные.

Элементы

Элементы — это основные строительные блоки разметки XML. Они могут содержать другие элементы, символьные данные, ссылки на символы, ссылки на объекты, команды PI, комментарии и/или разделы CDATA — все вместе это называется содержанием элемента (element content). Все данные XML, кроме комментариев, команд обработки и пустого пространства, должны содержаться внутри элементов.

Элементы отделяются друг от друга с помощью тегов, состоящих из имени типа элемента (строковая константа), заключенного в пару угловых скобок ("< >"). Для каждого элемента необходимо указать открывающий и закрывающий тег (в отличие от HTML, закрывающий тег нельзя опускать). Единственным исключением из этого правила является элемент без содержания, который можно представить с помощью либо пары открывающий тег/закрывающий тег, либо в сокращенной гибридной форме так называемого тега пустого элемента.

Элемент является контейнером XML для содержания — он может включать символьные данные, другие элементы и/или другую разметку (комментарии, команды обработки, ссылки на объекты и т.д.). Поскольку элементы представляют собой дискретные объекты, их можно считать существительными в языке XML.

Рассмотрим теперь теги более подробно.

Открывающие теги

Ограничитель, стоящий в начале элемента, называется открывающим тегом (start-tag). Открывающий тег состоит из имени типа элемента, заключенного в угловые скобки. Его можно считать началом элемента, приблизительно так же, как при открытии файла или звена коммуникации.

Далее приводятся примеры допустимых открывающих тегов:

<Book>

<Author>

Закрывающие теги

Ограничитель, стоящий в конце элемента, называется закрывающим тегом (end-tag). Закрывающий тег состоит из косой черты (/), за которой следует

Информация о работе