Программные средства разработки Web-страниц и презентаций: Методические указания по выполнению лабораторных работ, страница 2

Любой ресурс WWW может быть указан с помощью универсального идентификатора – URL (Uniform Resource Locator). В общем виде URL выглядит следующим образом:

метод://сервер:порт/путь/файл#метка

URL определяет:

- протокол доступа к документу,

- имя и адрес сервера, содержащего этот web-документ,

- местоположение документа в общей структуре web-сервера.

В настоящее время действующей является спецификация HTML 4.01 (ISO/IEC 15445:2000), которая, в строгой версии, не содержит ряд элементов, помеченных как «устаревшие» или «не одобряемые». Данная спецификация близка к XHTML (Extensible Hypertext Markup Language) – расширяемому языку разметки гипертекста. XHTML по возможностям сопоставим с HTML, но предъявляет более строгие требования к синтаксису, поскольку соответствует синтаксическим правилам XML.

XML – это обобщенный язык разметки. В отличие от HTML, XML позволяет создавать собственные теги и таким образом формировать произвольные структуры документов и данных. Общий характер XML позволяет рассматривать HTML-документы как XML-документы с ограниченным набором тегов для отображения в web-браузерах. Однако старые стандарты HTML не до конца совместимы с XML в части синтаксиса. Чтобы устранить разрыв между этими двумя языками разметки и был разработан XHTML. По существу, это обычный HTML, в который добавлены синтаксические правила XML для создания «правильно сформированных» (well-formed) документов.

Стандарт XHTML построен не как самодостаточное описание языка, а как перечень различий между HTML 4.01 и XHTML. На практике, в HTML надо добавить несколько правил, чтобы получился XHTML. Основные из них – следующие:

1.  Все теги должны быть записаны в нижнем регистре, то есть нельзя писать <BODY>, а надо писать <body>.

2.  Все теги должны быть закрыты.

2a. В случае, если элемент непарный, то есть не имеет закрывающего тега (например, <img> или <br>), надо добавлять слеш в конце тега <img /> и <br />.

3.  Вложенность тегов должна быть корректной.

Например, нельзя писать <strong><p>текст</strong> </p>, а надо писать <p><strong>текст</strong></p>. Также недопустимо вложение блочных элементов внутрь элементов уровня текста. Например, блочные элементы <div> или <p> не могут быть вложены внутрь элементов <a>, <span>, <em> и так далее. То есть нельзя писать <strong><p>текст</p></strong>.

4.  Все значения атрибутов должны быть заключены в кавычки.

Например, нельзя писать <p align=center>, а надо писать <p align=”center”>.

Вообще говоря, правила 1, 2 и 4 присутствуют и в HTML, но не являются обязательными. Правило 3 является обязательным, хотя браузеры в большинстве случаев игнорируют ошибки вложенности. Единственное действительно новое правило – это правило 2а. Существуют и другие особенности:

5.  В HTML встречаются параметры, указывающиеся без значения (включают или выключают некоторое свойство). В XHTML такие атрибуты записываются в развёрнутой форме. Например, следует писать <tdnowrap=”nowrap”>.

6.  Обязательное задание альтернативного текста для изображений (атрибут alt).

7.  Документ не должен содержать текст вне какого-либо блочного элемента (то есть не должно быть текста непосредственно в теге <body>, весь текст должен быть заключен в тэги блоков p, div, td и др.).

8.  XHTML гораздо строже относится к ошибкам в коде; < и & везде, даже в URL, должны замещаться &lt; и &amp; соответственно.

9.  Кодировкой по умолчанию является UTF-8 (в отличие от HTML, где кодировкой по умолчанию является ISO 8859-1).

В большинстве браузеры поддерживают старые версии HTML и корректно отображают «неправильные» страницы. Однако современные визуальные редакторы web-страниц поддерживают новые стандарты и генерируют код в соответствии с ними. Как правило, это XHTML переходной версии (Transitional), которая обеспечивает наибольшую совместимость со старыми версиями HTML.