Абстракция через спецификацию подразумевает отвлечение от внутренней структуры объекта до известных внешних свойств и условий их проявления. При этом определяются требования, предъявляемые к внешним свойствам и ограничения, накладываемые на них.
агрегатирование – объединение компонентов в некоторые группы, выступающие как единое целое каких-либо процессов функционирования.
Физический уровень процесса извлечения информации подразумевает использование состава программно-аппаратных средств и формы представления данных, получаемых в результате процесса извлечения информации. В качестве аппаратных средств используются в процессе ввода различные датчики, сканеры, средства преобразования сигналов, различные платы расширения, позволяющие соединять вычислительную машину с периферийными устройствами ввода. Непосредственно устройство ввода – алфавитно-цифровая клавиатура, графические манипуляторы. Программные средства, используемые в этом процессе представляют из себя различные приложения, позволяющие производить интерпретацию графической или звуковой информации в текстовый вид.
Формы представления данных различного типа. Форматы файлов.
Конечным этапом процесса извлечения является представление информации в форме, позволяющей машинную обработку. В зависимости от типа рассматриваемой информации, информация может быть представлена в виде текстовых файлов, файлов графических данных, звуковых файлов и других. Текстовый файл представляет собой последовательность символов, закодированных в виде 8-разрядных двоичных чисел (ASCI) или последовательность 16-разрядных чисел (UNICODE).
Эта кодировка позволяет охватить особенности всех используемых шрифтов. Использование UNICODE приводит к увеличению объема хранимой и передаваемой информации. Следовательно, поэтому для ускорения передачи данных часто используют 8-разрядную кодировку.
Кроме кодировки символов текстовые файлы могут содержать дополнительную информацию, определяющую метод форматирования текста (масштаб символов, цвет,…). В последнее время широкое распространение получает формат HTML или XML, в которых особенности форматирования текста и некоторые специальные действия в тексте задаются с помощью разметочных символов – тегов.
HTML.
html – язык разметки документов.
Стандарт html применяется как в документах, используемых для отображения информации в сетевых технологиях, так и в документах, используемых как стандарт хранения данных. В последнее время стандарт (документ) xml, являющийся развитием стандарта html, используется как стандарт обмена информацией в различных информационных системах.
Язык html подразумевает использование трех составляющих:
- непосредственно сам html – язык логической структуры документа.
- язык каскадных стилей css – выдает способ отображения документа, цвет текста, фона, шрифты, способы выравнивания и позиционирования.
- языки программирования сценариев, используемые для выполнения специальных действий в процессе отображения документа (Java script)
Согласно html, любой документ состоит из элементов, т.е. частей, обладающих определенными особыми свойствами. Отдельный элемент – тег. Он имеет следующий формат:
<тег атрибута = значение атрибутов>
содержимое элемента
</тег>
По последней спецификации тег пишется с большой буквы, также как и название атрибутов. Значение атрибутов заключается в “ ”.
Атрибуты элементов определяют характеристику данного элемента. Возможны следующие 3 типа атрибутов:
- CDATA – образуется из последовательности символов, образующих значение данного типа, включает возможные специальные символы. Обычно этот тип различает регистр.
- ID, NAME (идентификаторы, имена) – значение данного типа начинается с латинской буквы; могут содержать латинские буквы и цифры. Значения данного типа используются для имен обозначения каких-либо элементов (объектов).
- IDREF, IDREFS – данный тип подразумевает идентификаторы ранее определенные в виде типов ID и NAME. IDREF – единичный идентификатор, IDREFS - идентификаторы, написанные через пробел.
- численный тип, текстовый тип – аналог CDATA, подразумевает содержательную последовательность.
- ссылочный тип (URI) – значение данного типа указывает на используемые ресурсы.
- цвет – данные этого типа указывают на значение какого-либо цвета – предопределены константы, соответствующие цветам; может быть задан в виде числового значения.
Основные атрибуты тегов.
1. базовые атрибуты(id, class, style, title)
Id присваивает элементу определенное имя – идентификатор. Может использоваться в качестве закладки для гиперссылки; с его помощью можно задавать селектор стиля, т.е. задавать стиль для конкретного элемента; можно указать конкретный элемент сценария.
Class указывает на то, что элемент является членом какого-то класса. Отнесение элемента к определенному классу позволяет применять параметры отображения, заданные в соответствующем классе.
В пределах одного документа не может быть двух элементов с одинаковыми значениями атрибутов id и name.
Style позволяет задать параметры отображения элемента непосредственно внутри начального тега элемента.
Для задания параметров отображения предпочтительно использование атрибута сlass.
Title определяет титул элемента, т.е. подсказку, которая выводится на экран, когда курсор помещается на данный элемент.
2. локализующие атрибуты(lang, dir)
связаны с языком.
Lang задает код языка = en, ru
Dir – задает направление вывода текста = ltr, rtr.
Они задают сценарий, который будет выполняться при некоторых событиях:
Onclick, ondbeclick, onmousedoun, onmouseup, onmouseover, onmousemove, onmouseout, onkeypress, onkeyout, onkeydown, onkeyup.
Структура html – документа.
1. строка декларации документа.
2. сам документ (<html> и </html>)
- заголовок (<head> и </head>)
- тело документа (<body> и </body>)
Если документ содержит Frame, т.е. специальные окна, в которых могут отображаться другие документы, то вместо тега <body> используется тег <Frameset>.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.