Russian Link Exchange
 
Журавлев С. В.
 
Описание языка HTML
 
Версия 1.01 alpha (24 Августа 1997 г.)
 
Москва, 1997 год.
  • 1. Содержание
  • 2. HTML: Общие сведения
  • 3. Описание тегов
  • 3.1. Комментарии
  • 3.2. HTML - начало и конец HTML текста в документе
  • 3.3. Заголовок HTML-документа

  • 3.3.1. HEAD - заголовок документа
  • 3.3.2. LINK - связь с другим документом
  • 3.3.3. META - описание странички
  • 3.3.4. STYLE - изменение свойств тегов
  • 3.3.5. TITLE - название документа
  • 3.4. Команды форматирования текста
  • 3.4.1. B - полужирное начертание
  • 3.4.2. BASE - Абсолютный адрес документа
  • 3.4.3. BASEFONT - размер шрифта текста
  • 3.4.4. BLINK - мигание текста
  • 3.4.5. BODY - тело документа
  • 3.4.6. BR - принудительный разрыв строки
  • 3.4.7. CENTER - центровка элементов
  • 3.4.8. DIV - разметка текста
  • 3.4.9. FONT - параметры шрифта
  • 3.4.10. H1, H2, H3, H4, H5, H6 - форматирование заголовков
  • 3.4.11. HP - выделение текста
  • 3.4.12. HR - горизонтальная разделительная черта
  • 3.4.13. I - курсивное начертание
  • 3.4.14. MUTICOL - вывод текста в несколько столбцов
  • 3.4.15. NOBR - вывод текста в одну строку
  • 3.4.16. P - абзац
  • 3.4.17. S - перечеркнутый текст
  • 3.4.18. SPACER - вставка пробела
  • 3.4.19. STRIKE - перечеркнутый текст
  • 3.4.20. SUB - индекс снизу
  • 3.4.21. SUP - индекс сверху
  • 3.4.22. TT - шрифт фиксированной ширины
  • 3.4.23. U - подчеркнутое начертание
  • 3.4.24. WBR - перенос строки
  • 3.4.25. XMP - вывод форматированного текста
  • 3.5. Команды логического форматирования текста
  • 3.5.1. ADDRESS - информация для связи с авторами
  • 3.5.2. AU - имя автора
  • 3.5.3. BIG - увеличенный текст
  • 3.5.4. BLOCKQUOTE - цитата
  • 3.5.5. BQ - цитата
  • 3.5.6. CITE - цитата
  • 3.5.7. CODE - оформление листингов программ
  • 3.5.8. COMMENT - комментарий
  • 3.5.9. CREDIT - указатель на автора цитаты
  • 3.5.10. DEL - удаленный текст
  • 3.5.11. DFN - определение
  • 3.5.12. EM - смысловое усиление текста
  • 3.5.13. INS - вставленный текст
  • 3.5.14. KBD - ввод с клавиатуры
  • 3.5.15. LISTING - вывод форматированного текста
  • 3.5.16. PLAINTEXT - вывод форматированного текста
  • 3.5.17. PRE - вывод форматированного текста
  • 3.5.18. Q - короткая цитата
  • 3.5.19. SAMP - компьютерные сообщения
  • 3.5.20. SMALL - уменьшенный текст
  • 3.5.21. STRONG - привлечение внимания к тексту
  • 3.5.22. VAR - переменная
  • 3.6. Таблицы
  • 3.6.1. CAPTION - заголовок таблицы
  • 3.6.2. COL - атрибуты столбцов таблицы
  • 3.6.3. COLGROUP - атрибуты столбцов таблицы
  • 3.6.4. TABLE - таблица
  • 3.6.5. TBODY - тело таблицы
  • 3.6.6. TD, TH - данные и заголовки таблицы
  • 3.6.7. THEAD - заголовок таблицы
  • 3.6.8. TR - строка таблицы
  • 3.7. Списки
  • 3.7.1. DD - определение
  • 3.7.2. DIR - несортированный список
  • 3.7.3. DL - списки определений
  • 3.7.4. DT - понятие в списке определений
  • 3.7.5. LH - оглавление списка
  • 3.7.6. LI - элемент списка
  • 3.7.7. MENU - несортированный список
  • 3.7.8. OL - упорядоченные (нумерованные) списки
  • 3.7.9. UL - неупорядоченные списки
  • 3.8. Карта-изображение
  • 3.8.1. AREA - зона в карте изображения
  • 3.8.2. MAP - карта-изображение
  • 3.9. Мультимедия
  • 3.9.1. A - гипертекстовая связь
  • 3.9.2. BGSOUND - фоновый звук
  • 3.9.3. EMBED - вставка объектов
  • 3.9.4. IMG - вставка изображения в документ
  • 3.9.5. MARQUEE - бегущая строка
  • 3.9.6. NOEMBED - не внедрение объектов
  • 3.10. Формы
  • 3.10.1. FORM - создание заполняемой формы
  • 3.10.2. INPUT - элемент тега <FORM>
  • 3.10.3. ISINDEX - запрос текста пользователя
  • 3.10.4. OPTION - пункт меню
  • 3.10.5. SELECT - меню выбора
  • 3.10.6. TEXTAREA - многострочный редактор
  • 3.11. Кадры
  • 3.11.1. FRAME - Описание кадров
  • 3.11.2. FRAMESET - разделение документа
  • 3.11.3. NOFRAME - неподдержка кадров
  • 3.12. Программирование
  • 3.12.1. APP - Java апплет
  • 3.12.2. APPLET - Java апплет
  • 3.12.3. NOSCRIPT - неподдержка JavaScript
  • 3.12.4. OBJECT - ActiveX
  • 3.12.5. PARAM - атрибут Java-аплета
  • 3.12.6. SCRIPT - вставка скрипта
  • 4. Кодировка цвета
  • 5. Специальные символы
  • 6. Список литературы
  • 7. Автор
  •  
    1.Содержание

    Целью данного документа ставится описание языка HTML и примеры использования управляющих кодов (теги).
    Также будет показана возможность создания карт изображений, кадров, форм и прочих возможностей.

    2.HTML: Общие сведения

    Команды форматирования языка HTML, называемые управляющими кодами (tag или тег), представляют собой просто зарезервированные последовательности символов, начинающиеся с < (знака меньше) и заканчивающиеся > (знаком больше). Имя элемента следует в метке сразу за символом открытия <. Имя начинается с буквы, за которой могут следовать еще 33 буквы, цифры, пробела или дефиса. В именах игнорируется разница между прописными и строчными буквами. Теги не зависят от регистра. Внутри тегов могут включаться атрибуты. Начальная метка позволяет вставить между именем и символом > пробелы и атрибуты. Атрибут состоит из имени, символа равенства и значения. Слева и справа от символа равенства можно оставлять пробелы. Значение атрибута указывается в виде строки, заключенной в одинарные или двойные кавычки. Длина строки со значением атрибута после такого анализа не должна превышать 1024 символов.

    В большинстве случаев теги используются симметричными парами, при этом завершающий код отличается от открывающего символом / (знак дроби). Например, если у нас есть гипотетический атрибут форматирования текста, управляемый кодом <X>, и мы хотим применить его к словам "Это мой текст", HTML-последовательность кодов и собственно текста будет выглядеть так:

    <X>Это мой текст</X>

    Встреченная в тексте комбинация </ идентифицируется как начальный ограничитель завершающей метки только тогда, когда за ней следует буква. Но как только начальный ограничитель завершающей метки опознан, текст завершается.
    Следующий пример содержит ошибку:

    <LABEL>Пример текста </END> после тега END </LABEL>.

    В принципе, существует возможность для создания страничек использовать готовые редакторы, например Corel WEB Designer или Netscape Navigator Gold, однако, с их помощью можно создавать только простейшие HTML-документы, состоящие из текста и рисунков. Исходя из этого, а также личного опыта, автор этого документа рекомендует использовать написание страничек в любом текстовом редакторе. При кажущейся сложности этого способа, при соответствующей сноровке можно достаточно быстро изготовлять странички любой сложности. В качестве альтернативного варианта предлагается начинать создавать страничку в редакторе, а заполнять ее в текстовом редакторе.

    Далее будет описана версия 3.0 языка HTML, которая является стандартной, и также будут отмечены версии 3.2 и 4.0, которые находится в процессе утверждения стандарта. К сожалению, имеется много тегов, которые являются расширением какого-нибудь конкретного браузера.

    В конце описания каждого тега находится секция, в которой описаны все возможные атрибуты браузера. Однако, некоторые из этих атрибутов не описаны. Это связано с тем, что либо эти атрибуты редко используются, либо автор не нашел информацию, касающуюся этих атрибутов.

    Для навигации в сети Internet в основном на равных конкурируют только два навигатора, Microsoft Internet Explorer 3.0 фирмы  Microsoft, и Netscape Navigator 3.0 Gold фирмы Netscape Communucation.
    При описании тегов будет указываться их различное поведение на этих двух браузерах. Очень хорошее сравнение браузеров можно найти в журнале PC Magazine, Russian Edition, ╧3, 1997. Стр 56.

    3.Описание тегов

    В этой главе будет описание тегов языка HTML 3.0. Английский текст взят на WEB сайте: http://www.sandia.gov/sci_compute/elements.html. Многие теги можно найти в RFC 1866.
    Теги разбиты на смысловые группы, которые правда, немного произвольны, так как некоторые из тегов, например <A>, трудно отнести определенно к какой либо группе.

    3.1.Комментарии

    В языке HTML комментарии начинаются с последовательности <!-- , а заканчиваются последовательностью -->.
    и выглядят следующим образом:

    <!-- Это комментарий в формате HTML-->

    3.2.HTML - начало и конец HTML текста в документе

    Описание:
    Данный тег показывает, с какого места в произвольном текстовом файле начинать интерпретировать текст как управляющие коды языка HTML. Любой текст, находящийся выше тега <HEAD> и ниже тега </HEAD> игнорируются.
    Как показала практика, оба браузера не обращают внимания на этот тег, однако стоит привыкнуть ставить их во избежание проблем в будущем, когда браузеры и редакторы HTML станут сложнее и потребуют их.
    В общем случае HTML-документ задается следующим образом:

    <HTML>
    <HEAD>
    <!-- Заголовок документа-->
    </HEAD>

    <BODY>
    <!-- Тело документа-->
    </BODY>
    </HEAD>

    Минимальное использование:
    <HTML> </HTML>

    Максимальное использование:
    <HTML VERSION="...">   </HTML>

    3.3.Заголовок HTML-документа

    Эта глава описывает элементы заголовка HTML-документа. Элементы, находящиеся внутри тега <HEAD>.

    3.3.1.HEAD - заголовок документа

    Описание:
    Фактически весь HTML-документ состоит из двух блоков, находящихся между тегом <HTML>. Один из этих блоков находится в обрамлении тега <HEAD> (другой - <BODY>). Между тегами <HEAD> и </HEAD> помещается раздел заголовка и информации об HTML-документе.
    Важно отметить, что никакой из элементов находящихся там, не будет отображен на экране браузера, однако игнорировать их не стоит. Между тегами <HEAD> и </HEAD> могут находится только следующие теги:
    <TITLE>
    <ISINDEX>
    <BASE>
    <META>
    <LINK>
    <NEXTID>.

    Наиболее часто используемые теги - <TITLE> <META>.
    Так как данный тег не несет никакой смысловой нагрузки, то оба браузера могут обходиться без него, однако все же рекомендуется использовать его. Причины этого будут рассмотрены в главах, посвященных тегам, находящимся внутри тегов <HEAD> и </HEAD>.

    Минимальное использование:
    <HEAD></HEAD>

    Максимальное использование:
    <HEAD> </HEAD>

    3.3.2.LINK - связь с другим документом

    Описание:
    Тег <LINK> появляется в границах тега <HEAD>. Он используется для указания взаимоотношения между данным документом и каким-либо другим объектом. Документ может иметь любое количество элементов LINK. Элемент LINK является пустым (не содержит метки завершения), но имеет те же атрибуты, что и тег <A>.
    Как правило, элемент используется для указания авторства, соответствующих индексных указателей, словарей, предыдущих и последующих версий документа и т.д. Связи могут формировать некую статичную ветвящуюся структуру, где рассматриваемый документ идентифицируется, например, ссылкой на "родительский", "последующий" и "предыдущий" документы. Серверы также могут не препятствовать установлению ссылок теми клиентами, которые не имеют прав на внесение изменений в сам текст документа.

    Минимальное использование:
    <LINK HREF="...">

    Максимальное использование:
    <LINK HREF="..." REL="..." REV="..." URN="..." TITLE="..." METHODS="...">

    3.3.3.META - описание странички

    Описание:
    Тег <META> должен находится в теге <HEAD> и может использоваться для записи парных элементов "название/значение", которые описывают свойства данной странички. Например, это может быть имя автора, дата истечения срока действия, список ключевых слов и т.д. Атрибут NAME определяет название определенного качества, в то время как CONTENT указывает соответствующе ему значение, например:
    <META NAME="Author" CONTENT="Иван Иванович Иванов">

    Вместо атрибута NAME может использоваться атрибут HTTP-EQUIV, что имеет особое значение, если документы возвращаются по Протоколу Передачи Гипертекста (HTTP). Сервера HTTP могут использовать название свойства, указываемое атрибутом HTTP-EQUIV, для создания в HTTP-ответе особого заголовка в стиле RFC 822. Однако такой механизм оказывается неприменим, если используются некоторые типы HTTP-заголовков.
    Например,
    <META HTTP-EQUIV="Expires" CONTENT="Tue, 20 Aug 1996 14:25:27 GMT">
    при передаче приведет к появлению в HTTP заголовке дополнительного сообщения:
    Expires: Tue, 20 Aug 1996 14:25:27 GMT

    К примеру, такая возможность может использоваться промежуточными сетевыми кэшами при определении момента, когда возникает необходимость в получении новой копии соответствующего документа.
    Также существует возможность управления отображением вашего HTML-документа. Например, если вы не хотите, чтобы Ваша страничка была загружена со стороны другого сайта с технологией < FRAME>, вы можете использовать следующую последовательность:

    <META HTTP-EQUIV="Window-target" CONTENT="_top">
    В этом случае ваш HTML-документ, независимо ни от чего, будет загружаться во все окно браузера.
    Полями, записанными в теге <META>, пользуются различные поисковые серверы. В основном они используют два атрибута тега <META>. Это атрибут HTTP-EQUIV="description", значением которого является краткая аннотация странички, и HTTP-EQUIV="keywords", предназначенное для определения ключевых слов, которые будут использоваться для поиска. Ключевые слова перечисляются через запятую.
    Пример ниже показывает пример странички:

    <META HTTP-EQUIV="description" CONTENT="Спецификации и документы">
    <META HTTP-EQUIV="keywords" CONTENT="Спецификации, документы, описания">

    Рассмотрим еще несколько применений тега <META>. Например, по ряду причин, Вам необходимо переместить свой HTML-документ на другой адрес, например www.new.com. Тогда, разместите по старому адресу следующую страничку:
    <HTML>
    <HEAD>
    <META HTTP-EQUIV="Refresh" CONTENT="12; URL=www.new.com">
    </HEAD>
    <BODY>
    <P>
    Страничка перемещена на адрес www.new.com
    </P>
    </BODY>
    </HTML>

    При загрузке этой страницы, в случае если в течении 12 секунд пользователь не выбрал другую страницу, произойдет загрузка страницы с адреса, указанного в поле "URL=". Следует обратить внимание, что время обновления и адрес странички находятся в одном атрибуте CONTENT. Время и адрес отделяются друг от друга ; (точка с запятой). В поле URL можно также указать имя звукового файла, и в случае, если ваше программно-аппаратное обеспечение может воспроизводить звуковую информацию, начнется воспроизведение звукового файла.

    Минимальное использование:
    <META CONTENT="...">

    Максимальное использование:
    <META HTTP-EQUIV="..." NAME="..." CONTENT="...">

    3.3.4.STYLE - изменение свойств тегов

    Описание:
    Данный тег реализован только в Netscape Navigator и используется внутри тега <HEAD> и позволяет переопределить любой из тегов форматирования.
    Например:
    <HTML>
    <HEAD>
    <TITLE>Introduction to Style Sheets</TITLE>
    <STYLE TYPE="text/css" TITLE="Bright Colours">
    BODY { color : white}
    P { color : blue;
    font-size : 12pt;
    font-family : Arial}
    H1 { color : red;
    font-size : 18pt}
    </STYLE>
    </HEAD>
    <BODY>
    ...

    В этом примере тег <P> переопределяется так, что весь текст внутри этого тега будет выведен синим цветом и шрифтом Arial с размером 12pt. А тег <H1> переопределяется так, что текст внутри него будет выводится красным цветом и шрифтом с размером 18pt. Атрибут TITLE используется для указания имени набора параметров. Атрибут TYPE указывает тип определения стилей в формате, принятом в сети Интернет (MIME), и обычно равен text/css.

    Минимальное использование:
    <STYLE></STYLE>

    Максимальное использование:
    <STYLE TYPE="..." TITLE="..."></STYLE>

    3.3.5.TITLE - название документа

    Описание:
    Каждая страничка должна иметь ровно один элемент <TITLE> в теге <HEAD>. С его помощью браузеру сообщается название-уведомление данного документа, которое отображается в заголовке брузера и в закладках. Внутри TITLE нельзя использовать элементы разметки.

    Минимальное использование:
    <TITLE>characters... </TITLE>

    Максимальное использование:
    <TITLE>characters... </TITLE>

    Пример:
    <TITLE>Домашняя страничка</TITLE>

    3.4.Команды форматирования текста

    В данной главе описываются команды, которые предназначены для форматирования текста перед выводом на экран.

    3.4.1.B - полужирное начертание

    Описание:
    Этот тег предназначен для того, что бы сделать начертание символа полужирным. Например последовательность следующего кода:

    <P>Второе <B>слово</B> в этом предложении имеет полужирное начертание.</P>

    будет отображено так:
    Второе слово в этом предложении имеет полужирное начертание.

    Этот тег относится к группе тегов, включающих в себя следующие: <B> <I> <U>, то есть полужирное начертание, курсивное и подчеркнутое. Как видно, это набор атрибутов для любого текстового редактора, и могут использоваться в любых комбинациях. Однако, если попытаться использовать все эти стили одновременно в HTML, то результат будет не определен, ибо одни браузеры отразат то, что вы хотели, а другие только выберут один атрибут, и отобразят его. Другими словами, поведение комбинации данных стилей не определено. В целях более понятного логического восприятия текста рекомендуется вместо этого тега использовать тег <STRONG>.

    Минимальное использование:
    <B>characters... </B>

    Максимальное использование:
    <B ID="..." CLASS="...">characters... </B>

    3.4.2.BASE - Абсолютный адрес документа

    Описание:
    Тег <BASE> указывает для данного HTML-документа базовый адрес URL, который затем будет использоваться при переопределении относительных адресов URL с использованием правил, задаваемых соответствующей спецификацией URL.
    Например, в случае разметки

    <BASE href="http://www.zniis.com">
    ...
    <IMG SRC="pic/logo.gif">
    соответствующее изображение будет соотнесено с источником http://www.zniis.com/pic/logo.gif

    В отсутствии тега <BASE> для преобразования относительных адресов в абсолютные должен использоваться URL самого документа.
    Заметим, что не обязательно это будет тот же самый адрес URL, который использовался для вызова документа, поскольку его базовый URL может быть переопределен заголовком HTTP, сопровождающим в сети рассматриваемый документ. Переопределение обычно делается браузерами, с целью нормального извлечения страничек из кеша. Тег должен использоваться внутри тега <HEAD>.

    Минимальное использование:
    <BASE HREF="...">

    Максимальное использование:
    <BASE HREF="...">

    3.4.3.BASEFONT - размер шрифта текста

    Описание:
    Данный тег позволяет уменьшить или увеличить размер обычного текста (не заголовков <Hn>). Размер меняется в фиксированных размерах от одного до семи. Значение по умолчанию - три. Размер шрифта на новый меняется только в том тексте, который находится за этим тегом. Таким образом появляется возможность оформления HTML-документа шрифтами разного размера.
    Этим тегом пользуются оба браузера. Тег можно размещать в любых разделах, как <BODY> так и <HEAD>. Ценность данного тега сомнительна, так как для заголовков есть специальные стили (<H1> <H2> <H3> ... ), а обычный шрифт можно выделить цветом, подчеркиванием, жирным или курсивным начертаниями.

    Минимальное использование:
    <BASEFONT SIZE=1|2|3|4|5|6|7>

    Максимальное использование:
    <BASEFONT SIZE=1|2|3|4|5|6|7>

    Пример:
    Шрифт размера семь:
    <BASEFONT SIZE=7>

    3.4.4.BLINK - мигание текста

    Описание:
    Этот тег заставляет набор символов мигать с частотой около одного герца. Поддерживается только Netscape Navigator 3.0 Gold. Данный тег следует применять с осторожностью, так как большое кол-во мигающего текста может раздражать пользователя.

    Минимальное использование:
    <BLINK>characters... </BLINK>

    Максимальное использование:
    <BLINK>characters... </BLINK>

    3.4.5.BODY - тело документа

    Описание:
    Данный тег содержит собственно тело (текст) HTML-документа. При этом и начальный и конечный тэги элемента <BODY> могут быть опущены. В теле HTML-документа может содержаться достаточно большой набор элементов:
    Заголовки (H1 - H6)
    Элемент ADDRESS
    Блочные элементы
    Элементы на уровне текста
    Ключевые атрибуты данного элемента - BACKGROUND, BGCOLOR, TEXT, LINK, VLINK и ALINK - могут использоваться для того, чтобы задать повторяющееся фоновое изображение, дополнительный цвет фона и цвет, который будет использоваться при печати на экране обычного текста и гипертекстовых связей.

     
    Определяет цвет фона для тела документа. Коды цветов в главе 4 (стр. 65).
    АтрибутСмысл
    bgcolor
    textОпределяет цвет, используемый при выводе на экран текста из данного документа. Обычно используется, когда Вы меняете фоновый цвет с помощью атрибутов BGCOLOR или BACKGROUND.
    linkОпределяет цвет, который будет использоваться при выводе на экран текста из еще не выбранных вами гипертекстовых связей.
    vlinkОпределяет цвет, который будет использоваться при выводе на экран текста из уже проверенных вами гипертекстовых связей.
    alinkЗадает цвет, которым будут выделяться в тексте гипертекстовые связки в тот момент, когда пользователь щелкает по ним клавишей мыши.
    backgroundОпределяет адрес URL, откуда будет браться изображение для подготовки фона к текущему документу.
     
    Так как любой из браузеров имеет свои цвета ссылок (link, vlink, alink), к которым привыкает пользователь, то предлагается не менять их цвета принудительно.

    Минимальное использование:
    Тег может отсутствовать.

    Максимальное использование:

    <BODY ID="..." CLASS="..." BACKGROUND="..." BGCOLOR="..." BGPROPERTIES=fixed TEXT="#rrggbb" LINK="#rrggbb" VLINK="#rrggbb" ALINK="#rrggbb"> </BODY>

    3.4.6.BR - принудительный разрыв строки

    Описание:
    Тег <BR> вводит принудительный перевод строки и соответствует нажатию клавишной комбинации "Shift+Enter" в текстовых процессорах Word. Тег <BR> не означает конца логического абзаца, и за строкой с этим кодом дополнительная пустая строка не появится. Типичный пример использование <BR> - отделение фамилии от адреса, чтобы они не попали при просмотре на одну строку.

    Минимальное использование:
    <BR>

    Максимальное использование:
    <BR CLEAR=left|right|all|"..." ID="..." CLASS="...">

    3.4.7.CENTER - центровка элементов

    Описание:
    Тег предназначен для центрирования любых объектов, например текста или картинки. В отличие от атрибута ALIGN, где устанавливается положение на страничке только в пределах одного тега, этот тег центрирует все элементы внутри себя. Атрибут текста ALIGN не отменяет действие атрибута.

    Минимальное использование:
    <CENTER>characters... </CENTER>

    Максимальное использование:
    <CENTER>characters... </CENTER>

     
    На заглавную страницу ]  [ Продолжение ]  [ В начало страницы ]