Главная
К библиотеке

Military.com Free Screensavers!

Описание HTML документов.

Использование метаданных (команда META) при создании HTML документов


Содержание

Команда META

Команда META (тэг) имеют два возможных атрибута

<META HTTP-EQUIV="имя" CONTENT="содержимое">
<META NAME="имя" CONTENT="содержимое">

META команды (описания-инструкции) должны находиться в заголовке HTML-документа между инструкциями <HEAD> и </HEAD> (особенно это важно для документов, использующих фреймы).

Атрибут HTTP-EQUIV

META-команда с атрибутом HTTP-EQUIV эквивалентна HTTP-заголовку ответа HTTP сервера (некоторые HTTP серверы, могут использовать эти команды для формирования реальных HTTP-заголовков). Обычно они управляют действиями браузеров и могут быть использованы для совершенствования информации, выдаваемой обычными заголовками. Команды META могут дать такой же эффект, что и реальный HTTP-заголовок ответа сервера. Описание HTTP-заголовка ответа дано в RFC1945 (протокол HTTP/1.0) и RFC2068 (протокол HTTP/1.1).

HTTP-заголовки формируются сервером, как правило, согласно информации, заданной в конфигурационных файлах, но могут быть сгенерированы и с помощью CGI-скриптов. Это позволяют сделать серверы Apache, Netscape, CERN, NCSA и некоторые другие. Существуют серверы, которые используют другие механизмы генерирования заголовков (например, через специальный дизайнер, как это сделано в сервере MS IIS). Некоторые генерируемые сервером поля заголовков не могут быть подменены значениями из содержания команды META (в частности Date), другие подменяются только при ненормальном (ошибочном) статус-коде HTTP-ответа (<>200). Если информация, заданная в заголовках (HTTP и META) противоречит друг другу, то значение HTTP-заголовка превалирует над значением команды META (по протоколу, но не все просмотрщики это соблюдают).

 

Значение: Expires

Источник: HTTP/1.1 (RFC2068)

Дата устаревания документа. Управление кэшированием у клиента в HTTP/1.0. В Netscape Navigator это выглядит следующим образом: если указанная дата прошла, то очередной запрос этого документа вызывает повторный сетевой запрос, а не подгрузку документа из кэша. Дата со значением "0" интерпретируется как "текущее_время". Такое значение заставляет браузер каждый раз при запросе проверять - изменялся ли этот документ. Это, кстати относится и к прокси-агентам. Поисковые роботы могут либо совсем не индексировать такой документ, либо постоянно "просматривать" его.

Дата должна быть задана в формате, описанном в RFC850 (стандартная запись Даты для UNIX систем),

<META HTTP-EQUIV="expires" CONTENT="Wed, 26 Feb 1997 08:21:57 GMT">

что эквивалентно HTTP-заголовку

Expires: Wed, 26 Feb 1997 08:21:57 GMT

Значение: Pragma

Контроль кэширования для протокола HTTP/1.0. Значение может быть только одно "no-cache" (не кэшировать данный документ).

Значение: Content-Type

Источник: HTTP/1.0 (RFC1045)

Указание MIME-типа документа. Может быть расширено указанием кодовой страницы документа (charset). Если же указывать charset в содержании команды META, то Netscape Navigator и MSIE выводят данный документ уже в заданном charset. Однако будьте аккуратны, если текст документа в кодировке Windows имеет значение charset=KOI8-r, то никакими силами пользователь не сможет поменять encoding, чтобы увидеть нормальный русский текст!

<META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=ISO-8859-5">

Значение: Content-language

Источник: HTTP/1.0

Указание языка документа. Может использоваться поисковыми машинами при индексировании страниц. Комбинация поля Accept-Language (посылаемого *броузером) с содержимым Content-language может быть условием выбора сервером того или иного языка.

<META HTTP-EQUIV="Content-language" CONTENT="en-GB">

что эквивалентно HTTP-заголовку

Content-language: en-GB

Язык описывается парой значений (язык-диалект). В примере: Английский-Великобритания. Можно использовать только фиксированные коды языков, например:

    en - английский
    fr - французский
    de - немецкий
    it - итальянский
    ru - русский

Значение: Refresh

Источники: Netscape (Автоматическая перезагрузка документа)

Определение задержки в секундах, после которой браузер автоматически обновляет документ. Дополнительная возможность - автоматическая загрузка другого документа.

<META HTTP-EQUIV="Refresh" Content="3, URL=http://www.name.com/page.html">

что эквивалентно HTTP-заголовку

Refresh: 3; URL=http://www.name.com/page.html

В Netscape Navigator это дает такой же эффект, что и нажатие на кнопку Reload.

Спецификация протокола HTTP "Refresh" автоматически загружает в окно просмотрщика новый документ.

Пример

<META HTTP-EQUIV="Refresh" CONTENT="12; URL=webpage.html">

Если данная команда указана в заголовке документа, то через 12 секунд просмотрщик автоматически заменяет текущий документ на документ, указанный атрибутом URL.

Значение: Window-target

Определяет окно текущей страницы; может быть использован для прекращения появления новых окон браузера при применении фреймовых структур. Действует для многих (но не для всех) браузеров.

<META HTTP-EQUIV="Window-target" CONTENT="_top">

что эквивалентно HTTP-заголовку

Window-target: _top

Значение: Ext-cache

Определяет имя альтернативного кэша для просмотрщика

<META HTTP-EQUIV="Ext-cache" CONTENT="name=/some/path/index.db; istructions=User Instructions">

Значение: PICS-Label

Platform for Internet Content Selection (Platform-Independant Content rating Scheme). Обычно используется для определения рейтинга "взрослости" (adult) содержания (sex,violence, ...):-)) однако это довольно гибкая схема и может использоваться для других целей.

Значение: Cache-Control

Источники: HTTP/1.1

Определяет действия кэша по отношению к данному документу. Возможные значения:

Значение: Vary

Источники: HTTP/1.1

Определяет доступные альтернативы для указанных в CONTENT полей HTTP-заголовка.

<META HTTP-EQUIV="Vary" CONTENT="Content-language">

что эквивалентно HTTP-заголовку

Vary: Content-language

Значение: Lotus

Lotus-редакторы генерируют свои собственные поля Bulletin-Date и Bulletin-Text атрибуты. Bulletin-Text содержит описание документа

Атрибут NAME

Команда META с атрибутом NAME используются в случаях, когда поля не соотносятся с HTTP-заголовками. Принципиально нет никаких ограничений на использования значений этого атрибута, за исключением того, что существует негласная договоренность между создателями поисковых машин и роботов о том как использовать некоторые из них. Ниже приводятся наиболее употребимые значения этого атрибута.

META с атрибутом NAME это поля, содержащие описание документа, или поля, предназначенные для интерпретации поисковыми машинами (роботами). Иногда некоторые поисковые агенты могут интерпретировать значение "Keywords" описанный как NAME, другие - как HTTP-EQUIV

Значение: Robots

Управление индексацией страницы для поисковых роботов.

<META NAME="Robots" CONTENT="NOINDEX,FOLLOW">

Возможные значения:

Значение: Description

Источники: Spidering, Altavista, Infoseek

Краткая аннотация содержания документа. Используется поисковыми системами для описания документа. Задание этого значения полезено в случаях, когда в документе мало текста, когда это управляющий фреймами файл (frameset) или в начале документа используются скрипты. Длина текста до 100 символов.

<META NAME="Description" CONTENT="Документ содержит словарь META-тагов">

Значение: Keywords

Источники: Altavista, Infoseek

Используется поисковыми системами для индексирования документа. Обычно здесь указываются синонимы к словам в заголовке (title) или альтернативный заголовок. Длина списка до 1000 символов. Не допускается использование одного и того же ключевого слова более 7 раз, поисковые системы просто будут игнорировать это слово.

<META NAME="Keywords" CONTENT="таги,тэги,метаданные,список">

 

Значение: Document-state

Управление индексацией страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно.

<META NAME="Document-state" CONTENT="Static">

Возможные значения:

 

Значение: URL

Управление индексацией страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно.

<META NAME="URL" CONTENT="absolute_url">

Значение: Author

Обычно имя автора, формат произвольный.

Значение: Generator

Обычно название и версия редактора, с помощью которого создана эта страница. Может быть использована для определения доли рынка, занимаемого тем или иным продуктом.

Значение: Copyright

Обычно описание авторских прав на документ в произвольном формате.

Значение: Distribution

Возможные значения

Значение: Resource-type

Текущее состояние данного файла. Важен для поисковых систем, т.е. если его значение document, то поисковая система приступает к его индексированию.

Прочие значения

Помимо перечисленных более или менее стандартных значений данного атрибута существует еще множество других специализированных, например, для конкретной поисковой машины.

Список литературы

  1. META, REL and REV Tags
  2. META Tags
  3. TAGnet META Tags
  4. Getting Listed on the Search Engines

Hosted by uCoz