|
|
Достижение оптимального индексирования Вашего сервера поисковыми машинами |
Нет никакого волшебства и секретных методов для того, чтобы заставить страницу появиться в начале листинга любой поисковой машины. Каждая поисковая машина определяет релевантность по-своему. В довершение всего появляются новые страницы, старые обновляются - соответственно меняется и листинг. Ниже предлагаются несколько общих советов, которые могут помочь Вам увеличить появление Ваших страниц в листингах поисковых машин. Часто это очень простые идеи, которые были выпущены из виду. Все эти советы расширены дополнительной информацией о дизайне и управлении страницами (в разрезе поисковых машин).
Общие советыНа вашей странице должен быть текст. Поскольку поисковые
машины индексируют именно текст (извините за прописные истины). Страница
с недостаточным количеством текста имеет мало шансов попасть в список
ответа на запрос пользователя. Принцип перевернутой информационной пирамиды.Газетчики очень хорошо знают как это делается. Грубо говоря, необходимо в начале документа выдавать его "изюминку". Это полезно как для людей, так и для поисковых машин. Однако то, что видно человеку в шапке документа, в исходнике не всегда находится в начале. К примеру, при табличной организации документа его релевантность некоторому запросу может оказаться ниже, чем при простой страничной организации того же самого документа. Вывод прост: включите аннотацию документа в начало документа и в META-таги (газетчики всегда пишут после заголовка статьи пару абзацев жирным шрифтом, после чего идет собственно статья) или упростите дизайн страницы (если это возможно). Тщательно выбирайте ключевые слова.Фокус двух или трех ключевых слов может оказаться более сильным
аргументом в определении релевантности запросу, чем слова в заголовке
или документе. Часто ключевые слова имеются в тексте, но не в заголовке
документа. Указывайте ключевые страницы Вашего сервера.Большинство поисковых машин индексируют страницы по гипертекстовым
ссылкам из указанной (submitted) страницы. Иногда они, правда, ошибаются,
поэтому полезно указывать первые три уровня дерева страниц сервера или
те страницы, которые наилучшим образом отражают суть сервера. Необходимо наличие ссылок на внутренние страницы.Опять прописная истина, но поисковые машины отыскивают страницы именно по гипертекстовым ссылкам. Вообще говоря, чем больше ссылок внутри дерева документов на сервере, тем больше вероятность того, что ни одна страница не будет забыта при индексировании. Верно и обратное: если есть ссылки на другие, внешние сервера, то есть вероятность, что поисковый робот уйдет по этим ссылкам, не до конца проиндексировав страницы. Фреймы могут погубить Ваши усилия.Некоторые поисковые машины не могут проводить индексацию по ссылкам из FRAMESET. Чтобы избежать этого необходимо обеспечить альтернативный вход и индексацию страниц, использовать META-таги или упростить дизайн. Более подробно об этом можно прочитать здесь. "META-миф".META-таги могут помочь контролировать действия поисковых роботов и машин, однако некоторые машины "умеют" работать со всеми тагами, некоторые - только с несколькими тагами, остальные и вовсе на воспринимают подобные вещи. Отсюда следует вывод, что использование META-тагов НЕ ГАРАНТИРУЕТ, что Ваши страницы окажутся первыми в списке ответов на пользовательский запрос к машине. Детали можно понять, прочитав статью "Несколько слов о роботах поисковых машин". Интерактивность. Что может быть лучше? Однако...Генерация страниц через CGI или необходимость использования баз данных? Ожидается, что некоторые поисковые машины не будут индексировать подобные страницы. Рекомендации могут быть следующими: создание статических страниц везде, где это возможно, использование баз данных для обновления уже существующих и при этом статических(!) страниц, ни в коем случае не генерировать их на лету. Еще одна деталь: очень плохо относятся поисковые роботы к специальным символам в URL, особенно к символу '?' Забудьте про спамминг.С одной стороны спамминг - это не этично, с другой - никто кроме вебмастера не сможет точнее определить суть сделанных им документов. Альтернативные формы паблисити на сети описаны ниже. Будьте бдительны!Если ваши страницы уже попали в индексы поисковых машин, проверяйте это не реже раза в неделю. Иногда случаются странные вещи. Страницы исчезают из индексов. Линки становятся искаженными. Если Вы заметили подобные вещи - укажите страницы поисковой машине еще раз. Повторное указание страниц.Многие поисковые машины сейчас индексируют сайты в соответствии с их изменением. Это хорошо, если сайт редко изменяется, и реиндексация его один-два раза в год - нормально. Если же сайт изменяется часто, рекомендуется регулярно указывать страницы поисковым машинам, раз в один-два месяца. Это может гарантировать, что содержимое индекса в поисковых машинах не будет отличаться от реального содержания страниц. Итоги.Поисковые машины это основной путь, по которому люди могут зайти на Ваш сайт, однако не единственный. К числу оставшихся путей можно отнести традиционную рекламу, средства массовой информации, почтовые рассылки и информация из телеконференций, рекламные сети, веб-каталоги и ссылки с других серверов. Зачастую эти пути далеко не так эффективны, как при использовании поисковых машин. Копирование фреймовNote: Этот материал предназначен для тех, кто достаточно хорошо знаком с фреймовыми структурами. Если это не так, рекомендую ознакомиться сначала с информацией о фреймах и их использовании здесь. Большинство поисковых машин не умеют работать с фреймовыми
структурами. Они не будут проверять ссылки, определенные в структуре FRAMESET.
Для того чтобы поисковые машины отработали таки ссылки из FRAMESET следует
предпринять специальные меры по дублированию ссылок из FRAMESET в конструкции
NOFRAMES. Теперь подробнее: В большинстве случаев фреймовые структуры
используются для обеспечения удобства навигации внутри сервера. В маленьком
фрейме делаются ссылки на разделы сервера, в большом отображаются собственно
документы с информацией. То есть с помощью маленького фрейма идет управление
переходами по большому. Рассмотрим простой пример. Имеется структура из
двух окон: в одном отображается навигационное меню, во втором - информация
по каждому из пунктов.
Мой Вам совет: используйте фреймы только тогда, когда без них уже ну никак нельзя обойтись. Источники информации о фреймах и их использовании
Проверка статуса URLВ одних поисковых машинах довольно просто проверить насколько глубоко проидексирован сервер, в других - сложнее. Ниже описаны возможные способы проверки для различных поисковых машин Alta Vista url: citforum.ru В первом случае будут выданы все проиндексированные страницы сервера. Во втором - только страницы Windows-кодировки. В третьем - есть ли в индексе AltaVista файл index.shtml из указанной директории Excite http://citforum.ru/win/database/articles/art_1.shtml HotBot
Infoseek http://www.infoseek.com/Forms?&sv=IS&lk=noframes&pg=special.html WebCrawler http://www.webcrawler.com/WebCrawler/Status.html Rambler
Aport Измерение популярностиЛучший способ определить как люди попадают на Ваш сервер - посмотреть файл статистики (если конечно он содержит поле HTTP_REFERER). Можно сделать это и с помощью поисковых машин. Общий для всех машин способ - набрать имя сервера, однако в этом случае в результаты запроса попадут и страницы самого сервера. Более продвинутые способы проверки наличия ссылок на Ваш сервер с других изложены ниже. Alta Vista link:citforum.ru Excite HotBot Infoseek http://www.infoseek.com/Forms?&sv=IS&lk=noframes&pg=special.html WebCrawler http://www.webcrawler.com/WebCrawler/Links.html Чего люди хотят от этой жизни, что спрашивают..Списки наиболее популярных запросов к поисковым машинам можно посмотреть:
Источник: CIT |
|
Copyright © 1999-2000гг. "Internet Zone" & Nik Romanov. nikspase@mail.ru, nikspase@hotmail.ru, http://www.izone.com.ua/ |