Главная
К библиотеке


Что такое спам?

Перед тем, как вы захотите использовать различные технические увертки для того, чтобы поднять свой собственный рейтинг у поисковых машин, вам необходимо узнать немного о том, что такое спам и спамминг.

Спамминг поисковых машин - это практически использование неэтичных и непрофессиональных технических приемов в попытках поднять свой собственный рейтинг у поисковой машины. Вы должны быть осведомлены о том, что есть спамминг, для того чтобы избежать неприятностей с поисковыми роботами.

Например, если у вас есть страница с белым фоном, а на ней таблица с синими ячейками и белым текстом в них, то вы, тем самым, автоматически спаммингуете Infoseek, хотя никто об этом даже и не догадывается! Поисковый робот «видит» белый фон и белый текст и делает вывод, что на вашей странице текст одного цвета с фоном, а, следовательно, вы пользуетесь нечестными способами. После этого вас выкидывают из индекса и пойди потом докажи, что ты не верблюд. Эту неприятную ситуацию, конечно, можно легко исправить, изменив белый цвет подложки на светло-серый, причем сами вы изменений даже и не заметите, а для робота - это два принципиально разных цвета. Тем не менее, крайне неприятно уже то, что вас в чем-либо обвинили.

В общем, гораздо проще узнать заранее, чего лучше не делать, чем рисковать быть обвиненным во всех смертных грехах, а также тем, что ваши страницы будут игнорироваться поисковыми машинами и службами каталогов. Если вы будете следовать нескольким несложным правилам, то сможете избежать неприятных ощущений.

Из чего состоит спам?

  1. Махинации с ключевыми словами. Это чрезмерное повторение ключевых слов на странице для увеличения частоты, а, следовательно, релевантности поиска. Продвинутые поисковые машины в состоянии разобрать, когда это повторение является нормальным, т.е., вполне допустимым, среди остальных слов документа, когда же частота превышает пороговую, они делают заключение, что вы - жулик.
  2. Невидимый текст. Некоторые веб-мастера фарширую свои страницы текстом, который имеет тот же цвет, что и фон страницы. Поисковые машины, как уже упоминалось. В состоянии распознать подобные хитрости и могут выкинуть вас из индекса. Тоже самое касается и очень мелкого текста, который часто располагают между строками или по бокам текстового блока.
  3. Переадресация страницы. Многие роботы, особенно это касается Infoseek, «не любят» страницы, которые не имея собственного содержания отсылают пользователей на другой адрес. Причем, некоторые, особо продвинутые машины в состоянии отследить, когда это делается не только с помощью <meta>- тегов, но и при использовании Java апплетов, CGI - скриптов, а также прямых серверных приложений.
  4. Набивка meta-тегов. Не повторяйте ключевые слова в meta-тегах более одного раза - они могут быть сочтены лишними и ненужными. Также не стоит использовать ключевые слова, которые не соответствуют содержанию вашего сайта.
  5. Не посылайте одну и туже страницу более одного раза в день на одну и туже поисковую машину.
  6. Не посылайте набор одинаковых страниц. Т.е. не стоит размножать одну и туже титульную страницу, простым копирование, а затем пытаться отослать их все вместе. Это может быть расценено, как попытка надуть поисковую машину.
  7. Подмена кода. Если вы уже оптимизировали свою страницу для достижения первых мест в рейтинге поисковых машин, то не стоит полностью заменять код вашей страницы после того, как топ рейтинга был достигнут.
  8. Не посылайте на регистрацию больше дозволенного. Каждая поисковая машина имеет свои пределы для приема страниц. Например, для AltaVista этот предел составляет 1-10 страниц в день, для HotBot - 50, Excite - 25 в неделю, Infoseek - 50 в день, если вы используете форму. Учтите, что это не максимальная глубина индексирования, а максимальное количество страниц, которое от вас будет принято. Так, если у вас сайт объемом 1000 страниц, а вы можете послать только 50 из них, то у вас не возникает никаких проблем, так как робот пройдет по ссылкам на вашей странице в пределах одного сервера и проиндексирует все ваши страницы, даже, если вы их не посылали.

Теневые стороны.

Очень часто поисковые роботы могут счесть спамом самые лучшие куски вашего сайта. например Infoseek не воспринимает страницы с быстрым обновлением, хотя некоторые дизайны создают с помощью этой функции удивительные эффекты мерцания и движения. Или вот еще пример: Infoseek может жаловаться на большое количество страниц на одном хосте залинкованных на одну. Из индекса вас при этом не выкинут, но могут сбросить с высоких мест в рейтинге. Подразумевается, что эта мера должна дезориентировать спаммеров, а не практике, оказывается, что в категорию «нечистоплотных» попадают сразу все содержатели больших, разветвленных ресурсов, например, если у вас сайт из ста страниц, каждая из которых имеет ссылку на оглавление.

На счастье, поисковые роботы придумали и поддерживают не роботы, а живые люди, и они прекрасно понимают, что даже самые жесткие ограничения не остановят спаммеров, а вот невинные люди вполне могут пострадать. Поэтому никто не будет применять никаких к вам санкций, если у вас просто хорошо релевантная страница, точно также, если у вас большой и разветвленный проект. Поэтому, если вам кажется, что у вас есть проблемы с поисковой машиной, то напишите ее администратору, скорее всего, он войдет в ваше положение.

 

Давид Гиканди. InternetDay, сокращенный перевод.

Источник: рассылка "Альманах вэбмастера", рассылается http://www.citycat.ru/

 

Copyright © 2000г. "Internet Zone" & Nik Romanov, info@izcity.com
Hosted by uCoz