Поисковому спаму посвящен целый раздел в «Общем руководстве» Гугла, который занимает четверть этого документа. На протяжении всего существования поисковых машин они неизменно боролись с так называемыми «черными» методами оптимизации. Гугл – не исключение. И сегодня все, что так или иначе связано с «черной» оптимизацией, «блэк хэтом» и т.п., Гугл относит к категории, называемой поисковым спамом.
Что же такое поисковый спам? Этот термин используется для веб страниц, создаваемых вебмастерами с целью обмана поисковых машин и привлечения трафика на свои сайты.
В отличие от тех категорий, которые разработаны Гуглом для оценки качества веб страниц по поисковым запросам, которые напрямую зависят от самих запросов, и потому относительны, категория поискового спама является абсолютной. Каким бы ни был поисковый запрос, спам всегда остается спамом.
С точки зрения Гугла, спамеры зарабатывают свои деньги, когда посетители кликают по ссылкам на веб страницах. Существует два главных источника спамерской прибыли – PPC объявления (контекстная реклама), и партнерские (аффилиат) программы (Гугл называет такое явление «тонкими» — thin – аффилиатами).
В общем случае страницы не относятся к спаму, если они предлагают некоторую добавленную ценность. Такой ценностью может быть оригинальный контент, полезная информация, независимо от того, есть ли на странице PPC объявления и партнерские ссылки.
Контентом, создающим добавленную ценность, Google считает:
— сравнительный анализ цен;
— оригинальные обзоры продуктов;
— рецепты (кулинарные);
— лирику, стихотворения и цитаты;
— контактную информацию, в особенности физические адреса и номера телефонов;
— купоны, скидки и промо коды.
Далее Гугл выделяет и подробно описывает восемь видов поискового спама.
1. PPC страницы.
Множество страниц создается с целью получения доходов от кликов по рекламным объявлениям. При этом не предоставляется никакая другая полезная информация. Часто такие страницы выглядят как страницы поисковых результатов, либо как страницы блогов, досок объявлений, форумов. Существует много различных типов PPC страниц.
— Страницы, не содержащие ничего, кроме объявлений.
— Страницы, выглядящие как каталоги с PPC объявлениями. Вы можете увидеть ссылки, выглядящие как результаты поисковой выдачи. Однако, кликнув по ним, вы не увидите ничего, кроме рекламы.
— Поддельные блоги с PPC объявлениями. Здесь вы можете увидеть посты, лишенные смысла, либо скопированные из других источников. Страницы существуют только для того, чтобы на них помещались блоки рекламных объявлений.
— Поддельные форумы с PPC объявлениями. На них вы можете видеть «сообщения», но вы не увидите ответов на эти сообщения. Текст «сообщений» может быть бессмысленным, либо включать рекламные ссылки. Вы можете увидеть целые страницы форумов, скопированные из других источников. Может показаться, что страницы включают ссылки для ответов, регистрации, но при кликах по ним они или не работают, или вы просто попадаете на ту же самую страницу.
— «Содранный» или скопированный контент с PPC объявлениями. Это может быть контент, украденный из других источников: с использованием специальных программ, созданных для этой цели, или с помощью поисковых запросов по специально подобранным поисковым фразам, или просто с помощью «копирования и вставки». Это же относится и к контенту, полученному из вполне легальных источников, например Википедии или каталогов DMOZ. Это могут быть ленты новостей RSS с различных сайтов, результаты поисковой выдачи. Они могут строиться по шаблонам для массового воспроизводства подобных страниц.
Контент таких страниц не обязательно является нелегальным или плагиатом. В некоторых случаях вебмастера не претендуют на то, что они являются собственниками контента, и оформляют ссылки с указанием на первоисточники.
Для того чтобы распознать подобный контент, часто бывает достаточно скопировать кусочек текста и проверить его через поисковую машину. При этом оказывается, что он уже содержится на сайтах Википедии или DMOZ, а то и на десятках других сайтов.
Однако здесь существуют исключения. Использование лирики, поэзии, рингтонов, цитат, пословиц не является спамом, и потому допустимо.
В редких случаях оригинальный контент создается специально для обмана поисковых машин, и не может быть найден в других источниках. Такой контент трудно диагностировать как спам.
Гугл предлагает следующий тест для веб страниц. Если вы уберете со страницы весь «содранный» или скопированный контент, и все, что после этого останется – это PPC объявления, то такая страница является спамом.
2. Паркованные домены.
Доменные имена, которые не были продлены в установленный срок, но еще не исчезли с DNS серверов, могут быть приобретены новыми владельцами. Спамеры иногда покупают подобные домены и помещают на веб страницы свой контент. Такие сайты относятся к просроченным или паркованным доменам, и ценность их заключается в ранее существовавших ссылках. И теперь эти ссылки прилинкованы к спамовым страницам.
Типичный паркованный/просроченный домен может содержать:
— список спонсорских ссылок;
— список популярных категорий;
— список подобных категорий.
Все ссылки на странице – оплачиваемые ссылки. Никакого оригинального контента страница не содержит.
Имя домена при этом часто не имеет никакого отношения к контенту страниц. Гугл рекомендует проверять домен с помощью сервиса http://www.waybackmachine.org, чтобы сравнить с тем, как сайт выглядел ранее.
Остальные виды поискового спама, как их видит Google, мы рассмотрим в следующей части статьи.
Не пропустите следующий пост! Подпишитесь на RSS!
Стой! Сделай ретвит, пока не забыл!