Разработка сайтов, создание сайтов
главная / Контент / Дублированный контент: блокировка, редирект или канонизиция

Дублированный контент: блокировка, редирект или канонизиция

Дублированный контент часто и долго обсуждался в сфере SEO. На сегодняшний день эта тема все также актуальна. Среди наиболее частых вопросов были и есть:

  • как ПС относятся к дублированному контенту?
  • как дублированный контент влияет на выдачу?

Слишком беспокоится о дублированном контенте, на сегодняшний день, не стоит, т.к. ПС умело определяют наиболее качественную страницу (оригинал) и выделяют ее среди подобных ей клонов. Тем не менее многих веб-мастеров этот вопрос не оставляет в покое. Один из мучительных вопросов — вопрос бана сайта из-за дублированного контента. Блоги, видео и аудио уроки, SEO статьи и т.д. дают множество советов как избавится от дублированного контента и обеспечить своему сайту долговечное существование.

Одни советуют, что достаточно заблокировать дубликаты, другие — лучше прописать редирект, а третьи говорят, что лучше всего канонизировать страницу. Каждый из предлагаемых методов хорош, и каждый имеет свои недостатки. Обсудим их подробнее. Заранее отмечу, что цель статьи — скорее напомнить о таких способах. Подробный разбор каждого из них — тема отдельных статей с примерами.

Блокируем в robots.txt

Использование правил в файле robots.txt — наиболее распространенная практика среди веб-мастеров, т.к. правила не требуют особых знаний в синтаксисе. robots.txt популярен не только среди обычных веб-мастеров, но и среди специалистов Google. Вы можете указать файлы и/или каталоги, которые индексировать не надо. Например, это могут быть результаты работы CGI-скиптов, сводка о погоде и пр.

Дублированный контент: блокировка, редирект или канонизиция

Все прописанные страницы в robots.txt будут исключены из списка посещаемых роботом ПС.

Использование <meta> robots: Noindex/Follow тэги

Другой способ исключить дублированный контент — использовать служебные тэги Noindex/Follow (пример):

<meta name="robots" content="noindex, follow" />

Дублированный контент: блокировка, редирект или канонизиция

Noindex даст команду роботам не индексировать страницу, а Follow разрешит передавать вес внешним ссылкам. Отмечу, что изначально атрибуты Follow и NoFollow создавались для борьбы с SEO спамом, дабы целевые спам страницы не вылазили в выдаче на «незаслуженные» места из-за набранного на шару веса входящих ссылок.

301-й редирект

Дублированный контент: блокировка, редирект или канонизиция

Что происходит с дублированным контентом при использовании 301-го редиректа? 301-й редирект — отличная вещь в сравнении с первыми двумя. 301-й редирект — это переадресация. Это означает, что страница или целый сайт теперь находится по новому адресу. Робот ПС послушно перейдет на новую страницу. При этом весь вес, ранжирование и т.д. полностью переходят на новый урл. Ничего не теряется и не усекается. Вот почему так популярны склейки доменов. Разные умельцы веб-мастера на этом зарабатывают немало рубликов.

301-й редирект можно осуществить на ПО веб-сервера (Apache, IIS и т.д.) либо посредством программирования на стороне сервера (PHP, ASP/.net, ColdFusion, JSP, Perl и т.д.).

Каноническая ссылка

Каноническая ссылка ведет себя похоже как и 301-й редирект. Страница с дублированным контентом индексироваться не будет (в идеале). В индексе появятся только назначения страницы. Все страницы с указанием канона будут считаться как оригинал.

Дублированный контент: блокировка, редирект или канонизиция

Простой пример. Допустим, вы посетили интернет магазин и просматриваете страницу о сумках для ноутбуков:

http://www.example.com/travel/luggage/laptop-bags/targus/

В тоже время, другой покупатель ищет в магазине ноутбук. Причем он хочет сэкономить и купить его вместе с сумкой. В интернет-магазинах часто используют такой прием, когда размещают ссылки на сопутствующие или похожие товары. Итак, есть еще один урл:

http://www.example.com/electronics/computers/laptops/accessories/laptop-bags/targus/

Как видите, конечная страница имеет одинаковый контент, хотя на нее есть 2 разные ссылки. В категории laptops есть подкатегория для аксессуаров, в которую входит категория targus (фирма такая есть).

Вторая ссылка создана для удобства навигации, т.к. сумки для ноутов — это также аксессуар. Если использовать 301-й редирект, то покупатель автоматом будет переадресован на первую ссылку, а это совсем другой раздел и покупатель будет введен в заблуждение. Если он захочет поискать сумку другого производителя, то ему снова придется идти в раздел электроники, затем аксессуаров и т.д. Ему это надо? Да и нам тоже. Проще использовать здесь канонический тэг, указывающий на оригинал:

<link rel="canonical" href="http://www.example.com/travel/luggage/laptop-bags/targus/" />

Все. ПС роботам теперь ясно, где оригинал, а где дубликат. Все довольны.

Альтернативная ссылка

Тэг альтернативной ссылки похож на тэг канонической. В основном он используется в международных или многоязычных SEO целях.

Дублированный контент: блокировка, редирект или канонизиция

<link rel="alternate" hreflang="en" href="http://www.example.com/path" />

<link rel="alternate" hreflang="en" href="http://www.example.co.uk/path" />

<link rel="alternate" hreflang="en" href="http://www.example.com.au/path" />

Канонический тэг полностью исключает все дубликаты из индекса, в то время как альтернативный тэг сохраняет их в индексе. Это 1) помогает ПС (Google) выбрать подходящую страницу в зависимости от региона или языка и 2) устраняет проблему с дублированным контентом.



Источник: profithunter.ru
текущее:

НОВОСТИ

2011 г., «VisMech.ru»