ГлавнаяБлог Войны клонов: использование канонических URL

Войны клонов: использование канонических URL

Владельцы активно развивающихся интернет-ресурсов нередко сталкиваются со следующей проблемой – одна и та же страница с одинаковым содержанием может быть найдена по нескольким различным адресам. Такое положение дел является абсолютно нормальным, но о-очень «не нравится» поисковым роботам, которые оказываются в положении буриданова осла – из множества страниц им необходимо выбрать одну, подлежащую отображению в результате. Правда, в отличие от воображаемого животного, боты не имеют обыкновения «умирать от голода» и вынуждены самостоятельно принимать решение о выборе предпочтительной страницы...или пользоваться подсказкой атрибута rel=«canonical»!

Справка
Атрибут rel=canonical, впервые введенный поисковой системой Google в феврале 2009 года, остается актуальным и по сей день. Этот атрибут указывает поисковым роботам на страницу, являющейся предпочтительной в ходе индексации.

Наиболее частыми причинами появления клонов/дублей страниц эксперты поисковиков Bing, Google и техподдержки Tsohost называют следующие:

  • Публикация относится сразу к нескольким категориям – контент может быть найден по нескольким отдельным URL-адресам из-за различия в работе CMS;
  • Динамический контент – в зависимости от особенностей пользовательского сеанса, содержание страницы изменяется;
  • Некорректная конфигурация сервера – при неверной установке сертификата SSL поисковый робот не может определить, какая именно версия сайта должна быть использована: https:// или http://.

«Клоны переходят в наступление»

ДублиДублями считаются два (или больше) документа/страницы, имеющих одинаковое содержание.

«Логика» поискового робота проста: пользователь не желает просматривать в выдаче системы одно и то же содержимое несколько раз. Значит, при обнаружении дубля требуется исключить его из индексации!

(Есть и еще одна неафишируемая причина нелюбви поисковых систем к клонам: ни один поисковик «не хочет» заниматься монотонной постоянной обработкой миллионов дублированных интернет-страниц, расходуя на этот скучный процесс значительную часть своих мощностей)

А это значит, что даже если какая-то информация размещена на нескольких страницах, в выдаче поисковой системы отображается только одна из них! И совсем не факт, что URL, выбранный роботом, является оптимальным. Более того, он даже не обязательно на самом деле ведет к оригинальной публикации!

Канон есть канон

Каноническая страница – первоисточник, первоначальная страница, благодаря которой результаты выдачи поисковой системы удовлетворяют целям автора контента. Каноническая ссылка, имеющая атрибут rel=canonical, указывает поисковому роботу на страницу, выбранную в качестве канонической.

Главными правилами проставления атрибута специалисты Google называют:

  • Дублированные страницы должны содержать ссылки на канонический URL-адрес;
  • Каноническая страница должна реально существовать и не возвращать ошибку 404;
  • Каноническая страница не должна быть закрыта от индексации;
  • Атрибут rel=canonical должен быть включен в код HTML;
  • Атрибут rel=canonical не должен использоваться на одной странице несколько раз.

Как предотвратить дублирование контента

Запретить поисковым роботам самостоятельно «устанавливать правила» поисковой индексации достаточно просто. Для этого достаточно использовать атрибут rel=canonical в <head> тегах каждой страницы, содержащей одинаковый контент.

Магическая формула:
<link rel=«canonical» href=«нужный_адрес_URL»>

При этом дополнительные свойства нужного URL-адреса канонической страницы – связанные сигналы, Page Rank и т.п. – автоматически переносятся на указанную страницу с дублированных.

Ошибки, которые могут дорого обойтись

Эксперты Google выделили несколько основных типов ошибок, которые, как показывает статистика, особенно «популярны» среди оптимизаторов и веб-мастеров, проставляющих атрибут rel=canonical:

  1. Первая – не всегда лучшая

Несколько страниц навигацииЕсли ресурс имеет несколько страниц с нумерацией:

  • пример.com/статья=заглавие=1;
  • пример.com/статья=заглавие=2;
  • пример.com/статья=заглавие=3,

и страницы № 2 и № 3 не являются дубликатами страницы № 1, использование атрибута rel=canonical для страницы №1 в качестве канонической – ошибка! Это ведет к «выпадению» всех последующих страниц сайта из индекса.

  1. Абсолютное не равно относительному

Абсолютное не равно относительномуНесмотря на то, что атрибут rel=canonical может использоваться как для относительных, так и для абсолютных ссылок, специалисты Google советуют отдать предпочтение именно последним – относительные ссылки в этом случае вычисляются на их основе. Если абсолютная ссылка на каноническую страницу записана без указания протокола (http:// или https://), то поисковые алгоритмы проигнорируют указание на каноничность выбранной страницы.

  1. rel=canonical используется в <body>

Использование в теге bodyАтрибут rel=canonical не должен использоваться в разделе документа кода <body>, а должен быть включен в раздел <head> HTML-кода – иначе он будет проигнорирован поисковыми алгоритмами.

Справка
Каноническая ссылка не является строгой директивой, «обязательной к исполнению» поисковыми алгоритмами, и носит рекомендательный характер. При отсутствии атрибута поисковые роботы самостоятельно определяют каноническую страницу.

Использование атрибута rel=canonical особенно актуально для торговых интернет-площадок с большим количеством товаров: продвижение магазина с 5 000 ежедневно пополняемых основных страниц и 10 000 дублированных без указания канонических страниц может составлять серьезную проблему и привести к штрафным санкциям со стороны поисковых систем.

Важно помнить, что использование атрибута rel=canonical:

  • Не выполняется в файле robots.txt.;
  • Не осуществляется с помощью инструментов удаления URL-адресов;
  • Не применяется для разных адресов одной и той же страницы.
Последние записи: Что ищут пользователи на разных типах устройств Коммерческие факторы ранжирования Фильтр Bad Neighborhood Быстрые ссылки в Яндекс и Google Графики в разделе «Внешние ссылки» сервиса «Яндекс.Вебмастер» Алгоритм «Палех»: счастье — это когда тебя понимают Поисковый индекс Google mobile-first индекс: мы будем жить теперь по-новому? Баден-Баден: «Говорите по-человечески» Смотреть, чтобы видеть: обновленный Вебвизор 2.0 Как присвоить регион сайту в Яндексе? 50 ошибок, ухудшающих юзабилити сайта Улучшаем юзабилити сайта: 64 совета о том, как сделать сайт удобнее Как правильно разработать и оптимизировать структуру сайта Правильная оптимизация текстов на сайте Почему SEO-продвижение не может быть быстрым Почему не стоит продвигать сайт самостоятельно Турбо-страницы Скорость обхода страниц Отчет по расписанию – новая функция Яндекс.Метрики Почему SEO-продвижением следует заниматься постоянно Контекстная реклама Яндекса – любая картинка превращается в видео! Что выбрать – SEO или контекстную рекламу? Юзабилити сайта – что это такое и как провести его аудит Индекс качества сайта ИКС – новый показатель качества Значки в поисковой выдаче Яндекса
КОНТАКТНАЯ ИНФОРМАЦИЯ
  • 620010, г. Екатеринбург
    ул. Грибоедова, 32/20, оф. 707, 709
    Тел. +7 (343) 204-78-80
    E-mail: client@artena.ru
  • 625049, г. Тюмень, ул. Новосибирская, 131.
    Тел. +7 (3452) 39-65-52,
    E-mail: tumen@artena.ru
  • 119331, г. Москва, пр-т Вернадского, 29, офис 508
    Тел. +7 (495) 128-21-42
    E-mail: msk@artena.ru
Похвалить
Пожаловаться
Посоветовать