Из данного руководства вы узнаете о том, что такое дубли страниц, как они мешают SEO-оптимизации сайта, какие виды дублей актуальны для Joomla и как с ними бороться.

Что такое дубли страниц?

Полезная информация!
Дублями считаются веб-страницы с одинаковым содержанием, доступные по разным URL-адресам.

Наличие дублей страниц на сайте может затруднить его продвижение в поисковой выдаче, поэтому устранение этой проблемы является одной из первостепенных задач в SEO-оптимизации.

Дублирование страниц присуще любой CMS, независимо от того, платная она или нет, и Joomla не исключение.

Пример дубля страницы на Joomla:

  • http://domen.ru/blog.html
  • http://domen.ru/blog
  • http://domen.ru/blog/
  • http://domen.ru/blog.html/

По всем четырем ссылкам будет открываться одна и та же страница. Представим ситуацию:

Пункт меню ведёт на открытие страницы A (http://site.ru/blog.html), и вы начинаете продвигать данную страницу (делаете перелинковку, продвигаете в социальных сетях, заказываете посты и прочее) с ссылкой на данную страницу. Но поисковая система не предсказуема, и есть вероятность, что будет проиндексирована страница B (http://site.ru/blog), на которую практически нет никаких усиливающих значимость страницы ссылок и сигналов, что сделает все усилия по продвижению страницы А тщетными.

И если у вас ёмкий многостраничный сайт, то управлять его индексированием будет весьма проблематично, учитывая, что поисковый алгоритм может индексировать множество непродвигаемых дублей.

Еще один факт: наличие дублей актуально не только для сайтов, работающих на CMS, и если вы считаете, что на вашем сайте их нет, то читайте дальше.

Какие виды дублей свойственны Joomla?

Существуют следующие виды дублей страниц:

  1. с www и без
  2. с https:// и без
  3. со слешем в конце
  4. с суффиксом расширения
  5. со символом вопроса
  6. с index.php
  7. в формате RSS, PDF и для печати
  8. свойственные компоненту контента
  9. из-за смены алиаса

Рассмотрим каждый из перечисленных видов подробнее.

Дубли с www и без

При создании сайта важно решить как ваш сайт будет фигурировать в поиске и как его будут набирать пользователи с www или без этой приставки. Т. е. http://www.site.ru или http://site.ru.

По умолчанию, если вы ничего не предпримите, то сможете открыть сайт по URL-адресу как с www, так и без его указания. В результате у вас есть дубли всех страниц сайта. Чем чревато: при продвижении домена с www поисковая система может индексировать страницы без www.

Для новых сайтов рекомендуется использовать вариант без www. Но вы должны сами решить и решение может зависеть от того, как поисковые системы проиндексировали ваш сайт на текущий момент, если он уже есть в поисковой выдаче.

Как убрать такие дубли?

Добавить в .htaccess после строки RewriteEngine On следующие строки кода:

# если сайт доступен по https
RewriteCond %{HTTP_HOST} ^www\.(.*) [NC]
RewriteRule ^(.*)$ https://%1/$1 [R=301,L]
# если сайт доступен по http
RewriteCond %{HTTP_HOST} ^www\.(.*) [NC]
RewriteRule ^(.*)$ http://%1/$1 [R=301,L]

Это обеспечит редирект страниц с www на без.

Зеркальные дубли с https:// и без

Эти дубли становятся актуальны после установки SSL-сертификата на сайт.

Пример: https://site.ru/blog и http://site.ru/blog/.

Убрать эти дубли на Joomla 3 и выше можно с помощь правильной установки и настройки SSL-сертификата, в результате чего обеспечивается правильная работа сайта и всех его страниц по защищенному протоколу https. О установке SSL и переводе Joomla на https читайте здесь.

Дубли с символом «/» на конце

Дубли со слешем в конце — это так называемые структурные дубли.

Пример: http://site.ru/blog и http://site.ru/blog/.

Как убрать такие дубли?

Добавить в .htaccess после строки RewriteEngine On следующий код:

RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{REQUEST_URI} ^(.+)/$
RewriteRule ^(.+)/$ https://site.ru/$1 [R=301,L]

В последней строке указываем протокол (http или https) и доменное имя.

Кром того, в Joomla генерируются дубли страниц с множеством слешей, независимо от того, в какой части URL они находятся:

Для устранения таких дублей добавьте после указанного выше еще и этот код:

RewriteCond %{REQUEST_URI} ^(.*)/{2,}(.*)$
RewriteRule . %1/%2 [R=301,L]