Как разрешить индексацию только главной страницы

В последнее время часто возникает задача запретить индексацию всех страниц сайта кроме главной. Задача простейшая, но с нюансами в решении.

Отмечу сразу, первый вариант решения категорически не верный, и приведет скорее всего к появлению в индексе дублей главной страницы со всеми вытекающими последствиями.

Disallow: /
Allow: /index.htm

Правильное решение

Задача решается с помощью спецсимвола $, который отменяет превентивный запрет на индексацию.

Disallow: /
Allow: /$

Аналогичным образом можно запретить индексацию страниц определенной директории.

Disallow: /books/*
Allow: /books/$

Таким образом, индексироваться будет только родительская страница /books/, а все дочерние будут запрещены, например:

  • /books/book-1.htm
  • /books/book-2.htm
  • /books/book-3.htm

В заключение, напомню, что поисковые системы по-разному интерпретируют запреты на индексацию. Например, для Google robots.txt — это просто рекомендация. И далеко не факт, что запрещенные страницы не будут индексироваться.

Иван Данилин
Автор Иван Данилин

Делаю сайты на Вордпресс с 2008 года, в том числе уникальные инструменты для решения сложных бизнес‑задач.

Комментарии
Добавить комментарий