Настройка файла robots.txt
Что такое robots.txt и зачем он нужен?
Robots.txt — это текстовый файл в корне вашего сайта (например, site.ru/robots.txt). Он даёт инструкции поисковым роботам (Яндекс, Google): какие страницы можно индексировать, а какие — нельзя.
Пример простого robots.txt:
User-agent: *
Allow: /
Disallow: /admin/
Disallow: /cart/
Disallow: /checkout/
Sitemap: https://site.ru/sitemap.xml
Этот файл разрешает индексацию всего сайта, но запрещает роботам заходить в папки /admin/, /cart/, /checkout/ (личный кабинет, корзина).
Что я делаю
- Анализирую структуру сайта — смотрю, какие страницы нужны в поиске, а какие только мешают.
- Составляю robots.txt — прописываю правила для всех поисковых роботов (Яндекс, Google, другие).
- Закрываю от индексации мусор — служебные страницы, дубли, корзину, личный кабинет, результаты поиска по сайту.
- Добавляю путь к sitemap.xml — чтобы роботы быстрее находили карту сайта.
- Проверяю через Яндекс.Вебмастер — убеждаюсь, что файл работает корректно.
Какие страницы нужно закрывать от индексации
⚠️ Важно! Robots.txt только рекомендует, а не запрещает. Злоумышленники всё равно могут получить доступ. Для реальной защиты используйте пароль или файл .htaccess. Но для SEO robots.txt — это must have.
Примеры из моей практики
Типовой robots.txt для интернет-магазина на WooCommerce:
User-agent: *
Allow: /
Disallow: /wp-admin/
Disallow: /wp-login.php
Disallow: /cart/
Disallow: /checkout/
Disallow: /my-account/
Disallow: /add-to-cart/
Disallow: /?s=
Disallow: *?sort=
Disallow: *?page_id=
Sitemap: https://site.ru/sitemap.xml
Robots.txt для сайта-визитки на WordPress:
User-agent: *
Allow: /
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /?s=
Sitemap: https://site.ru/sitemap.xml
Как я проверяю результат
Часто задаваемые вопросы
Нужна настройка robots.txt для вашего сайта?
Оставить заявку