Robots.txt для вордпресс (wordpress)

aklex1

Новичок
Регистрация
21 Июн 2017
Сообщения
148
Реакции
34
Баллы
28
Что нужно впервую очередь сделать на сайте? правильно - закрыть от индексации ненужные разделы и дублирующиеся элементы - теги, метки и прочие.
Для этого после создания сайта сразу пропишите настройки для robots.txt который лежать должен в корне сайта.

Вы можете дополнять стандартный набор дополнительными строками для закрытия индекса
Стандартный набор должен быть примерно таким:

Код:
User-agent: Yandex
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /comments
Disallow: */trackback
Disallow: */embed
Disallow: */feed
Disallow: /cgi-bin
Disallow: *?s=
Allow: /wp-admin/admin-ajax.php

Host: http://вашсайт.ru

User-agent: *
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /comments
Disallow: */trackback
Disallow: */embed
Disallow: */feed
Disallow: /cgi-bin
Disallow: *?s=
Allow: /wp-admin/admin-ajax.php

Sitemap: http://вашсайт.ru/sitemap
 

Oberon2005

Новичок
Регистрация
6 Сен 2017
Сообщения
38
Реакции
1
Баллы
8
Использую на WP
Код:
User-agent: *               # общие правила дл¤ роботов, кроме яндекса и Google,
                            # т.к. дл¤ них правила ниже
Disallow: /cgi-bin          # папка на хостинге
Disallow: /?                # все параметры запроса на главной
Disallow: /wp-              # все файлы WP: /wp-json/, /wp-includes, /wp-content/plugins
Disallow: /wp/              # если есть подкаталог /wp/, где установлена CMS (если нет,
                            # правило можно удалить)
Disallow: *?s=              # поиск
Disallow: *&s=              # поиск
Disallow: /search/          # поиск
Disallow: /author/          # архив автора
Disallow: /users/           # архив авторов
Disallow: */trackback       # трекбеки, уведомлени¤ в комментари¤х о по¤влении открытой
                            # ссылки на статью
Disallow: */feed            # все фиды
Disallow: */rss             # rss фид
Disallow: */embed           # все встраивани¤
Disallow: */wlwmanifest.xml # xml-файл манифеста Windows Live Writer (если не используете,
                            # правило можно удалить)
Disallow: /xmlrpc.php       # файл WordPress API
Disallow: *utm=             # ссылки с utm-метками
Disallow: *openstat=        # ссылки с метками openstat
Allow: */uploads            # открываем папку с файлами uploads

User-agent: GoogleBot       # правила дл¤ Google (комментарии не дублирую)
Disallow: /cgi-bin
Disallow: /?
Disallow: /wp-
Disallow: /wp/
Disallow: *?s=
Disallow: *&s=
Disallow: /search/
Disallow: /author/
Disallow: /users/
Disallow: */trackback
Disallow: */feed
Disallow: */rss
Disallow: */embed
Disallow: */wlwmanifest.xml
Disallow: /xmlrpc.php
Disallow: *utm=
Disallow: *openstat=
Allow: */uploads
Allow: /*/*.js              # открываем js-скрипты внутри /wp- (/*/ - дл¤ приоритета)
Allow: /*/*.css             # открываем css-файлы внутри /wp- (/*/ - дл¤ приоритета)
Allow: /wp-*.png            # картинки в плагинах, cache папке и т.д.
Allow: /wp-*.jpg            # картинки в плагинах, cache папке и т.д.
Allow: /wp-*.jpeg           # картинки в плагинах, cache папке и т.д.
Allow: /wp-*.gif            # картинки в плагинах, cache папке и т.д.
Allow: /wp-admin/admin-ajax.php # используетс¤ плагинами, чтобы не блокировать JS и CSS

User-agent: Yandex          # правила дл¤ яндекса (комментарии не дублирую)
Disallow: /cgi-bin
Disallow: /?
Disallow: /wp-
Disallow: /wp/
Disallow: *?s=
Disallow: *&s=
Disallow: /search/
Disallow: /author/
Disallow: /users/
Disallow: */trackback
Disallow: */feed
Disallow: */rss
Disallow: */embed
Disallow: */wlwmanifest.xml
Disallow: /xmlrpc.php
Allow: */uploads
Allow: /*/*.js
Allow: /*/*.css
Allow: /wp-*.png
Allow: /wp-*.jpg
Allow: /wp-*.jpeg
Allow: /wp-*.gif
Allow: /wp-admin/admin-ajax.php
Clean-Param: utm_source&utm_medium&utm_campaign # яндекс рекомендует не закрывать
                            # от индексировани¤, а удал¤ть параметры меток,
                            # Google такие правила не поддерживает
Clean-Param: openstat       # аналогично

# ”кажите один или несколько файлов Sitemap (дублировать дл¤ каждого User-agent
# не нужно). Google XML Sitemap создает 2 карты сайта, как в примере ниже.
Sitemap: http://фулиган.рф/sitemap.xml
Sitemap: http://фулиган.рф/sitemap.xml.gz

# ”кажите главное зеркало сайта, как в примере ниже (с WWW / без WWW, если HTTPS
# то пишем протокол, если нужно указать порт, указываем).  оманду Host понимает
# яндекс и Mail.RU, Google не учитывает.
Host: http://www.фулиган.рф
 
Сверху Снизу