Зачем использовать Disallow: /*?s= в файле robots.txt?

Мы получили уведомление от Google Search Console о том, что один из наших постов в блоге не может быть просканирован. При проверке URL-адреса из Google Search Console он сообщает, что страница была заблокирована следующим в нашем файле robots.txt.

Запретить: /*?s=

Я также спрашиваю, зачем использовать Disallow: /*?s=? Зачем беспокоиться о разборах, содержащих букву s? Если мы удалим его, каков риск? Заранее большое спасибо за любую дополнительную информацию, которой можно поделиться - P


person Paul    schedule 13.04.2021    source источник
comment
На этот вопрос невозможно ответить, ничего не зная о вашем сайте. Предположительно приложение имеет или в какой-то момент имело параметр строки запроса s=, который указывал на то, что не следует индексировать. Это может быть сокращение от сеанса, поиска или, может быть, даже секрета. В идеале вы должны заглянуть в систему управления версиями и найти, кто добавил правило, и каково было их сообщение о коммите; но поскольку вы просите незнакомцев помочь вам угадать, я полагаю, что это не вариант.   -  person IMSoP    schedule 13.04.2021
comment
Верно... первоначальный человек, который поддерживал сайт, покинул здание. Спасибо за ответ.   -  person Paul    schedule 13.04.2021


Ответы (1)


Этот запрос обычно используется на сайтах на основе WordPress. На вашем сайте может быть несколько типов контента, и конструктор сайта хотел разрешить поиск только определенных типов контента с помощью другого способа поиска. Это имеет смысл, например, на сайте магазина, который хочет запретить пользователям искать продукты с помощью настраиваемой формы поиска, чтобы они не блуждали за кулисами сайта. У робота Google есть несколько способов определить, является ли он сайтом на основе WordPress, и, вероятно, поэтому он ищет этот конец пути.

person איש נחמד    schedule 13.04.2021
comment
Благодарю вас! Это действительно сайт на основе WordPress. Мы больше не занимаемся электронной коммерцией на этом сайте, поэтому я предполагаю, что риск удаления Disallow:/*?s= из нашего файла robots.txt относительно невелик. Еще раз спасибо за вклад в наше понимание - очень признателен. - person Paul; 15.04.2021
comment
Благодарим за отзыв. Дополнительную информацию о безопасности WordPress см. на официальном веб-сайте WordPress. - person איש נחמד; 15.04.2021