Содержание:
- Коды ответа сервера: разновидности и их значения
- Как проверить код ответа сервера
- Заставляем коды работать по полной
Коды ответа сервера: разновидности и их значения
Внешне код ответа сервера страницы — это три цифры, в них зашифрована информация о ее состоянии. При обращении к странице сайта его проверяет и браузеры, и поисковые системы. Собственно, в зависимости от кода ответа сервера поисковые пауки понимают, что от них требуется: сканировать страницу сейчас, отложить сканирование на потом, вычеркнуть URL из дальнейшей проверки и т. д. Иными словами, по этим трём цифрам роботы ориентируются, что им делать дальше.
Для классификации коды ответа сервера страницы были сгруппированы в соответствии с основным значением и разбиты на так называемые классы состояния. Разновидность класса зашифрована в первой цифре ответа, которая и определяет состояние страницы. Две другие цифры раскрывают подробности.
Рядом с кодами ответа сервера указывают краткое определение его значения. Такое определение призвано упростить жизнь людям, которые, в отличие от ботов, могут не знать значение цифровой комбинации.
Существует 5 классов состояния: 1XX, 2XX, 3XX, 4XX и 5XX. Рассмотрим их и познакомимся со значениями основных кодов.
1XX Informational
Когда страница отвечает кодом ответа сервера, начинающимся с индекса 1, мы имеем дело с информационными кодами.
Среди информационных кодов наиболее распространены:
100 Continue — это своеобразное подтверждение от сервера о том, что первоначальный запрос успешно принят, можно продолжать начатые действия (например, сканирование);
102 Processing — запрос получен сервером, и на данном этапе он проходит процедуру обработки. Это не означает, что процесс вот-вот завершится, но отключаться не стоит.
Информационные коды носят временный характер. Они являются подтверждением получения запроса и его обработки.
2XX Success
«Успешные» коды являются знаком подтверждения выполнения обработки в ответ на запрос системы.
200 OK — самый важный код, который характеризует состояние всех страниц сайта, открытых для сканирования. Иными словами, этот код должны содержать все URL, которые должны быть проиндексированы и показаны в выдаче. 200 OK означает, что сервер получил запрос, успешно и без каких-либо проблем его обработал.
207 Multi Status — принятый запрос успешно обработан, в процесс работы выполнено несколько действий.
Коды группы 2XX должны отдавать все страницы ресурса, которые продвигаются в поисковых системах.
3XX Redirection
Перенаправляющие коды информируют робота о необходимости повторного запроса в связи с переездом документа или страницы на новый адрес.
300 Multiple Choices выпадает, когда запрос направлен на адрес, который ссылается на несколько страниц (документов), в этом случае невозможно определить, какую из них необходимо использовать.
301 Moved Permanently — сообщает об окончательной смене места жительства документа. Используется для того, чтобы не потерять «вес» ранее существующей страницы, при переезде на новый адрес. Роботы, видя этот код, не сканируют запрошенную страницу, но переходят по указанной ссылке, продолжая свою работу там.
302 Found / Moved Temporarily отдается страницами, которые были перемещены на другой адрес, но лишь на некоторое время, и в будущем планируется их возвращение на первоначальное место. Код сообщает ботам поисковых систем, что сама страница должна остаться в индексе, перенос носит временный характер.
304 Not Modified позволяет сэкономить ресурсы на повторное сканирование документа или страницы, в которые не было внесено изменений с момента ранее выполненного процесса сканирования. В индексе страницы с таким кодом участвуют, но при этом используются данные, полученные в процессе предыдущего сканирования.
Отдавая ответ кода этой группы, сервер указывает ссылку на новый адрес расположения документа. Эта ссылка содержится в заголовке Location.
4XX Client Error
Коды этого класса сообщают об ошибке, возникшей со стороны клиента.
400 Bad Request сообщает о наличии синтаксической ошибки в запросе.
401 Unauthorized чтобы получить доступ к странице (документу) требуется ввести пароль или пройти регистрацию и повторить попытку запроса после авторизации.
403 Forbidden запрещает доступ к документу. Часто выпадает, если запрещён вход с конкретного IP.
404 Not Found — всем знакомая ошибка «Страница не найдена». Появляется, если документ или страница не найдены в момент запроса, а также в случае ошибки в написании адреса.
Иногда бывает так, что страница внешне соответствует странице 404 ошибки, но на самом деле отдает код 200. Их нужно обязательно найти и исправить.
410 Gone информирует пользователя о том, что им была запрошена удалённая страница (документ). Код 410 означает, что документ существовал ранее, но теперь удалён безвозвратно. В ответ на этот тип ошибки последующая попытка сканирования проводиться не будет, запрос на страницу повторно не направляется и из будущего «списка дел» поискового бота она будет удалена навсегда.
451 Unavailable For Legal Reasons информирует об официальном юридическом запрете использовать запрашиваемый документ. Применяется, например, в рамках защиты авторских прав или наложении вето со стороны государственных структур. Уже ставшей легендой история гласит, что число выбрано не случайно и отсылает нас к известному произведению Рея Брэдбери (451 градус по Фаренгейту является температурой, при которой происходит воспламенение бумаги — метафора цензуре).
Вместе с указанием кода ответа сервер сообщает о характере ошибки. Исключение составляют запросы с методом HEAD.
5XX Server Error
Коды ответа, входящие в группу 5XX, сообщают о сбоях в работе серверов.
500 Internal Server Error может говорить о наличии любой ошибки сервера, которые невозможно отнести ни к одному из заданных кодов этого класса состояния.
503 Service Unavailable сообщает о временных недочётах со стороны сервера, носящих технический характер, например, о чрезмерной загруженности из-за превышения допустимого количества запросов.
504 Gateway Timeout — код, который означает, что окончено время ожидания ответа от вышестоящего сервера, на который посылает запрос основной сервер, являющийся в данном случае прокси-сервером или шлюзом.
505 HTTP Version Not Supported — от сервера пришёл отказ в ответе на запрос из-за использования другой версии протокола HTTP.
Информируя о серверной ошибке, система также указывает причину её возникновения.
Рассмотрев, каким должен быть ответ сервера в наиболее распространённых ситуациях, переходим к способам проверки кода, который отдают страницы сайта. Проверка даёт возможность своевременно получить данные о неверном коде и скорректировать его.
Как проверить код ответа сервера
Существует масса способов, которые можно использоваться, чтобы узнать ответ сервера.
Например, увидеть код страницы интересующего сайта можно в панели разработчика во вкладке Network. В разных браузерах она вызывается разным способом. Если Вы используете Google Chrome, откройте сайт, нажмите F12, в открывшемся окне кликните по вкладке Network и обновите страницу. В левой части открывшегося поля выбираем название страницы. Теперь ищем данные о коде ответа сервера, они указаны в столбце Status.
В сети также можно подобрать под себя сервисы бесплатной проверки. Одним из таких софтов является SEOB. Здесь всё элементарно: для проверки необходимо ввести ссылку на тестируемую страницу сайта и нажать «Проверить заголовки».
Ещё один простой в использовании сервис, не требующий регистрации, — Checkmy. Как и в SEOB, здесь достаточно указать ссылку на страницу сайта или документ и нажать «Отправить запрос». Результат появится перед вами через несколько мгновений.
Названные сервисы, как и практически все бесплатные инструменты проверки, позволяют осуществлять проверку только отдельных адресов. Для массовой проверки придётся использовать более продвинутые платные сервисы, например, Netpeak Spider.
Заставляем коды работать по полной
Сама по себе неприятная для посетителя сайта ситуация, когда вместо необходимой ему информации он видит 404 Not Found, при умелом подходе и капле креатива может поднять настроение юзеру и повысить его лояльность к сайту. Дополнив эти цифры интересными элементами, добавив странице 404 стиля или юмора, можно добиться отличного результата. Рекомендуем не пренебрегать дополнительным инструментом для налаживания доверительных отношений с посетителями сайта.
Зная, как работают коды ответа сервера, можно приступать к проверке и, в случае необходимости, корректировке. Это необходимо для правильной индексации страниц сайта. В противном случае можно не дождаться сканирования важных для продвижения URL или потратить ограниченный краулинговый бюджет на обработку страниц, не подлежащих индексации. Основные страницы, которые вы хотите видеть в поисковой выдаче, должны содержать ответ 200 OK. Не последнее значение имеет правильный подбор кодов для тех страниц, сканирование которых не принесёт особой выгоды, при этом загрузит роботов поисковых систем лишней ненужной работой.
Помимо налаживания рабочих отношений с поисковыми роботами, используя собственную фантазию и нестандартные решения можно проявить заботу о пользователях, что сделает их пребывание на сайте приятным, даже в случае отсутствия запрашиваемых данных.
Какие интересные варианты оформления страницы с кодом 404 встречались вам?