Материал предоставлен Netpeak Software
Битые ссылки явно не красят. И решать эту проблему нужно быстро, поскольку их наличие ведет как к пессимизации сайта, так и к оттоку недовольных посетителей. Впрочем, вопрос оперативности решаем с помощью Netpeak Spider.
Почему это плохо?
Во-первых, разберемся, что это значит. Битая ссылка — ссылка, которая ведёт на несуществующий URL. И дело не в том, что поисковые роботы, увидев внутренние ссылки на страницы с (например) 404 ошибкой, станут пессимизировать сайт или отдельные его разделы в поисковой выдаче (впрочем, Google отмечает, что никаких санкций непосредственное наличие 404 ошибок на сайте за собой не несет).
Опасность и в другом: посетитель может не захотеть продолжать сеанс на сайте и вообще возвращаться к вам когда-либо. В основном это касается новых пользователей, у которых нет кредита доверия к вам.
В итоге. Если переход был из поисковой системы, пользователь вновь обратится к поисковику с недавним запросом и зайдёт на сайт вашего конкурента.
Если так сделает много пользователей, поисковый робот это учтёт и предположит, что контент на сайте нерелевантен запросу. Добро пожаловать обратно в ТОП-100 и общество анонимных свидетелей нулевого трафика.
Как обнаружить?
Своими руками. Относительно небольшие ресурсы действительно можно проверить вручную, однако точность такого поиска зачастую низка, поскольку можно что-то да пропустить.
Инструменты вебмастера Яндекс и Google. Поисковики могут предоставлять отчёт о наличии битых ссылок на вашем сайте. Только учтите: как правило, поисковые роботы перепроверяют страницы раз в несколько недель. То есть вы с большой вероятностью получите при проверке неактуальную информацию, а сверять ошибки в режиме «реального времени» и вовсе почти невозможно.
Десктопные программы для внутреннего аудита. Хороши они тем, что позволяют оценить состояние связей на сайте в настоящем времени, к тому же глазами поисковика. Помимо того, что они помогут определить битые пути, можно будет также комплексно проанализировать перелинковку: внешние и внутренние линки, с неправильным форматом URL, «nofollow» ссылки. Всех их определяет Netpeak Spider.
Виды
Причин возникновения предостаточно:
- Запрашиваемый URL не связан ни с одним DNS и не расположен ни на одном сервере.
- Коды ответа 403, 404, 500. Они, соответственно, указывают на отказ в доступе, отсутствие страницы и ошибку сервера.
- Ссылки на внешние ресурсы, которые могли переехать, провести реструктуризацию или банально удалить страницу.
- Редирект на несуществующую или удалённую страницу.
Избавляемся от битых ссылок
Проводим сканирование сайта. Фильтруем по битым ссылкам. В Netpeak Spider это делается следующим образом: фильтр «4хх ошибки: Client Error» → Сводка по текущей таблице → Входящие ссылки.
Чтобы сайт не был похож на инкубатор 404-ошибок, сканируйте его несколько раз в неделю (если он большой и постоянно изменяется). Делать это лучше с помощью декстопных приложений, позволяющих оценивать ситуацию в режиме реального времени.
Подводим итоги
Само наличие 404-го ответа на сайте вполне допустимо. Представьте: пользователь заходит к вам и после слэша прописывает «абракадабру». Понятно, что такой страницы не существует, однако внутри ресурса ссылки ни в коем случае не должны вести на 404-ю.
Более того, правильно оформить 404-ю — это целое искусство. В подобных ситуациях желательно информировать пользователя, что такой страницы больше не существует, предложить ему переход на другую страницу (например, на главную) или оставить ссылку на карту сайта.
Так у вас гораздо больше шансов задержать у себя пользователя, перешедшего по недействительному адресу. Совсем плохо, когда они ведут на 404-е с «мёртвым» текстом.
Помните, отслеживать битые пути можно разными способами: от кустарного «своими руками» и до глубинного анализа с помощью десктопных программ, таких как Netpeak Spider. Всё зависит от того, какого размера ваш сайт, и насколько вы заинтересованы в оперативности внесения правок.