Netpeak Spider

Netpeak Spider — учимся понимать SEO и исправляем ошибки на сайте.

Я все еще продолжаю дружиться с SEO. Мне кажется это будет вечная история, потому что каждый раз, когда подхожу к этому вопросу, узнаю кучу новых ньюансов и фишек.

Сегодня делюсь необычной историей: решил я опробовать новый SEO-софт (новый софт для меня вечно как триггер :)), начал разбираться и был оч приятно удивлен.

Их поддержка БЕСПЛАТНО показала на примере, как делается аудит сайта, указала на ошибки, которые мешают нормальному продвижению моего блога и, даже, подсказала как их исправить и насоветовала кучу полезных плагинов.

Для тех, кто не профи — идеальный вариант, когда вам не только дают сервис, с помощью которого можно эти ошибки исправить, но еще и готовы помочь их найти :))

Смотрите, что у нас получилось, и какие промежуточные итоги можно подвести на основе технического SEO-аудита на примере моего блога blog.smmco.ru с помощью программы Netpeak Spider.

1. Настраиваем краулер и запускаем сканирование

Процедура проведения базового экспресс-аудита максимально проста.

Для запуска сканирования в Netpeak Spider вам достаточно:

  1. Запустить программу.
  2. Открыть раздел с настройками в главном меню программы.
  3. Установить настройки по умолчанию, нажать «ОК» и закрыть окно.
  4. На боковой панели установить рекомендуемые параметры по умолчанию.
  5. Ввести адрес сайта и нажать «Старт».

2. Анализируем результаты сканирования

По окончанию анализа на блоге было найдено 2 типа ошибок высокой критичности и 6 типов ошибок средней критичности.

2.1. Битые и недоступные ссылки

Проблемы, связанные с битыми ссылками, к счастью, оказались единственными из числа ошибок высокой критичности.

Среди проблемных ссылок оказались две ссылки на файл xmlrpc.php, а также на несколько загадочных ссылок, скрытых в коде.

Пытаясь разобраться с таинственным php-файлом, я выяснил, что абсолютное большинство вебмастеров, работающих с WordPress, рекомендуют деактивировать этот файл в принципе. Изначально он предназначался для удалённого доступа к сайту, но позже стал источником серьёзной уязвимости в безопасности сайта. Для решения проблемы лучше всего его отключить при помощи специального плагина Disable XML-RPC, а также закрыть доступ к файлу в robots.txt:

Disallow: /xmlrpc.php

Disallow: /xmlrpc.php?rsd

Что касается второго блока ссылок, я подозреваю, что они появились в процессе неправильной настройки какого-то из плагинов. Чтобы найти место расположения этих ссылок, кликаем правой кнопкой мыши по строке с нужным URL и в контекстном меню выбираем «Входящие ссылки». Таким образом, стало понятно, что каждая из ссылок встречается лишь единожды.

Удалить их можно вручную, но удобнее будет воспользоваться специальным плагином Broken Link Checker. С учётом того, что природа этих ссылок не до конца мне ясна, лучше перед этим на всякий случай сделать бэкап сайта, чтобы можно было его восстановить в случае каких-либо критических проблем.

2.2. Редиректы

Программа показала, что на сайте присутствует 33 редиректа с 3хх кодом ответа. В данный момент большая часть выставленных на сайте 301-х редиректов ведёт с автоматически сгенерированных кратких URL на полноценные ЧПУ («человекопонятные урлы»), что в общем абсолютно корректно и не имеет негативного влияния на SEO блога.

Помимо этого, на сайте были обнаружены 77 страниц с Refresh-редиректом, что уже не так хорошо и правильно. Считается, что использование такого редиректа влечёт за собой потерю ссылочного веса, а также может создать у поисковиков впечатление, что вы используете спамные методы продвижения. К тому же, эти страницы не имеют шансы проиндексироваться поисковыми роботами.

Кстати, именно те страницы, на которых стоит Refresh редирект, должны индексироваться и приносить трафик. Код ответа для индексируемых страниц должен быть исключительно 200 OK, а в данный момент таких страниц на сайте нет принципе.

Пока ничего не стал с этим делать, т.к. немного меняю структуру сайта, но сам факт идентификации такой проблемы — важен, мне кажется, сильно.

2.3. Картинки

В стандартных настройках программы максимальный размер изображения ограничен 100 килобайтами, так что все картинки, которые весят более 100 Кб, определяются как изображения с ошибкой «Максимальный размер изображения».

Всего у меня на блоге оказалось 55 таких изображений, включая файлы .jpeg, .png и .gif. Средний размер составляет порядка 100-300 килобайт, что, на мой взгляд, не критично. Но изображения размером свыше 500 килобайт имеет смысл аккуратно и без потери качества сжать. Можно это делать при помощи специализированных плагинов вроде Imagify и Compress JPEG & PNG images, либо же через сервис TinyPNG.

2.4. Скорость ответа сервера

Рекомендуемое время ответа сервера составляет не более 500 мс. На моём же блоге, как выяснилось, скорость ответа сервера для 325 страниц составляет от 655 до 23543 мс. Настолько критическое превышение допустимой нормы может объясняться спецификой установленного шаблона, либо же скоростью хостинга, на котором сайт размещён. Следовательно, устранить проблему можно несколькими путями:

  • установить плагин для кеширования и убрать лишние плагины, создающие дополнительную нагрузку на сайт;
  • сменить шаблон, выбрав тот, у которого лучше оптимизирован код;
  • сменить хостинг-провайдера.

Я, собственно, пошел пока вторым путем, поэтому на главной, поехало оформление немного (на самом деле сильно ахаха).

2.5. Инструкции по индексации

На сайте не было обнаружено каких-либо ошибок, связанных с Meta Robots и robots.txt, но зато нашлись 132 страницы, закрытые от поисковых роботов при помощи X-Robots-Tag. Часть закрытых для индексации адресов следует открыть. Это относится, в первую очередь, к документам типа application/json (указан в столбце Content-Type), так как они влияют на отображение сайта. Если у поисковых роботов не будет доступа к ним, для поисковика сайт будет выглядеть иначе, нежели для большинства пользователей.

2.6. Протокол

С учётом того, что на сайт не был переведён на безопасный протокол, программа показывает для всех страниц ошибку низкой критичности «Не HTTPS-протокол». В среде SEO-специалистов мнения о необходимости переезда на HTTPS для каких-либо сайтов, кроме Ecommerce, сильно расходятся. Думаю, рано или поздно будет не лишним перевести блог на HTTPS, подключив один из бесплатных SSL-сертификатов типа Let’s Encrypt.

UPD: заявочку на подключение уже отправил

2.7. Атрибут Canonical

Судя по списку ошибок на боковой панели, на сайте не было обнаружено каких-либо особенно критичных проблем с атрибутом rel=canonical. Но я всё же решил внимательнее ознакомиться со списком страниц, на которых размещены канонические ссылки.

Для этого я открыл на боковой панели раздел «Отчёты», а на нём — вкладку «Сводка». В пункте «Статус страницы» я выбрал значение «Canonicalized», чтобы увидеть полный список страниц, на которых стоит rel=canonical. Для некоторых из них, например, для профилей юзеров лучше использовать Meta Robots с директивой noindex, follow.

Решить эту проблему помогает, обычно, использование плагина Yoast SEO, который у меня уже стоит, но как-то некорректно настроен.

На самом деле, это даже не все вопросы, про которые мы поговорили, остальные были больше не по технической части, а, больше, по моментам поведенческим (аля, что не хватает блока «похожих записей, которые могут быть интересны читателю» в конце статьей) и вообще тупым вопросам от меня, типа «А как влияет возраст домена на индексацию?» или «А лучше переезжать на другой домен или просто сделать новый сайт и настроить редиректы на аналогичный контент?», с которыми, собственно, ребята успешно справились, доказав не только свою компетенцию, но и стрессоустойчивость :))

Ну и тут, конечно, удержать было сложно, так что вот промо для подписчиков:

Регистрируемся по специальной ссылочке, которую мне сделали: Netpeak Spider, про покупке сервиса на год (https://netpeaksoftware.com/ru/buy)можно получить скидку 40%, и еще 15% по промокоду.

Промокод на скидку 15%: LazyMarketerNS

После активации лицензии (даже минимальной) — пишите в поддержку, что хотели бы созвониться и проконсультироваться со специалистом :))

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *