Что такое краулинговый бюджет и зачем его оптимизировать? «Промотехника»
Проследить за тем, какие страницы посещались краулерами, можно с помощью логов сервера. По умолчанию на большинстве хостингов эта опция включена. Логи записываются в специальный файл – access.log, который можно найти в папке logs по протоколу FTP. На относительно маленьком проекте о краулинговом бюджете можно не задумываться, т.к. Его количества хватает с избытком на то, чтобы проиндексировать новые страницы. Количество публикаций новых материалов ниже, чем выделенная квота со стороны поисковика.
Краулинговый бюджет может остаться прежним, но расходоваться он будет эффективнее. Каждый из них – трата краулингового бюджета, поэтому задумайтесь, нужны ли на сайте все имеющиеся переадресации. Мусорные ссылки и дубли лучше всего заблокировать посредством sitemap.xml.
Краулинговый бюджет
В дополнение можно настроить постраничный last-modified. С его помощью лимит не будет тратиться на то, что в последнее время как увеличить краулинговый бюджет не изменялось. По опыту могу сказать, что проработав некоторые моменты, возможно улучшить результаты по своему сайту.
Обязательно проработайте файл robots.txt, закрыв в нем от индексации все дежурные страницы (например, директории админки, страницы входа, формы, корзины и т.д.). Также проблема актуальна, если старые страницы периодически редактируются, но поисковики с ощутимой задержкой обновляют информацию в индексе. Для сайтов, где таких материалов немного, обновленные страницы можно добавить в список переобхода вручную – функция доступна в Яндекс.Вебмастере и Google Search Console.
По какому принципу рассчитывается краулинговый бюджет?
Краулинг — это индексация, поэтому весь лимит быстро тратится именно из-за ошибок индексации. Не все боты поисковиков могут обрабатывать JavaScript, и не все делают это быстро и качественно. Пока проблема существует, Google советует использовать динамический рендеринг. Быстро узнать, в индексе ли страница сайта, можно с помощью онлайн-инструмента.
Сохранить моё имя, email и адрес сайта в этом браузере для последующих моих комментариев. Да, в панелях вебмастеров есть специальные настройки, в которых можно задавать ограничения на скорость индексирования. На проекте по продвижению светового оборудования мы определили пул дублей страниц. К одним и тем же товарам пользователь мог дойти разными путями. Например, к определенному светильнику — через категорию светильников либо через категорию брендов.
Удалите висячие узлы, чтобы не терять ссылочный вес страниц
То есть, от него напрямую не зависит, какие позиции будет занимать сайт в поисковой выдаче. Ваша задача проверить, что все страницы, которые не должны индексироваться закрыты любым из этих https://deveducation.com/ способов. Есть две интерпретации этого определения, с точки зрения вебмастера и точки зрения поисковой системы. В целом, означают одни одно и тоже, но суть у них совершенно разная.
И происходить это будет тем чаще, чем больше ссылочная масса. В файле robots.txt выбираем страницы, которые реиндексировать не надо (потому что они не менялись) и указываем для таких параметр Last-modified. Важно помнить, что краулинговый бюджет назначается каждому сайту индивидуально, на основе его популярности, востребованности и серверной доступности. Вся история про лимит индексации завязана на Google, поэтому самый удобный способ — это посмотреть статистику обхода в Google Search Console. Краулинговый бюджет рассчитывается для каждого сайта отдельно, исходя из его пользовательского спроса и доступности сервера.
Применить динамическое отображение контента
Конечно, нужно разобраться, почему такие страницы попали в индекс. Вероятно, имеется одна или несколько причин из перечисленных выше. В идеальном варианте теперь в индекс должны попадать полезные страницы, до которых роботы не успевали дойти.
- Чтобы страницы сайта попали в индекс поисковых систем и после этого в выдачу, роботы (краулеры) Яндекса и Google должны найти и оценить эти страницы.
- Подробнее про обработку страниц на JavaScript Google рассказал в Центре поиска.
- Оптимизация краулингового бюджета обычно не является проблемой для небольших веб-сайтов, но для крупных сайтов, с тысячами URL-адресов, это важно.
- Краулинговый бюджет сайта определяет количество документов, которое поисковый робот должен обойти за одно посещение или другой временной промежуток.
- Это неплохой результат и представлен он был, в основном, битыми ссылками (код 404), которые мы впоследствии удалили.
Это делается поисковой системой умышленно, чтобы определить качество площадки и количество контента. Именно поэтому очень важно, чтобы сайт не висел пустым и постоянно обновлялся. Но когда речь идет о большом интернет-магазине или информационном портале, то работа краулера становится очень важной для оптимизатора.