Articles / juni 12, 2021

wat betekent Crawl Budget voor Googlebot

maandag 16 januari 2017

onlangs hebben we een aantal definities gehoord voor “crawl budget”, maar we hebben geen enkele term die alles zou beschrijven waar “crawl budget” voor staat extern. Met deze post zullen we verduidelijken wat we eigenlijk hebben en wat het betekent voor Googlebot.Ten eerste willen we benadrukken dat crawl budget, zoals hieronder beschreven, niet iets is waar de meeste uitgevers zich zorgen over hoeven te maken. Als nieuwe pagina ‘ s de neiging om te worden gekropen op dezelfde dag dat ze zijn gepubliceerd, crawl budget is niet iets webmasters nodig hebben om zich te concentreren op. Evenzo, als een site heeft minder dan een paar duizend URL ‘ s, de meeste van de tijd zal efficiënt worden gekropen.

prioriteren wat te crawlen, wanneer en hoeveel resource de server die de site host kan toewijzen aan crawlen is belangrijker voor grotere sites, of voor sites die automatisch pagina ‘ s genereren op basis van URL-parameters, bijvoorbeeld.

Crawl rate limit

Googlebot is ontworpen om een goede burger van het web te zijn. Kruipen is de belangrijkste prioriteit, terwijl ervoor te zorgen dat het niet degraderen van de ervaring van gebruikers die de site bezoeken. We noemen dit de” crawl rate limit”, die de maximale fetching rate voor een bepaalde site beperkt.

simpel gezegd, dit geeft het aantal gelijktijdige parallelle verbindingen weer die Googlebot kan gebruiken om de site te doorzoeken, evenals de tijd die het moet wachten tussen de fetches. De crawl rate kan op en neer gaan op basis van een paar factoren:

Crawl health: als de site echt snel reageert voor een tijdje, de limiet gaat omhoog, wat betekent dat meer verbindingen kunnen worden gebruikt om te kruipen. Als de site vertraagt of reageert met server fouten, de limiet daalt en Googlebot kruipt minder.
limiet ingesteld in de Zoekconsole: Website-eigenaren kunnen Googlebot ‘ s crawling van hun site verminderen. Merk op dat het instellen van hogere limieten niet automatisch verhoogt kruipen.

Crawl vraag

zelfs als de crawl rate limiet niet wordt bereikt, als er geen vraag is van indexering, zal er een lage activiteit zijn van Googlebot. De twee factoren die een belangrijke rol spelen bij het bepalen van de crawl-vraag zijn::

Populariteit: Url ‘ s die populairder zijn op het Internet hebben de neiging om vaker te worden gekropen om ze frisser in onze index te houden.
Staalheid: onze systemen proberen te voorkomen dat url ‘ s vervallen in de index.

bovendien kunnen sitebrede gebeurtenissen zoals siteverplaatsingen leiden tot een toename van de vraag naar crawl om de inhoud onder de nieuwe URL ‘ s opnieuw uit te lezen.

crawl rate en crawl demand samen definiëren we crawl budget als het aantal URL ‘ s dat Googlebot kan en wil crawlen.

factoren die van invloed zijn op crawl budget

volgens onze Analyse kan het hebben van veel url ‘ s met een lage toegevoegde waarde een negatieve invloed hebben op het crawlen en indexeren van een site. We ontdekten dat de URL ‘ s met een lage toegevoegde waarde in deze categorieën vallen, in volgorde van betekenis:

Faceted navigation and session identifiers
On-site duplicate content
Soft error pages
Hacked pages
Infinite spaces and proxies
Low quality and spam content

het verspillen van serverbronnen op pagina ‘s als deze zal crawl-activiteit afvoeren van pagina’ s die daadwerkelijk waarde hebben, wat een aanzienlijke vertraging kan veroorzaken bij het ontdekken van grote content op een site.

International Blogging Network

wat betekent Crawl Budget voor Googlebot

Crawl rate limit

Crawl vraag

factoren die van invloed zijn op crawl budget

Top questions

heeft site snelheid invloed op mijn crawl budget? Hoe zit het met fouten?

is kruipen een ranking factor?

tellen alternatieve URL ‘ s en ingesloten content mee in het crawl-budget?

kan ik Googlebot bedienen met de” crawl-delay ” – richtlijn?

heeft de nofollow-richtlijn gevolgen voor crawl budget?

Doe URL ‘ s die ik niet toegestaan door robots.heeft txt invloed op mijn crawl budget?

Leave a Reply Cancel