co znamená rozpočet Procházení Pro Googlebot

pondělí 16. ledna 2017

Nedávno jsme slyšeli řadu definic pro “rozpočet procházení”, ale nemáme jediný termín, který by popisoval vše, co” rozpočet procházení ” znamená externě. S tímto příspěvkem objasníme, co vlastně máme a co to znamená pro Googlebot.

nejprve bychom chtěli zdůraznit, že rozpočet procházení, jak je popsáno níže, není něco, o co se většina vydavatelů nemusí starat. Pokud nové stránky mají tendenci procházet ve stejný den, kdy jsou publikovány, procházení rozpočtu není něco, na co se webmasteři musí zaměřit. Stejně tak, pokud má web méně než několik tisíc adres URL, většinu času bude prolézán efektivně.

upřednostňování toho, co procházet, kdy a kolik zdrojů může server hostující web přidělit procházení, je důležitější pro větší weby nebo pro ty, které například automaticky generují stránky na základě parametrů URL.

omezení rychlosti procházení

Googlebot je navržen tak, aby byl dobrým občanem webu. Procházení je jeho hlavní prioritou a zároveň se ujistěte, že to nezhoršuje zážitek uživatelů navštěvujících web. Říkáme tomu “limit rychlosti procházení”, který omezuje maximální rychlost načítání pro daný web.

jednoduše řečeno, to představuje počet souběžných paralelních připojení Googlebot může použít k procházení webu, stejně jako čas, který musí čekat mezi načtením. Míra procházení může jít nahoru a dolů na základě několika faktorů:

  • zdraví procházení: pokud web na chvíli reaguje opravdu rychle, limit se zvýší, což znamená, že k procházení lze použít více připojení. Pokud se web zpomalí nebo odpoví chybami serveru, limit klesne a Googlebot se plazí méně.
  • Limit nastavený ve Vyhledávací konzoli: majitelé webových stránek mohou omezit procházení svých stránek Googlebotem. Všimněte si, že nastavení vyšších limitů automaticky nezvyšuje procházení.

poptávka po procházení

i když není dosaženo limitu rychlosti procházení, pokud není poptávka po indexování, bude z Googlebotu nízká aktivita. Dva faktory, které hrají významnou roli při určování poptávky po procházení, jsou:

  • Popularita: Adresy URL, které jsou na internetu populárnější, bývají procházeny častěji, aby byly v našem indexu čerstvější.
  • Staleness: naše systémy se snaží zabránit tomu, aby se adresy URL v indexu staly zastaralými.

navíc události na celém webu, jako jsou přesuny stránek, mohou vyvolat zvýšení poptávky po procházení, aby se obsah znovu rozšířil pod nové adresy URL.

Vezmeme-li rychlost procházení a požadavek procházení společně definujeme rozpočet procházení jako počet adres URL, které Googlebot může a chce procházet.

faktory ovlivňující rozpočet procházení

podle naší analýzy může mít mnoho adres URL s nízkou přidanou hodnotou negativní vliv na procházení a indexování webu. Zjistili jsme, že adresy URL s nízkou přidanou hodnotou spadají do těchto kategorií, v pořadí podle významu:

  • Faceted navigation and session identifiers
  • on-site duplicate content
  • Soft error pages
  • Hacked pages
  • Infinite spaces and proxy
  • nízká kvalita a spamový obsah

plýtvání serverovými prostředky na takových stránkách vypustí aktivitu procházení ze stránek, které skutečně mají hodnotu, což může způsobit významné zpoždění při objevování skvělého obsahu na webu.místo.

hlavní otázky

procházení je vstupním bodem pro weby do výsledků vyhledávání Google. Efektivní procházení webových stránek pomáhá s indexováním ve Vyhledávání Google.

ovlivňuje rychlost webu můj rozpočet procházení? A co chyby?

rychlejší vytvoření webu zlepšuje zážitek uživatelů a zároveň zvyšuje rychlost procházení. Pro Googlebot je rychlý web známkou zdravých serverů, takže může získat více obsahu při stejném počtu připojení. Na druhou stranu značný počet chyb 5xx nebo časových limitů připojení signalizuje opak a procházení se zpomaluje.

doporučujeme věnovat pozornost hlášení chyb procházení ve Vyhledávací konzoli a udržovat nízký počet chyb serveru.

je procházení faktorem hodnocení?

zvýšená míra procházení nemusí nutně vést k lepším pozicím ve výsledcích vyhledávání. Google používá stovky signálů k hodnocení výsledků, a zatímco procházení je nezbytné pro to, aby bylo ve výsledcích, není to signál hodnocení.

počítají se alternativní adresy URL a vložený obsah v rozpočtu procházení?

obecně platí, že jakákoli adresa URL, kterou Googlebot prochází, se započítá do rozpočtu procházení webu. Alternativní adresy URL, jako je AMP nebo hreflang, stejně jako vložený obsah, jako je CSS a JavaScript, včetně hovorů AJAX (jako XHR), může být nutné procházet a spotřebovat rozpočet procházení webu. Podobně dlouhé řetězce přesměrování mohou mít negativní vliv na procházení.

mohu ovládat Googlebot pomocí směrnice” crawl-delay”?

nestandardní roboty” crawl-delay”.směrnice txt není Googlebotem zpracována.

ovlivňuje směrnice nofollow rozpočet procházení?

to záleží. Každá adresa URL, která je procházena, ovlivňuje rozpočet procházení, takže i když vaše stránka označí adresu URL jako nofollow, může být stále procházena, pokud jiná stránka na vašem webu nebo jakákoli Stránka na webu neoznačí odkaz jako nofollow.

Do adres URL jsem zakázal prostřednictvím robotů.txt nějakým způsobem ovlivňuje můj rozpočet procházení?

ne, zakázané adresy URL nemají vliv na rozpočet procházení.

informace o tom, jak optimalizovat procházení vašeho webu, najdete v našem blogu o optimalizaci procházení z roku 2009, který je stále použitelný. Máte-li dotazy, zeptejte se na fórech!

přidal Gary, Crawling a indexování týmy

Leave a Reply