co oznacza indeksowanie budżetu dla Googlebota

poniedziałek, 16 stycznia 2017

ostatnio słyszeliśmy wiele definicji “indeksowania budżetu”, jednak nie mamy jednego terminu, który opisywałby wszystko, co “indeksowanie budżetu” oznacza Na Zewnątrz. W tym poście wyjaśnimy, co tak naprawdę mamy i co to oznacza dla Googlebota.

po pierwsze, chcielibyśmy podkreślić, że budżet crawl, jak opisano poniżej, nie jest czymś, o co większość wydawców musi się martwić. Jeśli nowe strony są indeksowane tego samego dnia, w którym zostały opublikowane, indeksowanie budżetu nie jest czymś, na czym webmasterzy muszą się skupić. Podobnie, jeśli witryna ma mniej niż kilka tysięcy adresów URL, przez większość czasu będzie sprawnie indeksowana.

ustalanie priorytetów, co ma być indeksowane, kiedy i ile zasobów serwer hostujący witrynę może przydzielić do indeksowania, jest ważniejsze w przypadku większych witryn lub tych, które automatycznie generują strony na podstawie parametrów URL, na przykład.

limit indeksowania

Googlebot ma być dobrym obywatelem sieci. Indeksowanie jest jego głównym priorytetem, jednocześnie upewniając się, że nie pogarsza doświadczenia użytkowników odwiedzających witrynę. Nazywamy to “limitem indeksowania”, który ogranicza maksymalną szybkość pobierania dla danej witryny.

Mówiąc najprościej, oznacza to liczbę jednoczesnych równoległych połączeń, których Googlebot może użyć do indeksowania witryny, a także czas oczekiwania między pobieraniem. Szybkość indeksowania może wzrastać i spadać w oparciu o kilka czynników:

  • pełzanie zdrowia: jeśli witryna reaguje bardzo szybko przez jakiś czas, limit wzrasta, co oznacza, że można użyć więcej połączeń do pełzania. Jeśli witryna spowalnia lub reaguje na błędy serwera, limit spada, a Googlebot indeksuje się mniej.
  • Limit ustawiony w Search Console: właściciele witryn mogą zmniejszyć indeksowanie Googlebota w swojej witrynie. Należy pamiętać, że ustawienie wyższych limitów nie zwiększa automatycznie indeksowania.

popyt na indeksowanie

nawet jeśli limit szybkości indeksowania nie zostanie osiągnięty, jeśli nie będzie popytu z indeksowania, będzie niska aktywność Googlebota. Dwa czynniki, które odgrywają istotną rolę w określaniu popytu pełzania są:

  • popularność: Adresy URL, które są bardziej popularne w Internecie, są częściej indeksowane, aby zachować świeżość w naszym indeksie.
  • Staleeness: nasze systemy próbują zapobiec starzeniu się adresów URL w indeksie.

ponadto zdarzenia dotyczące całej witryny, takie jak ruchy witryny, mogą powodować wzrost popytu na indeksowanie w celu ponownego przeszukiwania zawartości pod nowymi adresami URL.

biorąc wskaźnik indeksowania i popyt indeksowania razem definiujemy budżet indeksowania jako liczbę adresów URL Googlebot może i chce indeksować.

czynniki wpływające na budżet indeksowania

zgodnie z naszą analizą, posiadanie wielu adresów URL o niskiej wartości może negatywnie wpłynąć na indeksowanie i indeksowanie witryny. Odkryliśmy, że adresy URL o niskiej wartości należą do tych kategorii, w kolejności ważności:

  • Fasetowane identyfikatory nawigacji i sesji
  • zduplikowana zawartość na stronie
  • strony z błędami miękkimi
  • Hakowane strony
  • nieskończone przestrzenie i proxy
  • niska jakość i zawartość spamu

marnowanie zasobów serwera na stronach takich jak te spowoduje wyssanie aktywności indeksowania ze stron, które rzeczywiście mają wartość, co może spowodować znaczne opóźnienie w odkrywaniu świetnych treści w witrynie.

najważniejsze pytania

indeksowanie to punkt wejścia witryn do wyników wyszukiwania Google. Sprawne indeksowanie strony internetowej pomaga w jej indeksowaniu w wyszukiwarce Google.

czy szybkość witryny wpływa na mój budżet indeksowania? A co z błędami?

szybsze tworzenie witryny poprawia wrażenia użytkowników, a także zwiększa szybkość indeksowania. Dla Googlebota szybka strona jest oznaką zdrowych serwerów, dzięki czemu może uzyskać więcej treści przy tej samej liczbie połączeń. Z drugiej strony znaczna liczba błędów 5xx lub przekroczeń czasu połączenia sygnalizuje coś przeciwnego,a indeksowanie spowalnia.

zalecamy zwrócenie uwagi na raport o błędach indeksowania w Search Console i utrzymanie niskiej liczby błędów serwera.

czy indeksowanie jest czynnikiem rankingowym?

zwiększona szybkość indeksowania niekoniecznie doprowadzi do lepszych pozycji w wynikach wyszukiwania. Google używa setek sygnałów do pozycjonowania wyników, a podczas gdy indeksowanie jest konieczne, aby być w wynikach, nie jest to sygnał rankingowy.

czy alternatywne adresy URL i osadzona zawartość liczą się w budżecie indeksowania?

Ogólnie rzecz biorąc, każdy adres URL, który indeksuje Googlebot, będzie liczony do budżetu indeksowania witryny. Alternatywne adresy URL, takie jak AMP lub hreflang, a także osadzone treści, takie jak CSS i JavaScript, w tym połączenia AJAX (takie jak XHR), mogą być indeksowane i pochłoną budżet indeksowania witryny. Podobnie długie łańcuchy przekierowań mogą mieć negatywny wpływ na pełzanie.

Czy Mogę kontrolować Googlebota za pomocą dyrektywy “crawl-delay”?

niestandardowe roboty “crawl-delay”.Dyrektywa txt nie jest przetwarzana przez Googlebota.

czy dyrektywa nofollow wpływa na budżet?

to zależy. Każdy indeksowany adres URL ma wpływ na budżet indeksowania, więc nawet jeśli strona oznaczy adres URL jako nofollow, nadal może być indeksowana, jeśli inna strona w Twojej witrynie lub jakakolwiek strona w Internecie nie oznaczy linku jako nofollow.

czy adresy URL, których zabroniłem przez roboty.txt wpływa na mój budżet indeksowania w jakikolwiek sposób?

nie, niedozwolone adresy URL nie wpływają na budżet indeksowania.

aby uzyskać informacje na temat optymalizacji indeksowania witryny, spójrz na nasz blogpost na temat optymalizacji indeksowania od 2009, który nadal ma zastosowanie. Jeśli masz pytania, pytaj na forum!

dodane przez Gary, indeksowanie i indeksowanie zespołów

Leave a Reply