Google actualizó su documentación de investigación central para la verificación de Googlebot, agregando documentación sobre visitas de bots activadas por usuarios, información que faltaba en la documentación anterior de Googlebot, lo que ha causado confusión durante muchos años, con algunos editores bloqueando rangos de IP de visitas legítimas.

Documentación de Bot actualizada recientemente

Google ha agregado nueva documentación que clasifica los tres tipos diferentes de bots que los editores deben esperar.

Estas son las tres categorías de Google Bot:

  • Googlebot: rastreador de búsqueda
  • Orugas con estuche especial
  • Obtención activada por el usuario (GoogleUserContent)

El último, GoogleUserContent, ha confundido durante mucho tiempo a los editores porque Google carecía de documentación para ello.

Esto es lo que dice Google sobre GoogleUserContent:

“Cargadores activados por el usuario

Herramientas y características del producto donde el usuario final activa una captura.

Por ejemplo, Google Site Verifier actúa sobre la solicitud de un usuario.

Dado que la búsqueda fue solicitada por un usuario, estos buscadores ignoran las reglas de robots.txt».

La documentación establece que la máscara DNS inversa mostrará el siguiente dominio:

«***-***-***-***.gae.googleusercontent.com»

En el pasado, algunos miembros de la comunidad de SEO me dijeron que la actividad de los bots de las direcciones IP asociadas con GoogleUserContent.com se activaba cuando un usuario visitaba un sitio web a través de una función de traducción ubicada en los resultados de búsqueda, una función . que ya no existe en las SERP de Google.

No sé si eso es cierto o no. Bastaba con saber que se trataba de una visita de Google provocada por el usuario.

La nueva documentación de Google explica que la herramienta Google Site Verifier puede activar la actividad de los bots de las direcciones IP asociadas con GoogleUserContent.com.

Pero Google no dice qué más podría activar un bot desde las direcciones IP de GoogleUserContent.com.

El otro cambio en la documentación es una referencia a googleusercontent.com en el contexto de las direcciones IP asignadas al nombre de dominio GoogleUserContent.com.

Este es el nuevo texto:

«Compruebe si el nombre de dominio es googlebot.com, google.com o googleusercontent.com».

Otra nueva adición es el siguiente texto, que se ha ampliado de la página anterior:

«Alternativamente, puede identificar Googlebot por dirección IP haciendo coincidir la dirección IP del rastreador con las listas de rango de IP de referencia y rastreador de Google:

Bot de Google

Rastreadores especiales como AdsBot

Capturas iniciadas por el usuario»

Documentación de identificación del bot de Google

La nueva documentación finalmente tiene algo sobre los bots que usan direcciones IP asociadas con GoogleUserContent.

Los vendedores estaban confundidos por esas direcciones IP y asumieron que estos bots eran spam.

Un hilo de ayuda de Google Search Console de 2020 muestra cuán confundidas estaban las personas sobre la actividad asociada con GoogleUserContent.

Muchos en ese hilo concluyeron correctamente que no era un robot de Google, pero luego concluyeron incorrectamente que era un bot falso que pretendía ser Google.

Un usuario publicó:

“El comportamiento que veo proveniente de estas direcciones es muy parecido (si no idéntico) al comportamiento legítimo de Googlebot y está afectando a muchos de nuestros sitios.

…Si no es así, esto parece indicar que existe una actividad generalizada de bots maliciosos de alguien que intenta parecerse a Google en nuestros sitios, lo cual es preocupante”.

Después de varias respuestas, el iniciador del hilo concluye que la actividad de GoogleUserContent era spam.

Ellos escribieron:

“…Los bots de Google en cuestión se hacen pasar por agentes de usuario oficiales, pero la evidencia actualmente parece mostrar que son falsos.

Los bloquearé por ahora.

Ahora sabemos que la actividad de los bots de las IP asociadas con GoogleUserContent no es spam ni bots de piratas informáticos.

Realmente vengo de Google. Los editores que actualmente bloquean las direcciones IP asociadas con GoogleUserContent probablemente deberían desbloquearlas.

Lista actual de Las direcciones IP de los usuarios de Triggered Fetcher se pueden encontrar aquí.

Lea la documentación actualizada de Google:

Googlebot y otros rastreadores de Google están comprobados

Imagen destacada de Shutterstock/Asier Romero

Fuente: searchenginejournal

Hashtags: #Google #está #actualizando #documentación #verificación #Googlebot