John Mueller de Google respondió si eliminar páginas de un sitio grande ayuda a resolver el problema de las páginas descubiertas por Google pero no rastreadas. John proporcionó información general sobre cómo solucionar esto.

Descubierto – Actualmente no indexado

Consola de búsqueda, un servicio proporcionado por Google que comunica problemas de búsqueda y comentarios.

El estado de indexación es una parte importante de la consola de búsqueda porque le dice a un editor qué parte de un sitio está indexado y es elegible para la clasificación.

El estado de indexación de las páginas web se puede encontrar en el informe de indexación de páginas en la consola de búsqueda.

Un informe de que Google descubrió una página pero no la indexó suele ser una señal de que es necesario solucionar un problema.

Hay varias razones por las que Google puede descubrir una página pero negarse a indexarla, incluso si Google documentación oficial solo enumera una razón.

«Descubierto: actualmente no indexado
Google encontró la página, pero aún no se ha rastreado.

Por lo general, Google quería rastrear la URL, pero esperaba que sobrecargara el sitio; por lo tanto, Google reprogramó el rastreo.

Esta es la razón por la cual la última fecha de escaneo está en blanco en el informe».

John Mueller de Google ofrece varias razones por las que una página puede ser descubierta pero no indexada.

¿Desindexar páginas no indexadas para mejorar la indexación en todo el sitio?

Existe la idea de que eliminar ciertas páginas ayudará a Google a rastrear el resto del sitio, dándole menos páginas para rastrear.

Se cree que Google tiene una capacidad de rastreo limitada (presupuesto de rastreo) asignada a cada sitio.

Los Googlers han declarado repetidamente que no existe un presupuesto de rastreo tal como lo percibe el SEO.

Google tiene una serie de consideraciones con respecto a la cantidad de páginas para rastrear, incluida la capacidad del servidor del sitio web para manejar un rastreo grande.

Una razón clave por la que Google es exigente con la cantidad de datos que rastrea es que no tiene la capacidad suficiente para archivar todas las páginas web de Internet.

Es por eso que Google tiende a indexar páginas que tienen cierto valor (si el servidor puede manejarlo) y no indexa otras páginas.

Para obtener más información sobre Crawl Budget, lea: Google proporciona información sobre Crawl Budget

Esta es la pregunta que se hizo:

«¿Desindexar y agregar 8 millones de productos usados ​​en 2 millones de páginas de productos indexables únicas ayudaría a mejorar el rastreo y la indexabilidad (descubierto – problema actualmente no indexado)?»

John Mueller de Google reconoció por primera vez que no es posible abordar el problema específico de la persona, por lo que ofreció un consejo general.

Él respondió:

«Es imposible decirlo.

Recomiendo consultar la excelente guía del sitio para escanear presupuestos en nuestra documentación.

Para sitios grandes, a veces rastrear más está limitado por qué tan bien su sitio puede manejar el rastreo más.

En la mayoría de los casos, sin embargo, se trata más de la calidad general del sitio.

¿Mejorar significativamente la calidad general de su sitio de 8 millones de páginas a 2 millones de páginas?

Si no se enfoca realmente en mejorar la calidad, es fácil pasar mucho tiempo reduciendo la cantidad de páginas indexables sin mejorar realmente el sitio web, y eso no mejoraría las cosas para la búsqueda.

Mueller da dos razones para el problema descubierto no indexado

John Mueller de Google ofreció dos razones por las que Google podría descubrir una página pero negarse a indexarla.

  1. Capacidad del servidor
  2. Calidad general del sitio

1. Capacidad del servidor

Mueller dijo que la capacidad de Google para rastrear e indexar páginas web puede estar «limitada por lo bien que su sitio puede manejar múltiples rastreos».

Cuanto más grande se vuelve un sitio web, más robots se necesitan para rastrear un sitio web. Para agravar el problema, está el hecho de que Google no es el único bot que rastrea un sitio grande.

Hay otros bots legítimos, como los de Microsoft y Apple, que intentan rastrear su sitio. Además, hay muchos otros bots, algunos legítimos y otros relacionados con la piratería y el raspado de datos.

Esto significa que para un sitio grande, especialmente durante la noche, puede haber miles de bots que utilicen los recursos del servidor del sitio web para rastrear un sitio web grande.

Por eso, una de las primeras preguntas que le hago a un editor con un problema de indexación es el estado de su servidor.

Por lo general, un sitio web con millones de páginas, o incluso cientos de miles de páginas, necesitará un servidor dedicado o un host en la nube (ya que los servidores en la nube brindan recursos escalables como ancho de banda, GPU y RAM).

A veces, un entorno de alojamiento puede requerir más memoria asignada a un proceso, como el límite de memoria de PHP, para ayudar al servidor a manejar el alto tráfico y evitar 500 mensajes de respuesta de error.

La solución de problemas de los servidores implica analizar un registro de errores del servidor.

2. Calidad general del sitio

Esta es una razón interesante para no indexar suficientes páginas. La calidad general del sitio es como una puntuación o calificación que Google otorga a un sitio.

Partes de un sitio web pueden afectar la calidad general del sitio web

John Mueller dijo que una sección de un sitio web puede influir en la determinación general de la calidad del sitio.

Meller dijo:

“… para algunas cosas, nos fijamos en la calidad general del sitio.

Y cuando observamos la calidad general del sitio, si tiene partes significativas de menor calidad, no nos importa, por ejemplo, porque serían de menor calidad.

…si vemos que hay partes significativas de menor calidad, entonces podríamos pensar que, en general, este sitio web no es tan bueno como pensábamos”.

Definición de calidad del sitio

John Mueller de Google dio una definición de calidad del sitio en otro video de horas de trabajo:

“Cuando se trata de contenido de calidad, no solo nos referimos al texto de sus artículos.

Es realmente la calidad de su sitio web en general.

Y eso incluye todo, desde la apariencia hasta el diseño.

Por ejemplo, cómo presentas las cosas en tus páginas, cómo integras las imágenes, qué tan rápido trabajas, todos estos factores entran en juego allí”.

¿Cuánto tiempo lleva determinar la calidad general del sitio?

Otro hecho acerca de cómo Google determina la calidad del sitio es el tiempo que le toma a Google determinar la calidad del sitio, puede llevar meses.

Meller dijo:

“Lleva mucho tiempo comprender cómo encaja un sitio web en el resto de Internet.

… Y es algo que fácilmente puede durar, no sé, unos meses, medio año, a veces incluso más de medio año…”

Optimización de un sitio para rastrear e indexar

Optimizar un sitio completo o una sección de un sitio es una forma general de alto nivel de ver el problema. A menudo se trata de optimizar páginas individuales a escala.

Especialmente para sitios de comercio electrónico con billones de productos, la optimización puede tomar muchas formas.

Cosas a tener en cuenta:

Menú principal
Asegúrese de que su menú principal esté optimizado para dirigir a los usuarios a las secciones importantes de su sitio que interesan a la mayoría de los usuarios.

Enlace a secciones y páginas populares
Las páginas y secciones más populares también se pueden vincular desde una sección destacada de la página de inicio.

Esto ayuda a los usuarios a acceder a las páginas y secciones que más les interesan, pero también le indica a Google que se trata de páginas importantes que deben indexarse.

Mejore las páginas con contenido delgado
El contenido ligero son básicamente páginas con poco contenido útil o páginas que en su mayoría son duplicados de otras páginas (contenido de plantilla).

No es suficiente para llenar páginas de palabras. Las palabras y frases deben tener significado y relevancia para los visitantes del sitio web.

Para los productos, puede haber medidas, peso, colores disponibles, sugerencias de otros productos para combinar, marcas con las que los productos funcionan mejor, enlaces a manuales, preguntas frecuentes, calificaciones y otra información que los usuarios encontrarán útil.

Corrección de rastreo no indexado para más ventas en línea

En una tienda física, parece que todo lo que necesitas hacer es poner los productos en los estantes.

Pero la realidad es que, a menudo, se necesitan vendedores inteligentes para sacar esos productos de los estantes.

Una página web puede desempeñar el papel de un vendedor experto que puede decirle a Google por qué la página debe indexarse ​​y ayudar a los clientes a elegir esos productos.

Vea el horario de la Oficina de SEO de Google a las 13:41:

Fuente: searchenginejournal

Hashtags: #Google #fix #detectado #actualmente #indexado