Qué son los errores de rastreo

Qué son los errores de rastreo

15 Jul 2020 in

En este artículo, aprenderás:

  • ¿Qué es un error de rastreo?
  • Errores del sitio
  • Errores de URL
  • Herramienta de inspección de URL
  • ¿Cuál es el inconveniente con los errores de rastreo?
Back to top

1) ¿Qué es un error de rastreo?

Los errores de rastreo son inconvenientes encontrados por los motores de búsqueda cuando intentan acceder a tus páginas. Estos errores evitan que los robots de los motores de búsqueda lean tu contenido y también indexen tus páginas.

Los fallos de rastreo también pueden referirse a un informe libre en la versión heredada de Google Search Console.

El informe de errores de rastreo tiene 2 secciones principales:

  • Errores del sitio: estos fallos impiden que Googlebot acceda a tu sitio web entero.

  • Errores de URL: estos errores se generan cuando Googlebot no puede acceder a una URL específica.

Errores del sitio: estos errores impiden que Googlebot acceda a tu sitio entero.

Errores de URL: estos errores se producen cuando Googlebot no puede acceder a una URL específica.

En la nueva Google Search Console, estos errores se notifican URL por URL en el informe de cobertura.

La nueva sección Cobertura de Search Console también rastrea la indexación a lo largo del tiempo, mostrando cuántos:

  • Errores ha encontrado (y cuántos ha resuelto)
  • Páginas válidas que Google ha indexado
  • Páginas que Google ha encontrado pero no indexado
  • Páginas válidas que Google ha indexado pero en las que encontró errores

Solo discutiremos la sección Errores, ya que estos problemas son los que evitarán que Google rastree o indexe tus páginas.

Back to top

2) Errores de sitio

Los fallos de lugar son problemas que ocurren a nivel de lugar. Los fallos del lugar significan que tus usuarios y Google no pueden acceder a ningunade tus páginas.

Así que no te brinques estos errores.

Hay tres fallos de sitio que Google cuenta como fallos de rastreo.

2.0.1) Error de DNS

Un DNS, que por su sigla en inglés significa "sistema de nombre de dominio", traduce la dirección IP de un sitio de una cadena de números a letras y números utilizables. Esencialmente, es lo que nos deja navegar por Internet sin tener que conocer la dirección IP de cada sitio web que deseamos visitar.

El sistema DNS marcha así:

  1. Escribes un nombre de dominio en tu navegador.

  2. El navegador comprueba si la información de ese dominio está guardada localmente en tu computadora.

  3. Si no es así, el navegador envía una petición a tu servidor DNS local (normalmente proporcionado por tu ISP).

  4. El servidor DNS local busca los detalles del nombre de dominio. Si no encuentra ninguna información, necesitará encontrar el [servidor de nombres raíz del dominio] ().

  5. Para encontrar el servidor, el servidor DNS dividirá la URL en trozos, de derecha a izquierda. Entonces, para , divide la URL en "com", "ejemplo" y ";.

  6. El servidor DNS se conecta al servidor de nombres raíz DNS para conocer la ubicación del servidor para el primer fragmento del dominio: ".com". Esto se conoce como el.

  7. El servidor DNS se conecta al servidor TLD.

  8. El servidor DNS le pedirá al servidor de nombres de TLD detalles sobre el servidor de nombres que contiene detalles sobre el nombre de dominio ("ejemplo" en nuestro caso).

  9. En este punto, el servidor DNS le solicita al servidor de nombres la información sobre ejemplo.com y el servidor de nombres retorna con la dirección IP del dominio.

Escribes un nombre de dominio en tu navegador.

El navegador comprueba si la información de ese dominio está guardada de forma local en tu computadora.

Si no es así, el navegador envía una petición a tu servidor DNS local (en general proporcionado por tu ISP).

El servidor DNS local busca los detalles del nombre de dominio. Si no encuentra ninguna información, necesitará encontrar el [servidor de nombres raíz del dominio] ().

Para hallar el servidor, el servidor DNS dividirá la URL en pedazos, de derecha a izquierda. Entonces, para , divide la URL en "com", "ejemplo" y ";.

El servidor DNS se conecta al servidor de nombres raíz DNS para conocer la ubicación del servidor para el primer fragmento del dominio: ".com". Esto se conoce como el.

El servidor DNS se conecta al servidor TLD.

El servidor DNS le pedirá al servidor de nombres de TLD detalles sobre el servidor de nombres que contiene detalles sobre el nombre de dominio ("ejemplo" en nuestro caso).

En este punto, el servidor DNS le solicita al servidor de nombres la información sobre ejemplo.com y el servidor de nombres regresa con la dirección IP del dominio.

Hacer una conexión DNS es esencial puesto que es el primer paso para acceder a un sitio. Si Google no puede establecer una conexión DNS, no puede encontrar, y mucho menos acceder, a tu sitio web.

Hay 2 géneros de errores de DNS que encuentra Google:

  1. Tiempo de espera de DNS:Tu servidor DNS no respondió a la petición de Google suficientemente rápido.

  2. Búsqueda de DNS:Google no pudo acceder a tu sitio por el hecho de que tu servidor DNS no pudo encontrar tu nombre de dominio.

Tiempo de espera de DNS:Tu servidor DNS no respondió a la petición de Google suficientemente rápido.

Búsqueda de DNS:Google no pudo acceder a tu sitio web pues tu servidor DNS no pudo encontrar tu nombre de dominio.

Si no puedes acceder a tu lugar como Google utilizando, consulta con tu proveedor de DNS.

2.0.2) Errores del servidor

Los fallos de servidor son diferentes de los errores de DNS. Significa que Google pudo buscar tu URL en el servidor DNS. No obstante, no puede cargar la página debido a un problema del servidor.

Esto en general quiere decir que tu servidor está tardando demasiado en contestar y la solicitud de Google ha expirado. Google dedicará solo una cierta cantidad de tiempo a aguardar una contestación del servidor. Si toma demasiado tiempo el bot se dará por vencido.

Al igual que los fallos de DNS, un error de servidor es un enorme inconveniente para tu sitio. Significa que algo salió mal con tu servidor e impide que los usuarios y los robots accedan a tu sitio.

La forma en que repares el fallo de tu servidor dependerá de cuál sea el fallo. Hay varios géneros de fallos de servidor:

  • Tiempo de espera: el servidor simplemente tardó demasiado en contestar a la petición de Googlebot.

  • Encabezados truncados: tu servidor terminó la conexión antes que se enviaran los encabezados completos.

  • Restablecimiento de la conexión: Google pudo conectarse a tu sitio, pero no recibió nada porque la conexión se restableció a mitad de la respuesta.

  • Respuesta truncada: la conexión finalizó antes que Google recibiese una respuesta completa.

  • Conexión rechazada: tu servidor se negó a conectarse con Googlebot.

  • Falló la conexión: la red de tu servidor estaba inactiva o bien inalcanzable.

Tiempo de espera: el servidor sencillamente tardó demasiado en responder a la solicitud de Googlebot.

Encabezados truncados: tu servidor terminó la conexión antes que se enviaran los encabezados completos.

Restablecimiento de la conexión: Google pudo conectarse a tu lugar, pero no recibió nada por el hecho de que la conexión se restableció a mitad de la contestación.

Respuesta truncada: la conexión finalizó antes que Google recibiera una contestación completa.

Conexión rechazada: tu servidor se negó a conectarse con Googlebot.

Falló la conexión: la red de tu servidor estaba inactiva o inalcanzable.

*Tiempo de espera de conexión: la conexión también tardó en procesarse.

  • Sin respuesta: la conexión con tu servidor finalizó antes que se pudiera enviar cualquier contestación.

Consulta elpara conseguir recursos sobre cómo solventar inconvenientes de cada tipo de fallo del servidor.

2.0.3) Falla de robots

Las fallas del robot se refieren a la incapacidad de Google para localizar y leer el fichero robots.txt de un sitio web en /robots.txt. Si DNS es el paso 1 y hacer una conexión con el servidor es el paso 2, entonces leer robots.txt es el paso tres cuando Google rastrea un sitio web.

Google no quiere rastrear y también indexar las páginas que tú no quieres, con lo que si no puede acceder a un fichero robots.txt, pospondrá el rastreo hasta el momento en que pueda leer el archivo. Sin embargo, si deseasque Google rastree cada página de tu sitio, puedes renunciar a añadir este fichero a tu dominio e ignorar este fallo.

Si ves este fallo en Google Search Console, compruebea cómo configuraste tu fichero robots.txt.

  • ¿Lo creaste como un archivo de texto sin formato?
  • ¿Has rechazado tu página de inicio?
  • ¿Tu archivo robots.txt devuelve un estado doscientos o bien un fallo cuatrocientos cuatro?
  • ¿Has verificado doble, triple y cuádruple las líneas Disallow: /?

Cuando encuentras un fallo de robot, vale la pena señalar que no tener un fichero robots.txt es mejor que tener uno mal configurado, ya que un archivo robots.txt roto hará que Google evite rastrear stu sitio por completo.

Back to top

3) Errores de URL

Los errores de URL difieren de los errores de sitio en que solo se aplican a una página específica, no a tu lugar generalmente. Marcan las instancias en las que Google solicitó una página específica, pero no pudo leerla.

3.0.1) 404 suaves

El nombre "404 suave" puede ser un tanto engañoso para ciertos. Estas no son páginas que devuelven un código de estado cuatrocientos cuatro. En verdad, estas son páginas que devuelven un estado HTTP doscientos. El problema es que en su mayoría son páginas vacías.

Google es bastante bueno para hallar dónde se halla el contenido en una página. Entonces, en el momento en que una URL contiene una página que no tiene mucho o bien ningún "contenido principal", lleva por nombre "404 suave". Técnicamente, la página existe y devuelve un estado doscientos, pero es una página vacía.

Google marca estas páginas porque no son muy útiles para los usuarios, hacen que Googlebot funcione sin ningún motivo y reducen la eficiencia del rastreo de tu lugar.

Tu mejor opción es añadir contenido a estas páginas para que sean útiles o no indexarlas a fin de que Google ya no las vea.

Ten en cuenta que si utilizas una página 404 adaptada que nodevuelve un estado cuatrocientos cuatro, Google seguramente la marcará como un 404 suave.

3.0.2) No encontrado

Las URL no encontradas son los errores cuatrocientos cuatro reales encontrados en un sitio. Google ha pedido una URL en tu lugar que no existe.

Si bien ver muchas URL "no encontradas" en tu informe de Errores de rastreo puede tirarte el alma al piso, no es tan desastroso como parece.

De hecho, según Google, los fallos 404 no afectan la indexación o bien clasificación de tu sitio.

La gran mayoría de los errores 404 que verás no necesitarán ser reparados. Al decidir si corregir o no una URL cuatrocientos cuatro, considera...

  • ¿La URL tiene muchos links externos de alta calidad?
  • ¿Recibe mucho tráfico?
  • ¿Es una URL que los usuarios evidentemente esperarían existir?

Si la contestación a una o más de estas preguntas es sí, seguramente deberías investigar la causa del fallo. Si el 404 es causado por un enlace interno defectuoso, debes definitivamentearreglarlo.

Arreglar tus 404 dependerá de la causa. Podría ser tan simple como corregir fallos tipográficos en un enlace interno. Si se trata de enlaces externos a páginas antiguas, usa una redirección 301 para redirigir a una nueva. Si semeja una URL que la gente esperaría que existiese en tu sitio, considera agregar la página o bien redirigir al contenido relevante en otra una parte de tu sitio.

3.0.3) Acceso denegado

Estos fallos ocurren cuando a Google no se le deja acceder a una página determinada. Normalmente son causados ​​por:

  • Contraseña que protege la página
  • Páginas no permitidas por robots.txt
  • Tu proveedor de hosting bloquea Googlebot (¡puede suceder!)

Si no deseas que las URL enumeradas en esta área de Errores de rastreo aparezcan en los resultados de búsqueda, no necesitas hacer nada aquí. Esto es en realidad una confirmación de que algo está bien.

Sin embargo, si deseas que estas páginas aparezcan en los resultados de búsqueda, deberás corregir lo que bloquea a Google.

3.0.4) No seguido

No confundas este error con la directiva de enlace o la etiqueta de meta robots. Estas URL no guardan relación con eso. Las URL no seguidas en Fallos de rastreo son simplemente URL que Google no pudo continuar totalmente a su destino.

Las razones para esto podrían ser:

  • Flash, JavaScript u otro contenido activo que bloquea Google
  • Redireccionamientos rotos, bucles o cadenas
  • Enlace relativo en redirecciones
  • URL redirigidas incluidas en tu mapa del sitio

Nuevamente, como con los cuatrocientos cuatro y el acceso rechazado, decide si no vale la pena corregir las URL aquí. Si las páginas no importan realmente a tu sitio web, puedes decidir no preocuparte por arreglarlas.

3.0.5) Errores de servidor y fallos de DNS

Estos son exactamente los mismos géneros de errores encontrados en los errores del lugar anteriores. Google no pudo encontrar el DNS de una URL, o bien algo salió mal con tu servidor al tratar de servir la página. La diferencia aquí es que estos errores se restringen a las URL individuales, en lugar de afectar a todo tu sitio.

Para obtener más orientación de Google sobre qué significa cada fallo y cómo solucionarlo, lee el [artículo de Ayuda de Google Search Console]
() sobre fallos de rastreo.

Back to top

4) Herramienta de inspección de URL

Google Search Console te deja buscar páginas individuales en tu sitio para advertir problemas de indexación y fallos de rastreo. Puedes acceder a la inspección de URL para URLs individuales de varias maneras:

  1. Al hacer click en el enlace de inspección de URL en la barra de navegación de la izquierda o bien ingresar la URL en la barra de búsqueda en la parte superior de la página. Despuésselecciona una propiedad de la página de bienvenida de Search Console.

  2. Al hacer clic en el icono de lupa en la fila de una URL en el informe de rendimiento.

Al hacer click en el enlace de inspección de URL en la barra de navegación de la izquierda o ingresar la URL en la barra de búsqueda en la parte superior de la página. Despuésselecciona una propiedad de la página de bienvenida de Search Console.

Al hacer click en el icono de lupa en la fila de una URL en el informe de rendimiento.

La herramienta te señala si una página está o bien no en el índice de Google y especifica lo que Google encontró cuando intentó encontrar la página.

  • La página en la que Google encontró el enlace a tu página.

  • La última vez que los rastreadores de Google intentaron acceder a la página

La página en la que Google encontró el link a tu página.

La última vez que los rastreadores de Google procuraron acceder a la página

Esto es lo que incluye el informe de la herramienta para una página que devuelve un estado HTTP 404:

Back to top

5) ¿Cuál es el problema con los errores de rastreo?

El problema más obvio de tener fallos de rastreo en tu sitio es que estos errores impiden que Google acceda a tu contenido. Google no puede posicionar las páginas a las que no puede acceder. Una alta tasa de errores de rastreo también puede afectar la manera en que Google ve tu sitio web.

Muchos errores de rastreo también pueden tener un impacto en cómo Google ve la salud de tu sitio normalmente. Cuando los rastreadores de Google tienen muchos problemas para acceder al contenido de un sitio, pueden decidir que no merece la pena rastrear estas páginas con mucha frecuencia. Esto hará que tus nuevas páginas tarden mucho más en ingresar al índice de Google de lo que lo harían de otro modo.

Back to top
Share icon

ESTOS EXCLUSIVOS INFORMES GRATUITO REVELAN

7 SECRETOS DE EXPERTOS SEO QUE TE LLEVÁN AL 1#
7 SECRETOS DE EXPERTOS SEO QUE TE LLEVÁN AL 1# EN GOOGLE PARA GANAR 10.000s DE TRÁFICO DE CALIDAD GRATUITO - EN SÓLO 2 MESES
 

Los 7 pasos más poderosos para disparar tu ranking orgánico para ALCANZAR Y MANTENER un impresionante tráfico orgánico es TUYO.

Consigue gratis lo que el 1% de los expertos en SEO venden por miles de euros... y el otro 99% ni siquiera sabe que existe.


OBTEN MI INFORME GRATUITO
5 errores que debes evitar en tu sitio web de Drupal
Ebook - 5 errores que debes evitar en tu sitio web de Drupal (¡podrían costarte miles de euros!)
 

Este Ebook cubre 5 terribles errores que probablemente estés cometiendo ahora mismo con tu sitio web de Drupal.

¡Nº3 TE SORPRENDERÁ! Esta lectura de 10 minutos te ahorrará miles de euros.



OBTEN MI INFORME GRATUITO