¿Qué son los fallos de rastreo?

¿Qué son los fallos de rastreo?

15 Jul 2020 in

Tabla de contenido

Posicionar en la parte superior de los resultados de búsqueda comienza por asegurarse de que Google pueda rastrear e indexar tu contenido. Cuando no puede abrir apropiadamente una página o moverse de una página a otra, no puede indexar el contenido. Estas instancias se conocen como errores de rastreo.

En este artículo, aprenderás:

  • ¿Qué es un error de rastreo?
  • Errores del sitio
  • Errores de URL
  • Herramienta de inspección de URL
  • ¿Cuál es el inconveniente con los errores de rastreo?
Back to top

1) ¿Qué es un fallo de rastreo?

Los errores de rastreo son inconvenientes encontrados por los motores de búsqueda cuando procuran acceder a tus páginas. Estos errores evitan que los robots de los motores de búsqueda lean tu contenido y también indexen tus páginas.

Los fallos de rastreo también pueden referirse a un informe disponible en la versión heredada de Google Search Console.

El informe de fallos de rastreo tiene dos secciones principales:

  • Errores del sitio: estos errores impiden que Googlebot acceda a tu sitio web entero.

  • Errores de URL: estos fallos se generan cuando Googlebot no puede acceder a una URL específica.

Errores del sitio: estos fallos impiden que Googlebot acceda a tu sitio entero.

Errores de URL: estos errores se producen cuando Googlebot no puede acceder a una URL específica.

En la nueva Google Search Console, estos fallos se informan URL por URL en el informe de cobertura.

La nueva sección Cobertura de Search Console también rastrea la indexación a lo largo del tiempo, mostrando cuántos:

  • Errores ha encontrado (y cuántos ha resuelto)
  • Páginas válidas que Google ha indexado
  • Páginas que Google ha encontrado pero no indexado
  • Páginas válidas que Google ha indexado mas en las que encontró errores

Solo discutiremos la sección Fallos, ya que estos inconvenientes son los que evitarán que Google rastree o indexe tus páginas.

Back to top

2) Errores de sitio

Los fallos de lugar son inconvenientes que ocurren a nivel de sitio. Los errores del lugar significan que tus usuarios y Google no pueden acceder a ningunade tus páginas.

Así que no te brinques estos fallos.

Hay tres errores de lugar que Google cuenta como fallos de rastreo.

2.0.1) Error de DNS

Un DNS, que por su inicial en inglés significa "sistema de nombre de dominio", traduce la dirección IP de un sitio web de una cadena de números a letras y números utilizables. Fundamentalmente, es lo que nos deja navegar por Internet sin tener que conocer la dirección IP de cada sitio que queremos visitar.

El sistema DNS marcha así:

  1. Escribes un nombre de dominio en tu navegador.

  2. El navegador verifica si la información de ese dominio está almacenada de forma local en tu computadora.

  3. Si no es así, el navegador envía una solicitud a tu servidor DNS local (normalmente proporcionado por tu ISP).

  4. El servidor DNS local busca los detalles del nombre de dominio. Si no encuentra ninguna información, necesitará hallar el [servidor de nombres raíz del dominio] ().

  5. Para localizar el servidor, el servidor DNS dividirá la URL en pedazos, de derecha a izquierda. Entonces, para , divide la URL en "com", "ejemplo" y ";.

  6. El servidor DNS se conecta al servidor de nombres raíz DNS para conocer la ubicación del servidor para el primer fragmento del dominio: ".com". Esto se conoce como el.

  7. El servidor DNS se conecta al servidor TLD.

  8. El servidor DNS le pedirá al servidor de nombres de TLD detalles sobre el servidor de nombres que contiene detalles sobre el nombre de dominio ("ejemplo" en nuestro caso).

  9. En este punto, el servidor DNS le solicita al servidor de nombres la información sobre ejemplo.com y el servidor de nombres retorna con la dirección IP del dominio.

Escribes un nombre de dominio en tu navegador.

El navegador comprueba si la información de ese dominio está almacenada de forma local en tu computadora.

Si no es así, el navegador envía una solicitud a tu servidor DNS local (en general proporcionado por tu ISP).

El servidor DNS local busca los detalles del nombre de dominio. Si no encuentra ninguna información, necesitará hallar el [servidor de nombres raíz del dominio] ().

Para localizar el servidor, el servidor DNS dividirá la URL en trozos, de derecha a izquierda. Entonces, para , divide la URL en "com", "ejemplo" y ";.

El servidor DNS se conecta al servidor de nombres raíz DNS para conocer la ubicación del servidor para el primer fragmento del dominio: ".com". Esto se conoce como el.

El servidor DNS se conecta al servidor TLD.

El servidor DNS le pedirá al servidor de nombres de TLD detalles sobre el servidor de nombres que contiene detalles sobre el nombre de dominio ("ejemplo" en nuestro caso).

En este punto, el servidor DNS le solicita al servidor de nombres la información sobre ejemplo.com y el servidor de nombres regresa con la dirección IP del dominio.

Hacer una conexión DNS es esencial ya que es el primer paso para acceder a un sitio web. Si Google no puede establecer una conexión DNS, no puede encontrar, y mucho menos acceder, a tu sitio web.

Hay dos tipos de errores de DNS que encuentra Google:

  1. Tiempo de espera de DNS:Tu servidor DNS no respondió a la petición de Google suficientemente rápido.

  2. Búsqueda de DNS:Google no pudo acceder a tu sitio porque tu servidor DNS no pudo hallar tu nombre de dominio.

Tiempo de espera de DNS:Tu servidor DNS no respondió a la petición de Google lo suficientemente rápido.

Búsqueda de DNS:Google no pudo acceder a tu sitio pues tu servidor DNS no pudo hallar tu nombre de dominio.

Si no puedes acceder a tu lugar como Google usando, consulta con tu distribuidor de DNS.

2.0.2) Errores del servidor

Los errores de servidor son diferentes de los errores de DNS. Quiere decir que Google pudo buscar tu URL en el servidor DNS. No obstante, no puede cargar la página debido a un problema del servidor.

Esto en general significa que tu servidor está tardando demasiado en contestar y la solicitud de Google ha expirado. Google dedicará solo una cierta cantidad de tiempo a aguardar una contestación del servidor. Si toma demasiado tiempo el bot se dará por vencido.

Al igual que los errores de DNS, un fallo de servidor es un gran problema para tu sitio web. Quiere decir que algo salió mal con tu servidor e impide que los usuarios y los robots accedan a tu sitio.

La forma en que repares el fallo de tu servidor dependerá de cuál sea el fallo. Hay varios géneros de fallos de servidor:

  • Tiempo de espera: el servidor sencillamente tardó demasiado en responder a la solicitud de Googlebot.

  • Encabezados truncados: tu servidor terminó la conexión antes de que se enviaran los encabezados completos.

  • Restablecimiento de la conexión: Google pudo conectarse a tu lugar, mas no recibió nada pues la conexión se restableció a mitad de la contestación.

  • Respuesta truncada: la conexión finalizó antes de que Google recibiese una respuesta completa.

  • Conexión rechazada: tu servidor se negó a conectarse con Googlebot.

  • Falló la conexión: la red de tu servidor estaba inactiva o inaccesible.

Tiempo de espera: el servidor simplemente tardó demasiado en contestar a la petición de Googlebot.

Encabezados truncados: tu servidor terminó la conexión antes que se enviaran los encabezados completos.

Restablecimiento de la conexión: Google pudo conectarse a tu sitio, mas no recibió nada por el hecho de que la conexión se restableció a mitad de la respuesta.

Respuesta truncada: la conexión finalizó antes que Google recibiera una respuesta completa.

Conexión rechazada: tu servidor se negó a conectarse con Googlebot.

Falló la conexión: la red de tu servidor estaba inactiva o inaccesible.

*Tiempo de espera de conexión: la conexión también tardó en procesarse.

  • Sin respuesta: la conexión con tu servidor finalizó antes de que se pudiese enviar cualquier contestación.

Consulta elpara conseguir recursos sobre cómo solventar inconvenientes de cada género de error del servidor.

2.0.3) Falla de robots

Las fallas del robot se refieren a la incapacidad de Google para hallar y leer el fichero robots.txt de un sitio en /robots.txt. Si DNS es el paso 1 y hacer una conexión con el servidor es el paso dos, entonces leer robots.txt es el paso tres cuando Google rastrea un sitio web.

Google no quiere rastrear y también indexar las páginas que tú no deseas, por lo que si no puede acceder a un fichero robots.txt, pospondrá el rastreo hasta el momento en que pueda leer el fichero. Sin embargo, si deseasque Google rastree cada página de tu lugar, puedes abandonar a agregar este archivo a tu dominio y también ignorar este error.

Si ves este fallo en Google Search Console, compruebea cómo configuraste tu fichero robots.txt.

  • ¿Lo creaste como un fichero de texto sin formato?
  • ¿Has rechazado tu página de inicio?
  • ¿Tu archivo robots.txt devuelve un estado doscientos o bien un fallo 404?
  • ¿Has verificado doble, triple y cuádruple las líneas Disallow: /?

Cuando hallas un fallo de robot, merece la pena señalar que no tener un fichero robots.txt es mejor que tener uno mal configurado, puesto que un fichero robots.txt roto hará que Google evite rastrear stu sitio por completo.

Back to top

3) Errores de URL

Los fallos de URL difieren de los errores de lugar en que solo se aplican a una página específica, no a tu sitio por norma general. Marcan las instancias en las que Google solicitó una página específica, mas no pudo leerla.

3.0.1) 404 suaves

El nombre "404 suave" puede ser un poco engañoso para algunos. Estas no son páginas que devuelven un código de estado cuatrocientos cuatro. En verdad, estas son páginas que devuelven un estado HTTP doscientos. El inconveniente es que en su mayoría son páginas vacías.

Google es bastante bueno para hallar dónde se halla el contenido en una página. Entonces, cuando una URL contiene una página que no tiene mucho o ningún "contenido principal", lleva por nombre "404 suave". Técnicamente, la página existe y devuelve un estado 200, pero es una página vacía.

Google marca estas páginas pues no son muy útiles para los usuarios, hacen que Googlebot funcione sin ningún motivo y reducen la eficacia del rastreo de tu lugar.

Tu mejor opción es añadir contenido a estas páginas a fin de que sean útiles o bien no indexarlas para que Google ya no las vea.

Ten en cuenta que si usas una página 404 personalizada que nodevuelve un estado 404, Google probablemente la marcará como un 404 suave.

3.0.2) No encontrado

Las URL no encontradas son los errores 404 reales encontrados en un sitio. Google ha pedido una URL en tu lugar que no existe.

Si bien ver muchas URL "no encontradas" en tu informe de Fallos de rastreo puede tirarte el ánima al piso, no es tan catastrófico como parece.

De hecho, según Google, los errores cuatrocientos cuatro no afectan la indexación o clasificación de tu sitio.

La gran mayoría de los errores 404 que verás no necesitarán ser reparados. Al decidir si corregir o no una URL 404, considera...

  • ¿La URL tiene muchos links externos de alta calidad?
  • ¿Recibe mucho tráfico?
  • ¿Es una URL que los usuarios evidentemente esperarían existir?

Si la contestación a una o bien más de estas preguntas es sí, seguramente deberías investigar la causa del fallo. Si el cuatrocientos cuatro es causado por un link interno deficiente, debes definitivamentearreglarlo.

Arreglar tus 404 dependerá de la causa. Podría ser tan simple como corregir fallos tipográficos en un link interno. Si se trata de enlaces externos a páginas viejas, emplea una redirección 301 para redirigir a una nueva. Si parece una URL que la gente esperaría que existiese en tu sitio, considera añadir la página o bien redirigir al contenido relevante en otra una parte de tu lugar.

3.0.3) Acceso denegado

Estos errores ocurren cuando a Google no se le permite acceder a una página determinada. Generalmente son causados ​​por:

  • Contraseña que protege la página
  • Páginas no toleradas por robots.txt
  • Tu distribuidor de alojamiento bloquea Googlebot (¡puede ocurrir!)

Si no quieres que las URL enumeradas en esta área de Fallos de rastreo aparezcan en los resultados de búsqueda, no precisas hacer nada aquí. Esto es realmente una confirmación de que algo está bien.

Sin embargo, si quieres que estas páginas aparezcan en los resultados de búsqueda, deberás corregir lo que bloquea a Google.

3.0.4) No seguido

No confundas este error con la directiva de enlace o la etiqueta de meta robots. Estas URL no tienen nada que ver con eso. Las URL no seguidas en Fallos de rastreo son simplemente URL que Google no pudo continuar totalmente a su destino.

Las razones para esto podrían ser:

  • Flash, JavaScript u otro contenido activo que bloquea Google
  • Redireccionamientos rotos, bucles o bien cadenas
  • Enlace relativo en redirecciones
  • URL redirigidas incluidas en tu mapa del sitio

Nuevamente, como con los 404 y el acceso denegado, decide si no merece la pena corregir las URL aquí. Si las páginas no importan realmente a tu sitio, puedes decidir no preocuparte por arreglarlas.

3.0.5) Errores de servidor y fallos de DNS

Estos son los mismos géneros de fallos encontrados en los errores del lugar anteriores. Google no pudo localizar el DNS de una URL, o algo salió mal con tu servidor al intentar servir la página. La diferencia aquí es que estos fallos se restringen a las URL individuales, en lugar de afectar a todo tu sitio.

Para conseguir más orientación de Google sobre qué significa cada error y cómo solucionarlo, lee el [artículo de Ayuda de Google Search Console]
() sobre errores de rastreo.

Back to top

4) Herramienta de inspección de URL

Google Search Console te permite buscar páginas individuales en tu sitio para detectar problemas de indexación y fallos de rastreo. Puedes acceder a la inspección de URL para URLs individuales de varias maneras:

  1. Al hacer clic en el link de inspección de URL en la barra de navegación de la izquierda o bien ingresar la URL en la barra de búsqueda en la parte superior de la página. Despuésselecciona una propiedad de la página de bienvenida de Search Console.

  2. Al hacer click en el icono de lupa en la fila de una URL en el informe de desempeño.

Al hacer click en el enlace de inspección de URL en la barra de navegación de la izquierda o ingresar la URL en la barra de búsqueda en la parte superior de la página. Despuésselecciona una propiedad de la página de bienvenida de Search Console.

Al hacer click en el icono de lupa en la fila de una URL en el informe de desempeño.

La herramienta te indica si una página está o bien no en el índice de Google y detalla lo que Google encontró cuando intentó localizar la página.

  • La página en la que Google encontró el enlace a tu página.

  • La última vez que los rastreadores de Google intentaron acceder a la página

La página en la que Google encontró el enlace a tu página.

La última vez que los rastreadores de Google intentaron acceder a la página

Esto es lo que incluye el informe de la herramienta para una página que devuelve un estado HTTP 404:

Back to top

5) ¿Cuál es el problema con los fallos de rastreo?

El inconveniente más obvio de tener errores de rastreo en tu sitio es que estos fallos impiden que Google acceda a tu contenido. Google no puede posicionar las páginas a las que no puede acceder. Una alta tasa de errores de rastreo también puede afectar la manera en que Google ve tu sitio web.

Muchos errores de rastreo también pueden tener un impacto en cómo Google ve la salud de tu sitio por norma general. Cuando los rastreadores de Google tienen muchos inconvenientes para acceder al contenido de un lugar, pueden decidir que no merece la pena rastrear estas páginas con mucha frecuencia. Esto hará que tus nuevas páginas tarden mucho más en ingresar al índice de Google de lo que lo harían de otra forma.

Back to top
Share icon

Solicita información sin compromiso

Políticas de privacidad

De conformidad con lo dispuesto en la Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de Carácter Personal (LOPD) y su normativa de desarrollo, el responsable del sitio web, CITIFACE MANAGEMENT, S.L., en cumplimiento de lo dispuesto en el art. 5 y 6 de la LOPD, informa a todos los usuarios del sitio web www.citiface.com que faciliten, o vayan a facilitar sus datos personales, que estos serán incorporados a un fichero que se encuentra debidamente inscrito en la Agencia Española de Protección de Datos.

Consentimiento del usuario:
Mediante la marcación de las correspondientes casillas, en los formularios dispuestos en el sitio web para la recogida de datos, los usuarios aceptan expresamente y de forma libre e inequívoca que sus datos personales sean tratados con las finalidades y destinos que se detallarán a continuación.

Finalidad
Los datos que se faciliten a través del portal, se destinarán a la finalidad de responder a su solicitud de información, así como a remitirle información que consideremos que pueda ser de su interés. Incluyendo para ello medios electrónicos (email, sms, etc..). Asimismo, y si usted nos lo indica, le remitiremos a su correo electrónico nuestro boletín electrónico SEO/SEM en el que le trasladaremos recomendaciones y herramientas para la mejora de sus campañas de posicionamiento y pago por clic. Los envíos serán con carácter mensual y podrá dejar de recibirlos en cualquier momento a través del mecanismo establecido en el propio email.

Calidad de datos
Los datos marcados como obligatorios en el formulario que usted cumplimente, son necesarios para la prestación de un servicio óptimo al usuario y dar respuesta a sus requerimientos. En caso de que no sean facilitados todos los datos obligatorios, el prestador no garantiza la prestación de los servicios solicitados.
El usuario será el único responsable, respecto a la veracidad y actualización de los datos aportados a través de los distintos formularios del sitio web

Comunicación de datos a terceros
Sus datos personales no serán cedidos, en ningún caso, a terceras compañías, y que siempre que fuera a realizarse algún tipo de cesión de datos personales, de forma previa, se solicitaría el consentimiento expreso, informado, e inequívoco por parte de los titulares. Ejercicio de derechos ARCO
El prestador garantiza en todo caso al usuario el ejercicio de los derechos de acceso, rectificación, cancelación, información y oposición, en los términos dispuestos en la legislación vigente. Por ello, de conformidad con lo dispuesto en la LOPD, podrá ejercer sus derechos remitiendo una solicitud expresa, junto a una copia de su DNI, a través del correo electrónico: info[at]citiface.com o Calle Farell 3, 1-1. 08014 Barcelona .

Medidas de seguridad
Del mismo modo, el prestador, conforme a lo establecido en el Real Decreto 1720/2007, de 21 de diciembre, por el que se aprueba el Reglamento de desarrollo de la L.O. 15/1999, indica que ha adoptado todas las medidas técnicas y organizativas necesarias para garantizar la seguridad e integridad de los datos de carácter personal que trate, así como para evitar su pérdida, alteración y/o acceso por parte de terceros no autorizados.

Menores de edad
Se prohíbe, expresamente, a los menores de 14 años, facilitar ningún dato a través del presente sitio web, sin contar con el consentimiento y supervisión de sus padres o tutores legales.
Si el prestador tuviera noticia acerca de la infracción de la referida prohibición, procederá a la eliminación de cualquier dato asociado al usuario en cuestión.

Uso de cookies y del fichero de actividad
El prestador por su propia cuenta o la de un tercero contratado para la prestación de servicios de medición, pueden utilizar cookies cuando un usuario navega por el sitio web. Las cookies son ficheros enviados al navegador por medio de un servidor web con la finalidad de registrar las actividades del usuario durante su tiempo de navegación.
Las cookies utilizadas por el sitio web se asocian únicamente con un usuario anónimo y su ordenador, y no proporcionan por sí mismas los datos personales del usuario.
Mediante el uso de las cookies resulta posible que el servidor donde se encuentra la web, reconozca el navegador web utilizado por el usuario con la finalidad de que la navegación sea más sencilla, permitiendo, por ejemplo, el acceso a los usuarios que se hayan registrado previamente, acceder a las áreas, servicios, promociones o concursos reservados exclusivamente a ellos sin tener que registrarse en cada visita. Se utilizan también para medir la audiencia y parámetros del tráfico, controlar el progreso y número de entradas.
Puede Usted rechazar el tratamiento de los datos o la información rechazando el uso de cookies mediante la selección de la configuración apropiada de su navegador, sin embargo, debe Usted saber que si lo hace puede ser que no pueda usar la plena funcionabilidad de este website.
Este sitio web utiliza Google Analytics, un servicio analítico de web prestado por Google, Inc., una compañía de Delaware cuya oficina principal está en 1600 Amphitheatre Parkway, Mountain View (California), CA 94043, Estados Unidos («Google»). Google Analytics utiliza «cookies», que son archivos de texto ubicados en su ordenador, para ayudar al website a analizar el uso que hacen los usuarios del sitio web. La información que genera la cookie acerca de su uso del website (incluyendo su dirección IP) será directamente transmitida y archivada por Google en los servidores de Estados Unidos. Google usará esta información, por cuenta nuestra, con el propósito de seguir la pista de su uso del website, recopilando informes de la actividad del website y prestando otros servicios relacionados con la actividad del website y el uso de Internet.
Google podrá transmitir dicha información a terceros cuando así se lo requiera la legislación, o cuando dichos terceros procesen la información por cuenta de Google. Google no asociará su dirección IP con ningún otro dato del que disponga Google.
Puede Usted rechazar el tratamiento de los datos o la información rechazando el uso de cookies mediante la selección de la configuración apropiada de su navegador, sin embargo, debe Usted saber que si lo hace puede ser que no pueda usar la plena funcionalidad de este website. Al utilizar este website Usted consiente el tratamiento de información acerca de Usted por Google en la forma y para los fines arriba indicados. En todo caso, le informamos que para instar a la cancelación de los posibles tratamientos de datos llevados a cabo por Google, deberá dirigirse a esa compañía, a tal efecto. El prestador no tiene la capacidad técnica ni legal, para proceder al cese en el tratamiento de datos fuera del ámbito delimitado por los ficheros y medios técnicos de su titularidad. Y no se le podrán exigir responsabilidades en este sentido. Para conocer más acerca de las cookies es.wikipedia.org/wiki/Cookie_(informática)

SEMrush

SEMrush

SEMrush

ESTOS EXCLUSIVOS INFORMES GRATUITO REVELAN

7 SECRETOS DE EXPERTOS SEO QUE TE LLEVÁN AL 1#
7 SECRETOS DE EXPERTOS SEO QUE TE LLEVÁN AL 1# EN GOOGLE PARA GANAR 10.000s DE TRÁFICO DE CALIDAD GRATUITO - EN SÓLO 2 MESES
 

Los 7 pasos más poderosos para disparar tu ranking orgánico para ALCANZAR Y MANTENER un impresionante tráfico orgánico es TUYO.

Consigue gratis lo que el 1% de los expertos en SEO venden por miles de euros... y el otro 99% ni siquiera sabe que existe.


OBTEN MI INFORME GRATUITO
5 errores que debes evitar en tu sitio web de Drupal
Ebook - 5 errores que debes evitar en tu sitio web de Drupal (¡podrían costarte miles de euros!)
 

Este Ebook cubre 5 terribles errores que probablemente estés cometiendo ahora mismo con tu sitio web de Drupal.

¡Nº3 TE SORPRENDERÁ! Esta lectura de 10 minutos te ahorrará miles de euros.



OBTEN MI INFORME GRATUITO