¿Qué son los errores de rastreo?

¿Qué son los errores de rastreo?

15 Jul 2020 in

Tabla de contenido

Posicionar en la parte superior de los resultados de búsqueda empieza por asegurarse de que Google pueda rastrear y también indexar tu contenido. Cuando no puede abrir apropiadamente una página o bien moverse de una página a otra, no puede indexar el contenido. Estas instancias se conocen como fallos de rastreo.

En este artículo, aprenderás:

  • ¿Qué es un error de rastreo?
  • Errores del sitio
  • Errores de URL
  • Herramienta de inspección de URL
  • ¿Cuál es el inconveniente con los errores de rastreo?
Back to top

1) ¿Qué es un error de rastreo?

Los errores de rastreo son inconvenientes encontrados por los motores de búsqueda cuando intentan acceder a tus páginas. Estos errores evitan que los robots de los motores de búsqueda lean tu contenido y también indexen tus páginas.

Los fallos de rastreo también pueden referirse a un informe libre en la versión heredada de Google Search Console.

El informe de errores de rastreo tiene 2 secciones principales:

  • Errores del sitio: estos fallos impiden que Googlebot acceda a tu sitio web entero.

  • Errores de URL: estos errores se generan cuando Googlebot no puede acceder a una URL específica.

Errores del sitio: estos errores impiden que Googlebot acceda a tu sitio entero.

Errores de URL: estos errores se producen cuando Googlebot no puede acceder a una URL específica.

En la nueva Google Search Console, estos errores se notifican URL por URL en el informe de cobertura.

La nueva sección Cobertura de Search Console también rastrea la indexación a lo largo del tiempo, mostrando cuántos:

  • Errores ha encontrado (y cuántos ha resuelto)
  • Páginas válidas que Google ha indexado
  • Páginas que Google ha encontrado pero no indexado
  • Páginas válidas que Google ha indexado pero en las que encontró errores

Solo discutiremos la sección Errores, ya que estos problemas son los que evitarán que Google rastree o indexe tus páginas.

Back to top

2) Errores de sitio

Los fallos de lugar son problemas que ocurren a nivel de lugar. Los fallos del lugar significan que tus usuarios y Google no pueden acceder a ningunade tus páginas.

Así que no te brinques estos errores.

Hay tres fallos de sitio que Google cuenta como fallos de rastreo.

2.0.1) Error de DNS

Un DNS, que por su sigla en inglés significa "sistema de nombre de dominio", traduce la dirección IP de un sitio de una cadena de números a letras y números utilizables. Esencialmente, es lo que nos deja navegar por Internet sin tener que conocer la dirección IP de cada sitio web que deseamos visitar.

El sistema DNS marcha así:

  1. Escribes un nombre de dominio en tu navegador.

  2. El navegador comprueba si la información de ese dominio está guardada localmente en tu computadora.

  3. Si no es así, el navegador envía una petición a tu servidor DNS local (normalmente proporcionado por tu ISP).

  4. El servidor DNS local busca los detalles del nombre de dominio. Si no encuentra ninguna información, necesitará encontrar el [servidor de nombres raíz del dominio] ().

  5. Para encontrar el servidor, el servidor DNS dividirá la URL en trozos, de derecha a izquierda. Entonces, para , divide la URL en "com", "ejemplo" y ";.

  6. El servidor DNS se conecta al servidor de nombres raíz DNS para conocer la ubicación del servidor para el primer fragmento del dominio: ".com". Esto se conoce como el.

  7. El servidor DNS se conecta al servidor TLD.

  8. El servidor DNS le pedirá al servidor de nombres de TLD detalles sobre el servidor de nombres que contiene detalles sobre el nombre de dominio ("ejemplo" en nuestro caso).

  9. En este punto, el servidor DNS le solicita al servidor de nombres la información sobre ejemplo.com y el servidor de nombres retorna con la dirección IP del dominio.

Escribes un nombre de dominio en tu navegador.

El navegador comprueba si la información de ese dominio está guardada de forma local en tu computadora.

Si no es así, el navegador envía una petición a tu servidor DNS local (en general proporcionado por tu ISP).

El servidor DNS local busca los detalles del nombre de dominio. Si no encuentra ninguna información, necesitará encontrar el [servidor de nombres raíz del dominio] ().

Para hallar el servidor, el servidor DNS dividirá la URL en pedazos, de derecha a izquierda. Entonces, para , divide la URL en "com", "ejemplo" y ";.

El servidor DNS se conecta al servidor de nombres raíz DNS para conocer la ubicación del servidor para el primer fragmento del dominio: ".com". Esto se conoce como el.

El servidor DNS se conecta al servidor TLD.

El servidor DNS le pedirá al servidor de nombres de TLD detalles sobre el servidor de nombres que contiene detalles sobre el nombre de dominio ("ejemplo" en nuestro caso).

En este punto, el servidor DNS le solicita al servidor de nombres la información sobre ejemplo.com y el servidor de nombres regresa con la dirección IP del dominio.

Hacer una conexión DNS es esencial puesto que es el primer paso para acceder a un sitio. Si Google no puede establecer una conexión DNS, no puede encontrar, y mucho menos acceder, a tu sitio web.

Hay 2 géneros de errores de DNS que encuentra Google:

  1. Tiempo de espera de DNS:Tu servidor DNS no respondió a la petición de Google suficientemente rápido.

  2. Búsqueda de DNS:Google no pudo acceder a tu sitio por el hecho de que tu servidor DNS no pudo encontrar tu nombre de dominio.

Tiempo de espera de DNS:Tu servidor DNS no respondió a la petición de Google suficientemente rápido.

Búsqueda de DNS:Google no pudo acceder a tu sitio web pues tu servidor DNS no pudo encontrar tu nombre de dominio.

Si no puedes acceder a tu lugar como Google utilizando, consulta con tu proveedor de DNS.

2.0.2) Errores del servidor

Los fallos de servidor son diferentes de los errores de DNS. Significa que Google pudo buscar tu URL en el servidor DNS. No obstante, no puede cargar la página debido a un problema del servidor.

Esto en general quiere decir que tu servidor está tardando demasiado en contestar y la solicitud de Google ha expirado. Google dedicará solo una cierta cantidad de tiempo a aguardar una contestación del servidor. Si toma demasiado tiempo el bot se dará por vencido.

Al igual que los fallos de DNS, un error de servidor es un enorme inconveniente para tu sitio. Significa que algo salió mal con tu servidor e impide que los usuarios y los robots accedan a tu sitio.

La forma en que repares el fallo de tu servidor dependerá de cuál sea el fallo. Hay varios géneros de fallos de servidor:

  • Tiempo de espera: el servidor simplemente tardó demasiado en contestar a la petición de Googlebot.

  • Encabezados truncados: tu servidor terminó la conexión antes que se enviaran los encabezados completos.

  • Restablecimiento de la conexión: Google pudo conectarse a tu sitio, pero no recibió nada porque la conexión se restableció a mitad de la respuesta.

  • Respuesta truncada: la conexión finalizó antes que Google recibiese una respuesta completa.

  • Conexión rechazada: tu servidor se negó a conectarse con Googlebot.

  • Falló la conexión: la red de tu servidor estaba inactiva o bien inalcanzable.

Tiempo de espera: el servidor sencillamente tardó demasiado en responder a la solicitud de Googlebot.

Encabezados truncados: tu servidor terminó la conexión antes que se enviaran los encabezados completos.

Restablecimiento de la conexión: Google pudo conectarse a tu lugar, pero no recibió nada por el hecho de que la conexión se restableció a mitad de la contestación.

Respuesta truncada: la conexión finalizó antes que Google recibiera una contestación completa.

Conexión rechazada: tu servidor se negó a conectarse con Googlebot.

Falló la conexión: la red de tu servidor estaba inactiva o inalcanzable.

*Tiempo de espera de conexión: la conexión también tardó en procesarse.

  • Sin respuesta: la conexión con tu servidor finalizó antes que se pudiera enviar cualquier contestación.

Consulta elpara conseguir recursos sobre cómo solventar inconvenientes de cada tipo de fallo del servidor.

2.0.3) Falla de robots

Las fallas del robot se refieren a la incapacidad de Google para localizar y leer el fichero robots.txt de un sitio web en /robots.txt. Si DNS es el paso 1 y hacer una conexión con el servidor es el paso 2, entonces leer robots.txt es el paso tres cuando Google rastrea un sitio web.

Google no quiere rastrear y también indexar las páginas que tú no quieres, con lo que si no puede acceder a un fichero robots.txt, pospondrá el rastreo hasta el momento en que pueda leer el archivo. Sin embargo, si deseasque Google rastree cada página de tu sitio, puedes renunciar a añadir este fichero a tu dominio e ignorar este fallo.

Si ves este fallo en Google Search Console, compruebea cómo configuraste tu fichero robots.txt.

  • ¿Lo creaste como un archivo de texto sin formato?
  • ¿Has rechazado tu página de inicio?
  • ¿Tu archivo robots.txt devuelve un estado doscientos o bien un fallo cuatrocientos cuatro?
  • ¿Has verificado doble, triple y cuádruple las líneas Disallow: /?

Cuando encuentras un fallo de robot, vale la pena señalar que no tener un fichero robots.txt es mejor que tener uno mal configurado, ya que un archivo robots.txt roto hará que Google evite rastrear stu sitio por completo.

Back to top

3) Errores de URL

Los errores de URL difieren de los errores de sitio en que solo se aplican a una página específica, no a tu lugar generalmente. Marcan las instancias en las que Google solicitó una página específica, pero no pudo leerla.

3.0.1) 404 suaves

El nombre "404 suave" puede ser un tanto engañoso para ciertos. Estas no son páginas que devuelven un código de estado cuatrocientos cuatro. En verdad, estas son páginas que devuelven un estado HTTP doscientos. El problema es que en su mayoría son páginas vacías.

Google es bastante bueno para hallar dónde se halla el contenido en una página. Entonces, en el momento en que una URL contiene una página que no tiene mucho o bien ningún "contenido principal", lleva por nombre "404 suave". Técnicamente, la página existe y devuelve un estado doscientos, pero es una página vacía.

Google marca estas páginas porque no son muy útiles para los usuarios, hacen que Googlebot funcione sin ningún motivo y reducen la eficiencia del rastreo de tu lugar.

Tu mejor opción es añadir contenido a estas páginas para que sean útiles o no indexarlas a fin de que Google ya no las vea.

Ten en cuenta que si utilizas una página 404 adaptada que nodevuelve un estado cuatrocientos cuatro, Google seguramente la marcará como un 404 suave.

3.0.2) No encontrado

Las URL no encontradas son los errores cuatrocientos cuatro reales encontrados en un sitio. Google ha pedido una URL en tu lugar que no existe.

Si bien ver muchas URL "no encontradas" en tu informe de Errores de rastreo puede tirarte el alma al piso, no es tan desastroso como parece.

De hecho, según Google, los fallos 404 no afectan la indexación o bien clasificación de tu sitio.

La gran mayoría de los errores 404 que verás no necesitarán ser reparados. Al decidir si corregir o no una URL cuatrocientos cuatro, considera...

  • ¿La URL tiene muchos links externos de alta calidad?
  • ¿Recibe mucho tráfico?
  • ¿Es una URL que los usuarios evidentemente esperarían existir?

Si la contestación a una o más de estas preguntas es sí, seguramente deberías investigar la causa del fallo. Si el 404 es causado por un enlace interno defectuoso, debes definitivamentearreglarlo.

Arreglar tus 404 dependerá de la causa. Podría ser tan simple como corregir fallos tipográficos en un enlace interno. Si se trata de enlaces externos a páginas antiguas, usa una redirección 301 para redirigir a una nueva. Si semeja una URL que la gente esperaría que existiese en tu sitio, considera agregar la página o bien redirigir al contenido relevante en otra una parte de tu sitio.

3.0.3) Acceso denegado

Estos fallos ocurren cuando a Google no se le deja acceder a una página determinada. Normalmente son causados ​​por:

  • Contraseña que protege la página
  • Páginas no permitidas por robots.txt
  • Tu proveedor de hosting bloquea Googlebot (¡puede suceder!)

Si no deseas que las URL enumeradas en esta área de Errores de rastreo aparezcan en los resultados de búsqueda, no necesitas hacer nada aquí. Esto es en realidad una confirmación de que algo está bien.

Sin embargo, si deseas que estas páginas aparezcan en los resultados de búsqueda, deberás corregir lo que bloquea a Google.

3.0.4) No seguido

No confundas este error con la directiva de enlace o la etiqueta de meta robots. Estas URL no guardan relación con eso. Las URL no seguidas en Fallos de rastreo son simplemente URL que Google no pudo continuar totalmente a su destino.

Las razones para esto podrían ser:

  • Flash, JavaScript u otro contenido activo que bloquea Google
  • Redireccionamientos rotos, bucles o cadenas
  • Enlace relativo en redirecciones
  • URL redirigidas incluidas en tu mapa del sitio

Nuevamente, como con los cuatrocientos cuatro y el acceso rechazado, decide si no vale la pena corregir las URL aquí. Si las páginas no importan realmente a tu sitio web, puedes decidir no preocuparte por arreglarlas.

3.0.5) Errores de servidor y fallos de DNS

Estos son exactamente los mismos géneros de errores encontrados en los errores del lugar anteriores. Google no pudo encontrar el DNS de una URL, o bien algo salió mal con tu servidor al tratar de servir la página. La diferencia aquí es que estos errores se restringen a las URL individuales, en lugar de afectar a todo tu sitio.

Para obtener más orientación de Google sobre qué significa cada fallo y cómo solucionarlo, lee el [artículo de Ayuda de Google Search Console]
() sobre fallos de rastreo.

Back to top

4) Herramienta de inspección de URL

Google Search Console te deja buscar páginas individuales en tu sitio para advertir problemas de indexación y fallos de rastreo. Puedes acceder a la inspección de URL para URLs individuales de varias maneras:

  1. Al hacer click en el enlace de inspección de URL en la barra de navegación de la izquierda o bien ingresar la URL en la barra de búsqueda en la parte superior de la página. Despuésselecciona una propiedad de la página de bienvenida de Search Console.

  2. Al hacer clic en el icono de lupa en la fila de una URL en el informe de rendimiento.

Al hacer click en el enlace de inspección de URL en la barra de navegación de la izquierda o ingresar la URL en la barra de búsqueda en la parte superior de la página. Despuésselecciona una propiedad de la página de bienvenida de Search Console.

Al hacer click en el icono de lupa en la fila de una URL en el informe de rendimiento.

La herramienta te señala si una página está o bien no en el índice de Google y especifica lo que Google encontró cuando intentó encontrar la página.

  • La página en la que Google encontró el enlace a tu página.

  • La última vez que los rastreadores de Google intentaron acceder a la página

La página en la que Google encontró el link a tu página.

La última vez que los rastreadores de Google procuraron acceder a la página

Esto es lo que incluye el informe de la herramienta para una página que devuelve un estado HTTP 404:

Back to top

5) ¿Cuál es el problema con los errores de rastreo?

El problema más obvio de tener fallos de rastreo en tu sitio es que estos errores impiden que Google acceda a tu contenido. Google no puede posicionar las páginas a las que no puede acceder. Una alta tasa de errores de rastreo también puede afectar la manera en que Google ve tu sitio web.

Muchos errores de rastreo también pueden tener un impacto en cómo Google ve la salud de tu sitio normalmente. Cuando los rastreadores de Google tienen muchos problemas para acceder al contenido de un sitio, pueden decidir que no merece la pena rastrear estas páginas con mucha frecuencia. Esto hará que tus nuevas páginas tarden mucho más en ingresar al índice de Google de lo que lo harían de otro modo.

Back to top
Share icon

Solicita información sin compromiso

Políticas de privacidad

De conformidad con lo dispuesto en la Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de Carácter Personal (LOPD) y su normativa de desarrollo, el responsable del sitio web, CITIFACE MANAGEMENT, S.L., en cumplimiento de lo dispuesto en el art. 5 y 6 de la LOPD, informa a todos los usuarios del sitio web www.citiface.com que faciliten, o vayan a facilitar sus datos personales, que estos serán incorporados a un fichero que se encuentra debidamente inscrito en la Agencia Española de Protección de Datos.

Consentimiento del usuario:
Mediante la marcación de las correspondientes casillas, en los formularios dispuestos en el sitio web para la recogida de datos, los usuarios aceptan expresamente y de forma libre e inequívoca que sus datos personales sean tratados con las finalidades y destinos que se detallarán a continuación.

Finalidad
Los datos que se faciliten a través del portal, se destinarán a la finalidad de responder a su solicitud de información, así como a remitirle información que consideremos que pueda ser de su interés. Incluyendo para ello medios electrónicos (email, sms, etc..). Asimismo, y si usted nos lo indica, le remitiremos a su correo electrónico nuestro boletín electrónico SEO/SEM en el que le trasladaremos recomendaciones y herramientas para la mejora de sus campañas de posicionamiento y pago por clic. Los envíos serán con carácter mensual y podrá dejar de recibirlos en cualquier momento a través del mecanismo establecido en el propio email.

Calidad de datos
Los datos marcados como obligatorios en el formulario que usted cumplimente, son necesarios para la prestación de un servicio óptimo al usuario y dar respuesta a sus requerimientos. En caso de que no sean facilitados todos los datos obligatorios, el prestador no garantiza la prestación de los servicios solicitados.
El usuario será el único responsable, respecto a la veracidad y actualización de los datos aportados a través de los distintos formularios del sitio web

Comunicación de datos a terceros
Sus datos personales no serán cedidos, en ningún caso, a terceras compañías, y que siempre que fuera a realizarse algún tipo de cesión de datos personales, de forma previa, se solicitaría el consentimiento expreso, informado, e inequívoco por parte de los titulares. Ejercicio de derechos ARCO
El prestador garantiza en todo caso al usuario el ejercicio de los derechos de acceso, rectificación, cancelación, información y oposición, en los términos dispuestos en la legislación vigente. Por ello, de conformidad con lo dispuesto en la LOPD, podrá ejercer sus derechos remitiendo una solicitud expresa, junto a una copia de su DNI, a través del correo electrónico: info[at]citiface.com o Calle Farell 3, 1-1. 08014 Barcelona .

Medidas de seguridad
Del mismo modo, el prestador, conforme a lo establecido en el Real Decreto 1720/2007, de 21 de diciembre, por el que se aprueba el Reglamento de desarrollo de la L.O. 15/1999, indica que ha adoptado todas las medidas técnicas y organizativas necesarias para garantizar la seguridad e integridad de los datos de carácter personal que trate, así como para evitar su pérdida, alteración y/o acceso por parte de terceros no autorizados.

Menores de edad
Se prohíbe, expresamente, a los menores de 14 años, facilitar ningún dato a través del presente sitio web, sin contar con el consentimiento y supervisión de sus padres o tutores legales.
Si el prestador tuviera noticia acerca de la infracción de la referida prohibición, procederá a la eliminación de cualquier dato asociado al usuario en cuestión.

Uso de cookies y del fichero de actividad
El prestador por su propia cuenta o la de un tercero contratado para la prestación de servicios de medición, pueden utilizar cookies cuando un usuario navega por el sitio web. Las cookies son ficheros enviados al navegador por medio de un servidor web con la finalidad de registrar las actividades del usuario durante su tiempo de navegación.
Las cookies utilizadas por el sitio web se asocian únicamente con un usuario anónimo y su ordenador, y no proporcionan por sí mismas los datos personales del usuario.
Mediante el uso de las cookies resulta posible que el servidor donde se encuentra la web, reconozca el navegador web utilizado por el usuario con la finalidad de que la navegación sea más sencilla, permitiendo, por ejemplo, el acceso a los usuarios que se hayan registrado previamente, acceder a las áreas, servicios, promociones o concursos reservados exclusivamente a ellos sin tener que registrarse en cada visita. Se utilizan también para medir la audiencia y parámetros del tráfico, controlar el progreso y número de entradas.
Puede Usted rechazar el tratamiento de los datos o la información rechazando el uso de cookies mediante la selección de la configuración apropiada de su navegador, sin embargo, debe Usted saber que si lo hace puede ser que no pueda usar la plena funcionabilidad de este website.
Este sitio web utiliza Google Analytics, un servicio analítico de web prestado por Google, Inc., una compañía de Delaware cuya oficina principal está en 1600 Amphitheatre Parkway, Mountain View (California), CA 94043, Estados Unidos («Google»). Google Analytics utiliza «cookies», que son archivos de texto ubicados en su ordenador, para ayudar al website a analizar el uso que hacen los usuarios del sitio web. La información que genera la cookie acerca de su uso del website (incluyendo su dirección IP) será directamente transmitida y archivada por Google en los servidores de Estados Unidos. Google usará esta información, por cuenta nuestra, con el propósito de seguir la pista de su uso del website, recopilando informes de la actividad del website y prestando otros servicios relacionados con la actividad del website y el uso de Internet.
Google podrá transmitir dicha información a terceros cuando así se lo requiera la legislación, o cuando dichos terceros procesen la información por cuenta de Google. Google no asociará su dirección IP con ningún otro dato del que disponga Google.
Puede Usted rechazar el tratamiento de los datos o la información rechazando el uso de cookies mediante la selección de la configuración apropiada de su navegador, sin embargo, debe Usted saber que si lo hace puede ser que no pueda usar la plena funcionalidad de este website. Al utilizar este website Usted consiente el tratamiento de información acerca de Usted por Google en la forma y para los fines arriba indicados. En todo caso, le informamos que para instar a la cancelación de los posibles tratamientos de datos llevados a cabo por Google, deberá dirigirse a esa compañía, a tal efecto. El prestador no tiene la capacidad técnica ni legal, para proceder al cese en el tratamiento de datos fuera del ámbito delimitado por los ficheros y medios técnicos de su titularidad. Y no se le podrán exigir responsabilidades en este sentido. Para conocer más acerca de las cookies es.wikipedia.org/wiki/Cookie_(informática)

SEMrush

SEMrush

SEMrush

ESTOS EXCLUSIVOS INFORMES GRATUITO REVELAN

7 SECRETOS DE EXPERTOS SEO QUE TE LLEVÁN AL 1#
7 SECRETOS DE EXPERTOS SEO QUE TE LLEVÁN AL 1# EN GOOGLE PARA GANAR 10.000s DE TRÁFICO DE CALIDAD GRATUITO - EN SÓLO 2 MESES
 

Los 7 pasos más poderosos para disparar tu ranking orgánico para ALCANZAR Y MANTENER un impresionante tráfico orgánico es TUYO.

Consigue gratis lo que el 1% de los expertos en SEO venden por miles de euros... y el otro 99% ni siquiera sabe que existe.


OBTEN MI INFORME GRATUITO
5 errores que debes evitar en tu sitio web de Drupal
Ebook - 5 errores que debes evitar en tu sitio web de Drupal (¡podrían costarte miles de euros!)
 

Este Ebook cubre 5 terribles errores que probablemente estés cometiendo ahora mismo con tu sitio web de Drupal.

¡Nº3 TE SORPRENDERÁ! Esta lectura de 10 minutos te ahorrará miles de euros.



OBTEN MI INFORME GRATUITO