Hoy nos toca el tercer blog post especializado en sistemas de indexación posicionamiento SEO. Ya hemos abordadoy lapara supervisar la indexación. Ahora nos toca trabajar con otro de los ficheros más conocidos del SEO: los archivos sitemaps.xml. Como en anteriores ocasiones vamos desgranar todo el contenido en distintos puntos, en este caso hablaremos sobre doce cosas que es importante que sepas sobre estos archivos. Algunas serán sabidas, otras espero que te sorprendan y lógicamente algunas serán validas para unos proyectos u otros.
Back to top1) Qué son y cómo crear los sitemaps.xml
Los Sitemap no son más que una vía que nos ofrecen los motores de búsqueda a fin de que mismos les afirmemos que páginas deberían rastrear. Como prácticamente todo en herramientas de indexación son solo sugerencias y Google en realidad visitará las páginas que le de la gana en el orden que él desee. Sin embargo en muchos proyectos en los que (más por defecto de la web que de las arañas de Google) las arañas van un poco perdidas han demostrado ser de enorme utilidad para guiarlas y asistirlas a hallar el contenido.
Los sitemaps.xml son uno de los primeros ficheros que Google se preocupó por que conociésemos y eso ha logrado que exista muchísima documentación sobre como crearlos. A día de el día de hoy la mejor referencia oficial que tenemos la encontramos en "en muchísimos idiomas. El protocolo es muy simple mas tiene algunas peculariedades.
Este es el formato normal de un archivo sitemaps.xml bien hecho:
De esta estructura lo esencial es sobretodo la declaración inicial. Si no definimos el sitemap como un XML y sus atributos xmlns no será bien interpretado. Luego solo se trata de ir añadiendo nodos <url> con sus detalles (de los que solo <loc> es obligatorio). De echo la enorme mayoría de los sitemaps que encontraras verás que solo contienen el nodo "loc" y ningún otro detalle de las URLs.
La codificación de caracteres también es fundamental, solo se admite UTF-8 así que hay que revisarla. Además el sistema nos prohíbe de forma explicita el uso de ciertos caracteres. Si queremos usarlos tenemos que "escapearlos" en código HTML, esto es, debemos utilizar un código HTML para identificar el carácter preciso que verdaderamente queremos agregar.
Por suerte estos no son muchos:
Todo muy lógico, y no es nada que aun site con un tanto de posicionamiento en buscadores onpage bien hecho le vaya a afectar. Mas tengámonos en cuenta. Por ejemplo, ¿qué pasa con esta url: "?categoria=2&producto=25"? puesto que que realmente en nuestro sitemap deberíamos incluirla como "?categoria=2&producto=25".
Por último hay una restricción de tamaño: