En primer lugar, comentaros que en este post se pretenden abordar algunos puntos básicos pero importantes sobre los sitemaps. Además, se realizan una serie de recomendaciones que versarán sobre los tipos de sitemaps existentes, qué tipo de urls deben contener y muchos más puntos interesantes sobre ellos.
Pero para empezar, debemos preguntarnos:
¿Existen varios tipos de sitemaps?
Si eres una persona experimentada en las artes de los motores de búsqueda o has cursado un máster de SEO profesional, tendrás esta respuesta más que clara y responderás a esta pregunta con un SI rotundo y… estarás en lo cierto.
Los dos principales tipos de sitemaps que nos interesa diferenciar son:
HTML
XML
SITEMAPS.HTML
Los sitemaps.html, también son llamados mapas del sitio web y son una página html que contienen enlaces hacia todas las páginas más destacables que contiene ese sitio web.
Por ejemplo, si estamos hablando de un blog de cocina, en el que los posts hablan de recetas, el sitemap.html agrupará enlaces hacia cada una de las recetas de cocina que componen el blog.
¿Qué se pretende conseguir con un sitemap de este tipo?
Este tipo de sitemaps, se usan para ayudar a los motores de búsqueda a rastrear de una forma más cómoda la totalidad del sitio web.
SITEMAPS.XML
Estos otros tipos de sitemap, son archivos xml que deben agrupar las urls principales de nuestra web y que ayudan a que los motores de búsqueda rastreen e indexen esas urls.
Además, es muy importante que tengamos en cuenta que las urls que engloban estos archivos pueden agrupar las urls principales del sitio web, productos, post,… o se pueden crear otro tipo de sitemaps de imágenes, vídeos, noticias…
Debido a que estos tipos de sitemaps son los más habitules, desde este punto del post nos centraremos exclusivamente en ellos.
¿Cómo puedo ver un sitemap.xml de un sitio web?
Una de las formas más habituales para poder ver el sitemap.xml de un sitio web, consiste en poner en la barra de direcciones de nuestro navegador el dominio del sitio sitioweb/xml
Aunque pueden incluirse en otras rutas diferentes.
Por ejemplo, el plugin de Yoast genera en base a la configuración realizada en el plugin un sitemap.xml en la siguiente ruta:
www.sitioweb.xxx/sitemap_index.xml
Otra buena forma de localizar este sitemap consiste en mirar el robots.txt de esa web, ya que en es una buena práctica incluir en él la url en la que se encuentra nuestro sitemap.xml.
¿Existe un máximo de urls que se pueden incluir en un sitemap?
Los sitemaps no pueden tener un tamaño superior a 50 MB sin comprimir ni incluir más de 50.000 URL.
¿Y si necesito incluir más urls?
En esos casos se recomienda crear un índice de sitemaps que agrupe el resto de sitemaps del sitio web. De esta forma dividimos sitemaps grandes en otros mucho más pequeños que componen al principal.
¿Qué urls debo y no debo incluir en los sitemaps?
Es importante que todas las urls introducidas en los sitemaps.xml devuelvan un CÓDIGO 200.
Se deben de incluir además, urls que sean INDEXABLES (y que nos interese que se indexen).
NO se deben incluir urls que devuelvan errores.
NO se deben incluir urls que redireccionen.
NO se deben incluir urls que envíen mensajes contradictorios (como por ejemplo con etiquetas canonicals y de indexación)
¿Cómo puedo comprobar si mi sitemap está correcto?
Desde un crawler que todos conocemos como Screaming Frog, tenemos la opción de subir un sitemap y comprobarlo o incluso de crear uno de imágenes en base a las urls introducidas en la rana. Además la “nueva” Search Console nos puede ayudar con esta tarea como veremos más adelante.
¿Desde dónde puedo enviar a Google mi sitemap.xml?
Desde Search Console le indicamos a Google en qué directorio se encuentra el sitemap en nuestro sitio web, y de esta forma entrará en él. Además, tiene un validador que nos indica si el sitemap se encuentra correcto o no cumple con las directrices impuestas por este motor de búsqueda.
Si has llegado hasta aquí es porque te interesa este tema así que sigue documentándote con los pasos de cómo configurar un archivo sitemap y recuerda que no debes olvidar actualizar este fichero de forma frecuente!