La información duplicada en Internet es un problema que afecta a los buscadores web. Una misma información puede servirse desde múltiples direcciones distintas, discriminar cuál es la correcta no es una tarea que pueda dilucidar fácilmente un buscador.
Los buscadores en Internet han dotado a los propietarios de sitios web (webmaster) de mecanismos que permiten informarles de cuál es la URL (la dirección) preferida para ofrecer la información en los resultados de sus búsquedas.
Un sencillo ejemplo del problema:
Imaginemos que tenemos una web de venta al público llamada www.ejemplo.com y desde esa web se vende el artículo "calcetines rojos". En la web www.ejemplo.com se puede acceder a los "calcetines rojos" con la dirección www.ejemplo.com/calcetines_rojos o escribiendo ejemplo.com/calcetines_rojos. Incluso puede almacenar la misma oferta pero ofreciendo la búsqueda al usuario ya no por una dirección concreta sino por un color: www.ejemplo.com/calcetines?color=rojo.
Al final vemos que la información del artículo "calcetín rojo" puede ser accedida por medio de tres direcciones distintas o poniendo www.ejemplo.com/calcetines_rojos o ejemplo.com/calcetines_rojos o incluso www.ejemplo.com/calcetines?color=rojo.
En los Blogs sucede igual, puedes tener más de una etiqueta que es referenciadad desde distintas direcciones: diariosdelanube.com/search/label/SEO o www.diariosdelanube.com/search/label/SEO.
En ambos casos vemos cómo la misma información es accesible desde diferentes URLs generando un potencial contenido duplicado. ¿Qué dominio o dirección de la tienda online es con la que el buscador debe quedarse cuando alguien busque calcetines rojos en Internet en la web de ejemplo?, ¿cuál es la preferida para mostrar los temas de SEO en el ejemplo del Blog?.
Una sencilla solución al problema:
1) Utiliza el dominio canónico:
El dominio canónico advierte al buscador de cuál es la dirección donde debe consolidarse la información duplicada o similar dentro de un sitio web. Si la misma información ha sido rastreada desde distintas direcciones dentro de un mismo sitio web, el buscador puede resolver por medio de la URL canónica cuál es la dirección apropiada para mostrar en sus resultados.Tal como hemos visto en los ejemplos, si la web o el Blog marcan su dominio canónico, el buscador podrá asociar y mostrar el contenido vinculado a la dirección que especifique como "canónica" el propietario de la web (el webmaster).Si no utilizas dominio canónico y el buscador encuentra resultados coincidentes en más de una dirección de tu sitio web, lo más probable es que calcule cuál es la dirección apropiada en base a sus algoritmos y es posible que ésta no sea la que te interese. Además estarás generando contenido duplicado, con el consiguiente problema que esto ocasiona: dificultades para rastrear tu sitio web, problemas en el análisis de información del sitio, impacto negativo a la hora de presentar resultados al usuario, omisión de resultados duplicados en los resultados de búsqueda, etc...¿Cómo pongo el dominio canónico en mi web o Blog?: Antes de que se cierre la etiqueta </head> de tu web escribe: <link href="http://nombre_de_tu_web.com/" rel="canonical"/>En un Blog de Blogger pondrás:
<link href="http://nombre_de_tu_blog.blogspot.com/" rel="canonical"/>En Diarios de la nube la URL canónica la marco así:<link href="http://www.diariosdelanube.com/" rel="canonical"/>
2) Utiliza la URL preferida en las herramientas para Webmaster de Google:
Google ofrece la posibilidad de indicar el dominio canónico por medio de sus herramientas para webmaster.2.1 En primer lugar será necesario que tu Blog o sitio web esté correctamente dado de alta en las herramientas para webmaster de Google: Aprende a utilizar las Herramientas para Webmaster de Google.Una vez informado tu sitio web es posible que debas marcar las formas de identificarlo en las herramientas para webmaster: Puedes ver cómo he identificado Diarios de la nube de dos formas distintas en las herramientas para webmaster de Google: diariosdelanube.com y www.diariosdelanube.com
Esto es porque se puede acceder a Diarios de la nube de las dos maneras (con www y sin www porque se hace una redirección).
2.2 Como mi Blog puede rastrearse en Google tanto con www.diariosdelanube.com como diariosdelanube.com, en las herramientas de webmaster tengo dadas de alta ambas URLs.Yo sólo trabajo con www.diariosdelanube.com, es la dirección donde subo el sitemap.xml y llevo toda la gestión de herramientas así como mi URL preferida para las redes sociales, etc... 2.3 En las herramientas para webmaster de Google, hago "clic" sobre mi dominio preferido (www.diariosdelanube.com) y una vez he accedido a la página inicial del sitio hago clic en la "rueda dentada" de configuración que se encuentra en la parte superior derecha de la página para seleccionar "Configuración del sitio".
2.4 En "configuración del sitio" observad que hay una zona donde os aparecerán todos los dominios asociados a la misma dirección con el título "Dominio preferido". En ella escoged el que deseéis utilizar como dominio principal. Haced que sea el mismo que utilizáis como dominio canónico en el marcado de vuestra web antes del </head>.
¡Eso es todo!, ahora ya habéis conseguido marcar claramente cuál es el dominio principal bajo el que queréis que el buscador trate de la información en los resultados de búsqueda y eliminaréis al máximo las posibilidades de generar contenido duplicado en él.