Contenido duplicado ¿Qué es y Cómo solucionarlo?

El contenido duplicado básicamente es todo el contenido idéntico que se repite en distintas URLs de un mismo dominio o en una o varias URLs de otro dominio.

También es una de las técnicas más usadas en el Black Hat SEO y una de las más penalizadas tanto por Google como por otros motores de búsqueda.

Aunque el caso más común del contenido duplicado se refleja principalmente a nivel interno en la mayoría de las webs.

De todas formas, el posicionamiento se verá afectado y tendremos que trabajar para corregirlo.

¿Penaliza el contenido duplicado a nivel de SEO?

El contenido duplicado es un problema que puede repercutir de manera negativa en el posicionamiento web.

No es que exista una penalización algorítmica a nivel de buscador que penalicen aquellos dominios con un alto porcentaje de contenido duplicado, sino más bien que estaremos desperdiciando recursos y no estaremos realizando una buena optimización SEO On Page.

Si en tu caso sufres de contenido duplicado te puedes encontrar en las siguientes situaciones:

Google o cualquier otro buscador solo posicionará una de las URLs que comparten el mismo contenido.

Google perderá tiempo en rastrear URLs que nunca posicionarán y estarás perdiendo Crawl budget.

Si las URLs con contenido duplicado reciben enlaces internos estarás perdiendo Link Juice.
Mi recomendación es nada más que lo detectes te pongas manos a la obra para solucionarlo.

¿Cómo encontrar contenido duplicado?

Hay distintas formas de encontrar contenido duplicado, aunque cada una de ellas servirá para encontrar un tipo de duplicidad.

Quizás la forma más común y universal que hay para encontrar este tipo de contenido es a través de los famosos footprints de Google.

footprint contenido duplicado


Aunque hay mucho más casos y forma de encontrar contenido duplicado como veremos ahora.

Contenido duplicado interno

A nivel interno pueden darse el contenido duplicado por diversas razones, aunque las más comunes son por problemas de programación o problemas de mala gestión de contenido.

Mala gestión de contenidos

Sin una buena planificación del contenido dentro de tu site puedes caer en el error de duplicar contenido, productos, páginas, etc.

La duplicidad de contenido no solo se basa en tener dos contenidos idénticos, también sería tener dos artículos que estén enfocados a la misma intención de búsqueda.

Herramienta: Footprint

Solución: Puedes usar cualquier herramienta estilo excel para ordenar todas las URLs de tu contenido, asignando cada URL a una focus keyword, de esta forma solo tendrás una URL concreta por cada keyword que tenga una intención de búsqueda única.

Este proceso siempre los suelo hacer al principio de cada proyecto en el keyword Research, te dejo mi artículo de cómo hacer un keyword Research, puede serte de gran ayuda.

Títulos y metadescripciones Duplicados

Sucede sobre todo en las paginaciones de categorías o subcategorías, todas tienen el mismo meta title y meta description que la primera página.

En este caso no sería un problema como tal, pero tienes que tener en cuenta que lo más seguro es que las paginaciones aunque puedan indexarse no posicionarán por ninguna keyword.

Herramienta: Screaming frog o Footprint

Solución: Yo no me preocuparía demasiado al menos que la paginaciones posicionen por encima de la página principal, en dicho caso lo que haría sería eliminar el título y metadrescription de las paginaciones para que de esta forma tuviera más peso a nivel de SEO la página principal, pero no optación por añadir el rel canonical a la primera página, aunque mucha gente diga que le ha funcionado.

Otra solución sería añadir el Noindex en las paginaciones, aunque los efectos a nivel de SEO son un poco más complicados de explicar.

Paginaciones

Sería un caso muy similar al anterior sobre títulos y metadescripciones duplicadas, en las paginaciones se suele duplicar el texto que tenemos en la primera página, lo que puede saltar las alarmas sobre contenido duplicado en algunas herramientas.

Herramienta: Screaming frog o Footprint

Solución: En este caso mi solución favorita sería igual que la del caso anterior, eliminar el texto que se está replicando en todas las las paginaciones, dejándolo solo en la primera página.

Web de Pruebas

En el caso de que un desarrollador monta una copia idéntica de la web original para hacer pruebas, pero se olvida de bloquear el acceso, Google accede al contenido y lo indexa.

Herramienta: Footprint

Solución: Lo más sencillo es que añadas la etiqueta Noindex en el Clon para que Google no indexe el contenido, aunque en este caso prefiero bloquear el acceso a la web mediante IP (que la web solo sea visible a través de una IP estática tuya, te dejo una guía)

Falta de Hreflang

Si queremos realizar una estrategia de SEO internacional, duplicando el contenido de una web principal en distintos dominios, esperando a que Google por si solo posicione cada contenido en un país concreto.

Herramienta: Screaming frog o Footprint

Solución: Para ello te recomiendo que eches un vistazo a este post sobre etiquetas hreflang.

Falta de etiqueta canonical en el dominio

La etiqueta canonical sirve para decir a Google que si existen dos URLs distintas con el mismo contenido cuál es la original de esas dos.

En el caso más común es cuando usamos  AMP en tu estrategia SEO tendrás dos URLs distintas con el mismo contenido, con la etiqueta canonical se le indica a Google que la URL AMP es canonical de la original.

Otro caso puede ser los buscadores internos dentro de una web, cuando se realiza una búsqueda interna se autogenera una nueva URL, esta nueva URL debe estar en Noindex y no debería estar enlazada desde ninguna URL interna.

En el caso de que sean indexables y estén enlazadas deberás vigilar de que contenga un rel canonical que apunte hacia una URL útil como puede ser tu home o una categoría principal en el caso de que la búsqueda se realice en una sección.

Herramienta: Screaming frog

Solución: Implementar rel canonical.

Contenido duplicado externo

Cuando un contenido se encuentra en dos sitios webs con diferentes duelos, esto puede pasar por los siguientes casos:

Copiando un contenido de otra web

Es lo que hacen las personas que quieren probar suerte haciendo un poco de Black (aunque más bien es una pérdida de tiempo en la mayoría de casos), consiste en ir a una web y copiar el contenido.

Herramienta: Footprint

Solución: En el caso de que te copien el contenido de forma literal es bastante complicado de solucionar, yo te aconsejaría que contactes con el dueño de la web y los soluciones de forma pacífica. En el caso de que no surta efecto tienes esta guía sobre cómo desindexar una URL en Google.

Compartir un artículo con otra web

Este caso se suele ver bastante con las notas de prensa, estas se basan en enviar el mismo texto a varios medios distintos a la espera de que publiquen la noticia para ganar un backlink.

Puede parecer una buena estrategia de Link Building, además de otros beneficios como enviar tráfico a tu site desde otras web, pero no soy muy amigo de esta técnica.

Herramienta: Footprint

Solución: Yo haría modificaciones en cada contenido que enviase a cada medio, de esta forma seguiría ganando autoridad y tráfico, además de que cada URL que me enlaza tendría un contenido único.

Conclusión

El contenido duplicado puede venir por distintas razones como hemos visto anteriormente, mi consejo es que vigiles bastante el contenido que hay tanto dentro como fuera de tu site para tenerlo controlado.

Aquí puedes ver más información externa sobre contenido duplicado:

developers.google.com
Fuente: este post proviene de antoniomunoz, donde puedes consultar el contenido original.
¿Vulnera este post tus derechos? Pincha aquí.
Creado:
¿Qué te ha parecido esta idea?

Esta idea proviene de:

Y estas son sus últimas ideas publicadas:

Etiquetas: seo

Recomendamos

Relacionado

seo

La etiqueta rel=canonical es una forma que tenemos para decirle al crawler del motor de búsqueda que una URL es una copia de otra URL específica. Evitando de esta forma que Google pueda considerar que nuestra URL es contenido duplicado o thin content. ¿Por qué es importante el rel=canonical? Cuando hablamos de contenido duplicado en Google no es algo que debamos tomar a la ligera. En el caso de qu ...

Uncategorized

Contenido duplicado usa canonical para no meterte goles en propia meta Una de las penalizaciones más frecuentes es la del contenido duplicado, no sólo porque te copien contenido lo que es una batalla perdida, sino que seas tú la persona que se duplica el contenido. Meterse los goles en propia meta es algo que ocurre sin darnos cuenta, además no tienes por qué enterarte si no es muy grave, pero a v ...

Diccionario SEO

En el mundo del SEO el contenido duplicado siempre ha sido un problema, y no estamos hablando únicamente de tener el mismo contenido que otras webs que no son la nuestra, sino también de duplicar contenidos dentro de nuestro propio sitio. Imagina que tienes una web que por ejemplo saca listados, como podría ser una de alquiler de pisos, anuncios clasificados o cualquier cosa parecida. Si indexas e ...

seo

El Thin Content es un contenido de baja calidad que no le aporta valor al usuario, es irrelevante y prácticamente se le considera como basura. Muchas personas creen que es un artículo corto inferior a las 300 palabras que Google cree como “suficiente” para ofrecer un contenido de calidad y lograr posicionar. No es imposible posicionar textos inferiores a las 200 palabras, claro, respon ...

general seo

La información duplicada en Internet es un problema que afecta a los buscadores web. Una misma información puede servirse desde múltiples direcciones distintas, discriminar cuál es la correcta no es una tarea que pueda dilucidar fácilmente un buscador. Los buscadores en Internet han dotado a los propietarios de sitios web (webmaster) de mecanismos que permiten informarles de cuál es la URL (la dir ...

SEO

Cuando hablamos de páginas huérfanas en términos de SEO, nos referimos a aquellas páginas de una web que no están enlazadas desde otras partes del mismo sitio. Esto significa que los usuarios no pueden llegar a estas páginas navegando por el sitio web, y lo más importante, los motores de búsqueda como Google tienen dificultades para encontrarlas, y sobre todo indexarlas.   En este artículo de nues ...

#NotiGoogle

Google nos cuenta desde su cuenta oficial, Google Webmasters, como evitar el contenido duplicado externo; además ya habíamos visto que nuestro contenido puede competir en nuestra contra, y esta es una buena solución para evitarlo. Si eres de los que publica sus artículos en diferentes sitios además del tuyo; sea por convenios con terceros o porque tienes otros canales de difusión, haciendo esto pu ...

seo

La etiqueta Hreflang sirve para indicar a Google las diferentes versiones que existen de una URL orientadas a idiomas o territorios diferentes. Esta etiqueta es parte fundamental de una correcta implementación del SEO internacional, si estás buscando crear una estrategia por territorios o idiomas tienes que leer este texto :). Cómo afecta la etiqueta Hreflang a Google Esta etiqueta ayuda a Google ...

internet posicionamiento web seo contenido duplicado ...

Dentro del mundo web, el contenido duplicado es uno de los mayores problemas con los que te puedes encontrar y son muchas las personas que no saben si realmente el contenido duplicado afecta a su web y, sobre todo, de qué forma lo hace. Sin embargo, acerca del contenido duplicado, Google tiene sus propias políticas y son muy estrictos con ese tema. El no conocerlo, puede hacer que tengas problemas ...

seo

El crawling o crawleo es un procedimiento que realizan los motores de búsqueda para encontrar y analizar el contenido de un sitio web a través de “saltos” en cada URL. Aquí es cuando también se añaden los términos de araña, Crawler o rastreadores, ya que el Bot se desplaza por los enlaces para abarcar todos los rincones de la web. En el caso del navegador más utilizado del mundo (Google), su crawl ...