contenido duplicado

Cómo evitar contenido duplicado en mi web

|

Una de las premisas que se marcan desde Google es que el contenido sea original, esto significa que no aparezca en varias URLs diferentes, ya sean nuestras páginas o de un tercero.

Es un problema bastante habitual que suele ocurrir por una mala estructura del sitio web, por no tener las nociones básicas en SEO como para saber que no se puede copiar literalmente lo que hacen otras páginas, o por tener un contenido tan bueno que otros lo replican.

A continuación te explico varias formas de detectarlo y sus soluciones.

contenido duplicado

El contenido duplicado es aquel que es idéntico en parte o totalidad y que se muestra desde direcciones diferentes generando al sitio web problemas para el posicionamiento en buscadores (SEO) ya que Google no pueden realizar su trabajo correctamente debido a no saber qué dirección deben coger para enseñar el contenido, por haber varias y no conocer cuál es el original.

Otra razón de tener una sola dirección es, por si otras web te enlazan, que todos los usuarios vayan a una misma dirección y no tengan confusiones pensando estar en otra página distinta, además de evitar problemas que repartan la fuerza de enlaces de otra web

¿Cómo reconozco el contenido duplicado?

En la página principal

Tu página principal tiene varias URL’s, primero realizamos si nos ocurre lo siguiente:

Vamos a nuestra página inicial (Home) y comprobamos si podemos llegar de diferentes formas descritas a continuación:

Escribiendo el dominio con www
→ www.midominio.com
Escribiendo sin las www
→ midominio.com
Escribimos el dominio y el archivo que tiene el contenido
→ www.midominio.com/index.html (u otra extensión si es un CMS)
Escribiendo con el archivo pero sin las www
→ midominio.com/index.html (u otra extensión si es un CMS)

Si la url cambia según la escribamos y nos enseña el mismo contenido, tenemos un problema de contenido duplicado. Si cambiamos de dirección y siempre vuelve a la misma, todo esta correcto, solo tenemos una dirección que apunta a un único contenido, la Home.

Soluciones

Canonicalización de la url mediante redireccionamientos en servidor y mediante Google Webmaster Tool especificar el principal, usando un archivo de servidor cuya función es (entre otras cosas) reescribir y redireccionar las direcciones url de los sitios web.

Arquitectura web

Según la arquitectura de tu sitio web mostrarás el contenido de diversas formas, lo más común es utilizar categorías y/o etiquetas directamente asociados con los contenidos, otros sitios web o gestores de contenido usan, por ejemplo, una categorización que le llaman archivos, otros usan autores…

Una sola categorización no provoca duplicidad de contenido, porque lo reproduce parcialmente.
Y ahora te preguntarás, ¿y las etiquetas no hacen lo mismo? No, las etiquetas por si solas no dan contenido duplicado, lo que ocurre es que muchas veces dos etiquetas tienen los mismos artículos, y entonces generan duplicidad.

Los problemas de contenido duplicado que pueden dar estas arquitecturas trata de poseer los mismos contenidos en una o más categorizaciones.

Si un mismo artículo se puede asociar a una o más categorías o a una o más etiquetas, es muy probable que pueda generar en un futuro (y presente) contenido duplicado, al “filtrar” en diferentes direcciones los mismos artículos o contenidos.

Ejemplo práctico:

Escribimos 2 artículos para la categoría “Mejorar una web”. 
El primero, “Estructura web”, escrito por nuestro desarrollador web, “El informático”. Y le da las etiquetas «Web», “HTML5” y “Velocidad de carga”

Un segundo, “Mejorar las imágenes para la web”, lo escribe el diseñador gráfico de la empresa “Como el mío ninguno”. Y lo etiqueta en “Velocidad de carga” e “Imágenes para web”

Categoría “Mejorar una web” enseña “Estructura web” y “Mejoras las imágenes para la web”
La etiqueta de autores El desarrollador, “Estructura web”
La etiqueta de autores El diseñador, “Mejoras las imágenes para la web”
Las etiquetas “Web” y “Velocidad de carga” contienen ambos artículos
La etiqueta “HTML5” tendría “Estructura web”
La etiqueta “Imágenes para web” tendría a “Mejoras las imágenes para la web”

Viendo este ejemplo se ve que el contenido duplicado generado por los diferentes “filtros” que le damos a los artículos son muy útiles para los usuarios una vez navegan, pero poco para los buscadores.

Soluciones

Según el uso y la arquitectura la solución trata de decir a los buscadores que indexen una de las categorizaciones usadas (normalmente la que solo pueda ser usada una sola vez por artículo), y el resto no sean indexadas.

Tecnología

Dependiendo del gestor de contenidos: Prestashop, WordPress, CMS a medida… La mayoría contienen filtros o páginas para enseñar el mismo contenido en diferente orden o diferentes características (ordenado por fecha, cambios de tallas, precios, sesiones de usuarios…), si tu gestor usa filtros o realizan paginación, casi seguro genera contenido duplicado.

La forma de saber si podemos tener problemas de contenido duplicado, es entrar en categorías o artículos y usar los filtros, cambiar las características del contenido, entrar como usuario al contenido pública o ver si tenemos paginación para enseñar el contenido. Si se genera una dirección url con datos que no se pueden leer fácilmente, normalmente usan un “?” e “id=…”, es un indicio de que nuestro CMS esta duplicando contenido.

El problema se da porque el contenido en sí es el mismo, aunque se muestra en diferente orden, o con ligeros cambios de características muy concretas, que son necesarias de controlar para el buen funcionamiento del gestor pero generan diferentes direcciones para un mismo contenido.

Ejemplos

Tenemos 25 artículos en un blog que habla de coches antiguos, pero mostramos solo 10 por cada página al entrar en el blog, esto genera 3 páginas con 10, 10 y 5 artículos mezclados, hablando de los mismos temas, cada una de esas páginas son 3 direcciones diferentes hacia un contenido muy similar.

midominio.com/coches-antiguos/
midominio.com/coches-antiguos/page/2
midominio.com/coches-antiguos/page/3

Tenemos una tienda deportiva con zapatillas de deporte, en un modelo de zapatilla tenemos 3 tallas diferentes y dos colores. Al seleccionar características genera una URL con ellas.

midominio.com/zapatilla-deportiva
midominio.com/zapatilla-deportiva?talla=1&color=rosa
midominio.com/zapatilla-deportiva?talla=2&color=rosa
midominio.com/zapatilla-deportiva?talla=3&color=rosa
midominio.com/zapatilla-deportiva?talla=1&color=morado
midominio.com/zapatilla-deportiva?talla=2&color=morado
midominio.com/zapatilla-deportiva?talla=3&color=morado

Soluciones

Depende si es por filtros o es por paginación hay dos soluciones.

Para todo tipo de parámetros se realiza una canolización de la dirección principal, colocando en su código una etiqueta (meta canonical) que dice cuál debe coger para mostrar el contenido. En caso de parámetros por paginación, es mejor indicar, mediante otra etiqueta diferente, la paginación que se realiza (rel=”next” y rel=”prev”) y la cual ayuda a organizar todo el contenido en vez de solo la principal (meta canonical), mostrando la página más óptima con relación a la búsqueda.

Otra solución es denegar el acceso a los robots, la óptima principalmente para sesiones de usuario.

Para más información sobre el contenido duplicado, te aconsejo que leas lo que dice Google sobre este tema.

Como te he contado, el contenido duplicado es un factor importante para lograr que una página tenga un buen posicionamiento en Google. Si identificas que tu web puede tener alguno de estos problemas, nuestro servicio de SEO te ayudará a resolverlos.

¡Compártelo en tus redes sociales!

Comparte este artículo:

Comentarios (7)

Esteban F. Flórez

Esteban F. Flórez

Buen día, Rubén:

Muchas gracias por tu respuesta. Eres muy amable y has despejado mi duda por completo.

Que tengas un buen lunes y mejor semana.

Un saludo muy cordial.

Rubén Ariño

Rubén Ariño

Buenas Esteban, realmente es un poco denso el contenido, algo de culpa tengo también… Pero gracias por tomar tu tiempo en leerme.
Sobre si penaliza, no es la palabra. Realmente un contenido duplicado Google no lo tiene en cuenta, dando preferencia al primero que encuentra, Google el primero que encuentra lo toma como original, por tanto hay que tener cuidado al escribir el mismo artículo en dos sitios diferentes. Para llegar a «penalizar» debe haber mucho contenido duplicado en una web.

Resumiendo, si escribes para otro, contenido único y enlace a tu blog. Si alguien sabes que va a copiarte, asegúrate de tener indexado tu post antes que publique la copia (¡y te ponga un enlace, claro!).

Saludos!

Esteban F. Flórez

Esteban F. Flórez

Hola Rubén:
Muchas gracias por la información. Confieso que no acabo de estar seguro de entender lo que explicas («mea culpa»), pero volveré con más calma y tiempo. No obstante, te hago una pregunta: Si escribo un post en mi blog y yo mismo lo pongo como invitado en otro y en el que me citan como autor, ¿Google me penaliza? ¿Y si lo hace otro blogger citándome y contando con mi permiso?
Muchas gracias, saludos.

Rubén Ariño

Rubén Ariño

Intenté que no fuera muy técnico, me alegro que se haya entendido.

Lo de que Google es comprensivo… Según el día o, más bien, la actualización con la que se levanta.

Lo de la web estática tampoco lo evita como tal, ya que tienes que redireccionar igualmente los subdominios, eliminar extensiones, directorios… Y con la programación con realizar una buena estrategia de planificación de contenidos y reescritura de URL solucionas mucho contenido duplicado.
El problema suele darse porque se desarrollan webs sin pensar en la optimización para buscadores (ni para usuarios)

Gracias por leer mi primer artículo! Un saludo!

Rubén Ariño

Rubén Ariño

Actúa en la sombra como bien dices, pero por suerte es identificable y hay herramientas que ayudan a identificarlo de forma muy eficiente.

Las categorizaciones es otro mundo paralelo, donde el dueño de la web suele mandar, solucionarlo ya es nuestro trabajo^^

Gracias por leerlo!

Ramón Revesado

Ramón Revesado

Lo cierto es que el contenido duplicado es un concepto difícil de explicar y comprender, pero lo haces de maravilla.

Yo añadiría que, salvo que tengas una web estática (sin programación), es imposible evitarlo. Requiere mucho trabajo técnico y de arquitectura. No todos los CMS disponen de herramientas para canonicalizar urls y además reciben ataques a los que responden con páginas de contenido. Eso provoca que el problema aumente en lugar de reducirser.

A veces es como luchar con el monstruo de las 7 cabezas.

Por suerte, google es «comprensivo» y no lo penaliza excesivamente. Pero quizás lo haga en breve. No se puede permitir el lujo de indexar sitios con hasta 100 veces más páginas que las que realmente, si no estuviera duplicando contenido.

Estanislao Berruezo

Estanislao Berruezo

El contenido duplicado…ese terrible enemigo que actúa en la sombra…He visto una barbaridad de páginas con contenido duplicado simplemente por mal uso de tags y categorías

Envíanos tu comentario: