Tras la apocalíptica aparición de Google Panda, a todos los SEO Managers hay algo que les quedó manifiestamente claro, si cabe más de lo que ya lo estaba: evita el contenido duplicado. Nunca, bajo ningún concepto, publiques contenido duplicado.
Si tu site vive del SEO y experimentó un descenso drástico de tráfico tras la puesta en marcha de Google Panda, es muy posible que sea debido a eso. El nuevo Panda incorporó una gran cantidad de cambios, y se ha publicado mucha literatura al respecto, pero si os ponéis a leer artículos sobre el tema encontraréis un denominador común: el contenido debe ser relevante, y nada hay menos relevante para Google que el contenido duplicado.
A continuación, os recomiendo unos cuantos tips y herramientas para evitar que eso os perjudique de ahora en adelante:
Primero de todo, hay que comprobar qué puede estar ocurriendo para que Google os indexe como contenido duplicado. En algunos de los sites que gestiono, por ejemplo, nunca hemos permitido la publicación contenido copiado de ninguna clase, pero resultó que el sistema de tags que usábamos duplicaba nuestras páginas internas, creando nuevas páginas iguales para cada tag que creábamos, de modo que éstas se identificaban como duplicadas. Eso nos llevó a experimentar una penalización (a mi juicio, injustificada) que nos hizo perder más de un 30% de nuestro tráfico regular en menos de una semana. Con esto me refiero a que debes contemplar todas las posibilidades: Google no es perfecto y sus sistemas de indexación, análisis y asignación de contenido a veces fallan. Es factible que tus contenidos sean originales, pero si tu sistema web los multiplica gratuitamente, o hay alguien que te los copia y Google le asigna equivocadamente la autoría; puedes acabar siendo tú el perjudicado.
Otra posibilidad que debes tener en cuenta es que tu contenido realmente sea copiado: si no produces personalmente la totalidad de tu contenido, cosa habitual en caso de medios de comunicación digitales, es posible que tus redactores estén copiando parte de ese contenido que les compras pese a haberles dejado bien claro que no deben hacerlo. Estas dos herramientas pueden ayudarte a descubrirlo:
· Plagium: Su funcionamiento es sencillo. Introduces el texto que has recibido y Plagium te dirá si encuentra resultados al respecto. Introduce sólo el body-text, ahórrate links, tags, títulos y otras cosas que puedan complicarle la búsqueda.
En caso de que encuentre algo, verás que aparecen bolas verdes y quizá rojas en el timeline inferior y algunos links debajo. Las bolas verdes representan el contenido duplicado identificado en páginas que la herramienta cataloga como sites de noticias (periódicos digitales, otros blogs, etc.). Las bolas rojas corresponden a webs (webs corporativas de una empresa o Wikipedia, por ejemplo). La posición en la que aparecen en el timeline determina la hora y el día en que aparecieron : la hora se marca en el eje vertical y los días en el horizontal. Si posas el mouse sobre una de las bolas verás la fecha hora exactas de su publicación.
El tamaño de las bolas hace referencia al % del texto que introdujiste duplicado en el site encontrado. Si pones el mouse encima también lo verás. Según mi criterio, un 20%-25% ya es bastante. Yo te recomendaría que, en caso de que sea superior, obligaras a tus redactores a repetir el artículo.
Finalmente: los links te muestran los enlaces concretos en los que la herramienta ha encontrado ese contenido así como el texto que ha encontrado copiado en cada caso. Es importante revisarlo, ya que es posible que en muchas ocasiones se trate de declaraciones hechas en entrevistas por parte de personajes relevantes, caso en el que es lógico que el contenido se presente de forma exacta a cómo ha sido publicado en otras páginas, aunque siempre debidamente indicado.
Cosas a tener en cuenta sobre Plagium:
– Plagium es una herramienta gratuita en su sección Quick Search, la funcionalidad Deep Search (que, honestamente, nunca he probado) se supone más completa, pero es de pago.
– No olvides marcar el tick “Search over the web” y “news” para que busque en ambas categorías.
– No revises todo el contenido que tienes pendiente de golpe, si realizas múchas búsquedas (más de 12 o 15) en un breve espacio de tiempo es posible que satures la herramienta y te exija usar la versión de pago.
– Si introduces una cantidad de texto muy grande es posible que Plagium se cuelgue. La principal virtud de esta herramienta es que es rápida, si ves que tarda mucho en abocar resultados lo más probable es que se haya colgado. Fracciona el texto que introduces en caso de artículos de más de 500 palabras.
– Plagium no es infalible (ni mucho menos): en su funcionalidad gratuita, al menos, es posible que falle. Pruébalo si quieres introduciendo textos publicados en tu propia web a ver si los encuentra. Si te hueles que un texto ha sido copiado, Plagium tampoco debería dejarte 100% tranquilo, usa otras herramientas para comprobarlo.
Otra herramienta que cumple esta misma funcionalidad es COPIONIC.
Copionic es una herramiento que ha sido desarrollada en el Citilab de Cornellá. Ésta también es gratuita, pero a diferencia de Plagium te exige un registro previo a ser usada. Respecto a Plagium, COPIONIC tiene ventajas y desventajas. Su principal desventaja es que el proceso de uso es más lento (cosa a tener en cuenta si debes revisar una gran cantidad de texto semanalmente), pero sus resultados son más completos que los de Plagium: nunca me ha pasado que Copionic encontrara algo que Plagium no, pero la cantidad de resultados e información que arroja en cada búsqueda es mayor. Con esta herramienta obtendrás un pdf descargable con un pequeño informe de cada uno de los resultados con el texto duplicado, el % copiado sobre el texto introducido, links encontrados, etc.
Otra situación desagradable en la que puedes encontrarte: que te estén copiando el contenido. En tal caso, la herramienta que puedes necesitar es COPYSCAPE.
Copyscape te proporcionará una muy útil: quién te ha copiado. Introduce la url de tu website y realizará un scan para comprobar quién ha publicado contenido tuyo. Como decía, es una herramienta tremendamente útil, aunque, acorde a mi experiencia personal, también tremendamente inexacta. Me ha pasado tener constancia de que algunas webs han duplicado contenido mío y que Copyscape no las encontrara. Como Plagium, también es una herramienta gratuita aunque posee una versión de pago (que nunca he probado) y que probablemente funciona mejor. Es un buen comienzo, pero no te detengas aquí si sospechas que están copiando tu contenido.
Controlar eso es importante por varias razones, primero porque son publicaciones que te están robando tráfico que debería corresponderte a ti; y segundo (y, para mí, más importante) porque es posible que Google no asigne bien la autoría original de ese contenido y te registre a ti como el plagiador y no como el autor original. En este sentido, Google + incorpora una funcionalidad interesante, que es la de vincular tu perfil personal en Google + al perfil con el que publicas en tus blogs o webs. Ya os hablaremos del proceso exacto en otro artículo, ya que de momento no hemos conseguido hacerlo funcionar, pero la idea es que cada vez que subas un artículo, Google te identificará como autor y, por tanto, te asignará automáticamente la autoría original de ese contenido, penalizando a aquellas webs que lo copien posteriormente.
Finalmente, si realmente tenéis problemas graves de duplicación de contenido, podéis intentar frenarlo con técnicas más agresivas, tocando código de vuestra página para impedir que lo que publiquéis se pueda copypastear o intentando sacarle un rendimiento económico a las páginas que os plagien.
En este artículo de Tecnología Diaria os explican un truquillo black-hat para crear un doble enlace hacia la url base de nuestra publicación y hacia el artículo copiado en aquellos blogs spam que se dedican a fusilar nuestro contenido a través del feed RSS.
En este otro artículo de Ciudad Blogger encontraréis tips sobre qué códigos podéis incluir en vuestro site para deshabilitar las opciones de copy+paste de vuestros textos e imágenes.
Espero que os sean de ayuda y que entre todos consigamos reducir cada vez más la presencia de spammers que no aportan nada más que problemas a los que intentamos tener publicaciones de calidad en Internet.
El problema de detectar el plagio, la duplicidad, etc. de contenidos, después de la lectura de este artículo tan clarificador, sólo me lleva a pensar que éste no ha hecho más que empezar. Si además el propio Geogle no es capaz de detectar, con sus programas de control de plagios, el original, y las copias, cuando tiene tanta importancia a la hora de controlar el flujo de visitas, deberían exigir los usuarios que contratan sus programas que los mejoren o busque alternativas.
Cuando un cliente del servicio se enfada y queja mediante Twitter,
¡no es pues tenga nada personal contra ti!
© 2019 Empirica Influentials & Research
Add comment