Las urls canonicals son una de las meta etiquetas HTML más importantes que hoy en día utilizamos los profesionales SEO para evitar posibles penalizaciones por la existencia de contenido duplicado en urls distintas.
Esta meta fue creada en 2009 con la intención de que pudiéramos indicarles a los buscadores que somos conscientes de la existencia de páginas en nuestra web con contenido similar, y en esos casos, poder definir cuál de esas urls semejantes es prioritaria a la hora de otorgar una posición de mayor peso en los resultados de búsqueda.
A casos prácticos, podríamos decir que, si tenemos 10 páginas con un contenido semejante, con la meta canonical podemos decidir cuál de ellas queremos que se muestre en las páginas de resultados de búsqueda.
Los usos y aplicaciones principales de las urls canonicals son:
Tabla de contenidos
ToggleEfectivamente, ya que aplicar tratamiento adecuado de canonicals puede incidir directamente al posicionamiento SEO. Tanto positivamente si se hace forma correcta, y drásticamente si se hace de forma incorrecta.
Si nos remontamos al 2011, año en el que se lanzó el algoritmo Panda, podemos recordar cómo millones de webs, ecommerce y blogs fueron penalizados de forma arrolladora acabando en muchos casos con la actividad de estos sitios.
En esa época muchos no tuvieron en cuenta el tratamiento de las metas canonicals para evitar esta sanción. No obstante, de haberlo hecho, quizás ahora muchas de ellas seguirían con un estado de visibilidad competitiva. Fue una sorpresa para todos ver como de tener dos, tres e incluso cuatro resultados en las primeras posiciones de resultados orgánicos, a pasar a un estado de inexistencia total.
Las metas canonicals pueden aportar las siguientes mejoras sustanciales:
Como ya hemos comentado, con la meta canonical podemos presentar contenido a nuestros usuarios sin ser penalizados. Este caso suele ser muy común en las fichas de productos de ecoomerces con grandes volúmenes de productos. En muchos casos, esos productos pueden presentar una diferencias muy pequeñas.Por ejemplo, un pequeño componente, año de fabricación, color, etc….
En estos casos, las descripciones de estos productos, las fichas técnicas e incluso las imágenes suelen ser las las mismas y en la que solo encontraríamos no más de 5 palabras diferentes, por lo que el contenido seguramente sería interpretado por los crawls como duplicado.
De esta manera solo podemos hacer dos cosas:
Los parámetros son un tipo de recurso muy utilizados por webmasters, desarrolladores y analíticos de datos que pueden convertirse en un problema si no se hace un control de estos.
De forma generalizada diremos que estos suelen presentar en su estructura caracteres NONascii, siendo los signos ¿, &, = los recursos más comúnmente utilizados.
Sus aplicación y usos principales son:
En estos casos, el uso de la urls canonicals es muy efectivo ya que podemos evitar que estas urls parametrizadas sean indexadas. Así damos prioridad a la url inicial sin estos parámetros. De tal forma, todas las urls parametrizadas debería de presentar como urls canonical aquella url que no presenta en su estructura las variables, bien sean utm para el control analítico como parámetros de orden y organización.
Las paginaciones son un proceso por el que una url se divide en diferentes páginas con urls propias. Estas son utilizadas mayormente en categorías de productos o blog.
Con el uso de las canonicals podemos ayudar a los motores de búsqueda a entender la relación entre esta serie de paginaciones. Así evitamos que sean interpretadas como contenido duplicado.
Las urls canonicals en las paginaciones acompañan a los atributos rel=”nex” y rel=”prev” que permiten identificar la secuencia “página siguiente” y “página anterior”.
El problema que suele presentar las paginaciones es que es difícil saber si los resultados que van a presentar cada uno de ellos van a ser similares o no. Por ello, lo ideal es que cada página presente como canonical su propia url.
URL: http://www.dominio.com/resultado-ok/pag-2/
<link rel=”prev” href=”www.dominio.com/resultado-ok/” />
<link rel=”next” href=”www.dominio.com/resultado-ok/pag-3/” />
<link rel=”canonical” href=”www.dominio.com/resultado-ok/pag-2/” />
En ocasiones, los webmaster suelen cambiar de protocolo de navegación o versiones de dominio. Sin embargo, en muchos casos olvidan aplicar estas versiones diferenciadas en su estructura de enlaces y urls internas. Incluso en la meta canonical, generando grandes problemas en la interpretación de urls prioritaria. Ello conlleva la pérdida de visibilidad orgánica.
Por tanto, ante una incosistencia entre las versiones http/https o www/sin www es recomendable el uso de la meta canonical, indicando siempre en todo momento la url principal en cada caso
Hreflang es un atributo lanzado en el 2011 que permite identificar a los motores de búsqueda las variaciones lingüísticas que una web presenta para un mismo contenido. Con este atributo, los rastreadores permiten ofrecer de forma optimizada la versión idiomática en virtud de la lengua y región del usuario.
En un caso práctico, si disponemos de dos páginas diferencias por idiomas ingles y alemán, ambas deben de presentar el atributo hreflang y el canonical deberá de presentar la versión de la página que estamos en ese momento visualizando.
<link rel=”alternate” href=”www.dominio.com/en/resultado-uno/” hreflang=”en-us” />
<link rel=”alternate” href=”www.dominio.com/de/resultado-uno/” hreflang=”de-de” />
<link rel=”canonical” href=”www.dominio.com/en/resultado-uno/” />
<link rel=”alternate” href=”www.dominio.com/en/resultado-uno/” hreflang=”en-us” />
<link rel=”alternate” href=”www.dominio.com/de/resultado-uno/” hreflang=”de-de” />
<link rel=”canonical” href=”www.dominio.com/de/resultado-uno/” />
Las páginas AMP (Accelerated Mobile Pages) es la tecnología que permite ver el contenido de una página de un modo mucho más rápido cuando se accede a través de un smartphone.
Cuando aplicamos esta tecnología en nuestras web estamos ofreciendo una mejora interesante para los resultados de búsquedas realizadas a través de teléfonos móviles. De esta forma se mejoran las posibilidades de posicionamiento orgánico. Pero al mismo tiempo estamos creando un contenido textual idéntico a su versión de desktop. Por ello, aplicar una lógica de etiqueta canonical es indispensable para no ser penalizado por contenido duplicado.
Cuando disponemos de las dos versiones de una misma página tanto en html como en amp, debemos de identificar en ambos casos las versiones existentes y la aplicación de su canonical a la fuente original (desktop) desde la versión amp y la etiqueta amphtml desde la versión desktop.
<link rel=”canonical” href=”www.dominio.com/en/resultado-uno/” />
<link rel=”amphtml” href=”www.dominio.com/en/resultado-uno/amp/” />
<link rel=”canonical” href=”www.dominio.com/en/resultado-uno/” />
Aplicar una directiva de bloqueo mediante el uso de disavow: /carpeta-x en el fichero robotx.txt es una mala praxis cuando estamos usando para esa url una etiqueta canonical. El motivo se debe a que, si impedimos al robot acceder a esta url (carpeta-x) no podrá detectar la etiqueta canonical, por lo que nuestro problema de contenido duplicado se mantendrá en el tiempo de manera innecesaria.