Inicio/Glosario/Canonicalización y duplicados
SEO técnicoCanonicalización y duplicados
La canonicalización es el proceso por el que Google selecciona la URL representativa (canónica) de un conjunto de URLs con contenido idéntico o muy similar. Declarar una canónica con rel=canonical es una señal fuerte, no una orden: Google puede elegir otra versión si la considera más representativa.
Qué es
La canonicalización es el proceso por el que Google elige la URL "representativa" de un grupo de URLs cuyo contenido es idéntico o muy parecido. Google agrupa esas URLs en un cluster por su contenido principal y designa una como canónica; el resto se consideran duplicados de esa.
El objetivo es consolidar las señales de ranking en una sola URL, simplificar el seguimiento de métricas y no malgastar rastreo en versiones repetidas. El contenido duplicado dentro de un sitio es normal y no es una penalización de las políticas de spam de Google. El daño real es otro: dilución de señales entre varias URLs, rastreo desperdiciado y confusión de métricas o canibalización.
Se declara una preferencia con varios métodos: la etiqueta <link rel="canonical"> en el <head>, la cabecera HTTP rel="canonical" para documentos no HTML (PDF, etc.), las URLs preferidas en el sitemap y las redirecciones permanentes. Pero declarar es solo una pista. Google lo afirma literalmente: "indicating a canonical preference is a hint, not a rule". Si las señales son contradictorias, Google decide por su cuenta.
Por qué importa
Cuando varias URLs casi idénticas compiten por el mismo contenido, las señales de ranking se reparten en lugar de sumarse. Consolidar en una canónica concentra esas señales en la versión que quieres que aparezca en buscador y mantiene las métricas legibles en una sola URL, no fragmentadas. Es una pieza nuclear del Rastreo e indexación: decide qué entra al índice y bajo qué dirección, por lo que toca directamente al Crawl budget (presupuesto de rastreo) que Google dedica a tu sitio.
No hay penalización por duplicados internos, pero sí coste: rastreo gastado en versiones repetidas y canibalización entre páginas que se solapan —el mismo problema que se estudia en la Canibalización de keywords, cuando varias URLs pelean por la misma intención. El matiz operativo es que la canónica es una preferencia, no una orden. Puedes alinear todas tus señales hacia una versión y, aun así, Google elegir otra si la considera más representativa para el usuario. Por eso el trabajo no es forzar una canónica, sino instrumentar señales coherentes —empezando por un Enlazado interno que apunte siempre a la URL preferida— y verificar en Search Console cuál eligió Google de verdad. El criterio humano decide qué versión merece consolidar; la técnica solo lo hace medible.
En profundidad
Jerarquía de señales: no todas pesan igual
Google pondera los métodos de canonicalización por su fuerza. Una redirección permanente es la señal más fuerte: indica que el destino debe convertirse en canónico —es el mecanismo que estudia Redirecciones 301 y migraciones cuando se consolida una URL en otra de forma definitiva. El rel=canonical es también una señal fuerte sobre la URL preferida. La inclusión en el Sitemap XML es una señal débil: lista las URLs que quieres indexar, pero no impone la elección. Por debajo quedan otras pistas: HTTPS sobre HTTP, los clusters de Hreflang y SEO internacional y los patrones de Enlazado interno. Conocer esta jerarquía evita el error de confiar solo en el sitemap o en una etiqueta que el resto de señales contradice.
Pista, no orden: cuando Google elige otra canónica
Google puede ignorar tu rel=canonical y elegir una versión distinta si la considera objetivamente más representativa. El síntoma se ve en la URL Inspection tool cuando "Google-selected canonical" no coincide con "User-declared canonical". Antes de forzar tu preferencia, conviene preguntarse si la elección de Google tiene más sentido para el usuario que tu URL. Si la respuesta es no, el siguiente paso es buscar la señal contradictoria (un enlace interno mal apuntado dentro de tu Enlazado interno, un sitemap incoherente, un redirect) y corregirla, no insistir con la etiqueta. En sitios grandes, el Análisis de logs ayuda a ver qué URL rastrea Google de verdad y por qué descarta la que declaraste.
Canonical no es noindex ni redirect
Son controles distintos con propósitos distintos. El canonical consolida señales entre duplicados reales sin sacar nada del índice. El noindex saca una página del índice. La redirección lleva al usuario y al rastreador a otra URL, y se gestiona en Redirecciones 301 y migraciones. Combinarlos mal genera contradicciones: un canonical hacia una página noindex o bloqueada por robots.txt envía señales incoherentes —el robots impide incluso leer la etiqueta. La regla práctica: consolidar cuando es duplicado real, diferenciar el contenido cuando merece existir por separado, y derivar a Hreflang y SEO internacional cuando se trata de versiones de idioma, que no son duplicados. Esto es crítico en escenarios de Navegación facetada, donde los filtros generan multitud de URLs casi idénticas que hay que decidir si consolidar, diferenciar o bloquear.
| Control | Qué hace | Cuándo usarlo |
|---|---|---|
| Canonical | Consolida señales entre duplicados reales sin sacar nada del índice | Hay duplicado real y quieres unificar señales |
| Noindex | Saca la página del índice | La página no debe aparecer en resultados |
| Redirect | Lleva a usuario y rastreador a otra URL | El contenido se ha movido o unificado |
| Hreflang | Relaciona versiones de idioma (no son duplicados) | Versiones de idioma/región del mismo contenido |
Canonicalización y búsqueda con IA
La canonicalización sigue gobernando qué URL indexa Google y cómo consolida las señales en la web clásica, que es la que alimenta los AI Overviews y AI Mode. Existen observaciones del sector de que asistentes como ChatGPT o Perplexity serían menos sensibles al contenido fino o duplicado que el índice clásico de Google. Es una hipótesis de la industria, no una postura oficial de Google, y conviene tratarla como tal. Aun así, mantener una sola URL canónica por contenido reduce la ambigüedad sobre qué fuente debe citarse, lo que conecta con la Citabilidad en respuestas de IA.
La canonicalización sigue gobernando qué URL indexa Google y cómo consolida las señales en la web clásica, que es la que alimenta los AI Overviews fuente. Existen observaciones del sector de que asistentes como ChatGPT o Perplexity serían menos sensibles al contenido fino o duplicado que el índice clásico de Google fuente; es una hipótesis de la industria, no una postura oficial de Google, y conviene tratarla como tal.
Qué observar
Las señales que importan.
Auditoría de clusters de duplicados
Los duplicados nacen del protocolo (HTTP frente a HTTPS), parámetros de URL, filtros y ordenaciones, variantes de dispositivo y entornos de staging accesibles. Mapear ese origen permite decidir qué URL representa cada cluster.
Alineación de señales hacia una sola versión
rel=canonical, redirecciones permanentes, sitemap, HTTPS y enlazado interno deben apuntar a la misma URL, con URLs absolutas y una sola canónica por página. Las señales contradictorias dejan la elección en manos de Google.
Verificación de la canónica real en Search Console
En la URL Inspection tool, la canónica declarada (User-declared) puede diferir de la elegida por Google (Google-selected). Cuando difieren, hay señales contradictorias que revisar antes de actuar.
Detección de errores frecuentes
Errores habituales: canonical a la home en toda la plantilla, canonical hacia páginas noindex o bloqueadas por robots, y cross-domain por mala configuración del servidor o redirecciones maliciosas.
Revisión de canibalización
Las URLs casi idénticas plantean tres salidas según criterio: consolidarse en una canónica, diferenciarse en contenido o quedar fuera del índice.
Conceptos clave
El vocabulario del término.
- URL canónica
- La URL de una página que Google elige como la más representativa de un conjunto de páginas duplicadas.
- rel=canonical
- Etiqueta <link> en el <head> (o cabecera HTTP para no-HTML) con la que declaras a Google tu URL preferida; es una señal fuerte, pero no una orden.
- Cluster de duplicados
- Grupo de URLs con contenido idéntico o muy similar que Google agrupa por su contenido principal para elegir una canónica.
- Contenido duplicado
- Contenido idéntico o muy similar accesible en varias URLs; dentro de un sitio es normal y no constituye penalización, aunque diluye señales y gasta rastreo.
- Canónica declarada vs. elegida por Google
- La URL Inspection tool de Search Console muestra la canónica que tú declaras (User-declared) frente a la que Google realmente eligió (Google-selected); cuando difieren, hay señales contradictorias que revisar.
- Canibalización de keywords
- Situación en la que varias URLs casi idénticas compiten por el mismo contenido y reparten las señales en lugar de consolidarlas.
- Jerarquía de señales de canonicalización
- Orden de fuerza con que Google pondera los métodos: redirección permanente y rel=canonical (fuertes), sitemap (débil), más HTTPS, hreflang y enlazado interno.
Dónde lo aplicamos
Aún no mostramos casos.
No inventamos resultados. Cuando tengamos casos reales —anonimizados y medibles— donde este concepto marcó la diferencia, vivirán aquí.
Una pieza del glosario.
Forma parte del glosario de SEO, analítica e IA de InnovaOrigen Tech: un mapa de conceptos definidos con criterio y fuentes. Si quieres llevarlo a tu caso, lo vemos sin compromiso.