innovaorigen tech Agenda una llamada
Agenda una llamada

Inicio/Glosario/Google Analytics 4 (GA4)

Analítica

Google Analytics 4 (GA4)

Plataforma de analítica digital de Google basada en un modelo de eventos: cada interacción —vista de página, clic, scroll, compra— se registra como un evento con nombre y parámetros, sobre un mismo esquema para web y app. Sustituye al modelo de sesiones de Universal Analytics, que dejó de procesar datos en 2023.

Qué es

GA4 es la generación actual de Google Analytics. Su cambio estructural respecto a Universal Analytics es el paso de un modelo basado en sesiones a un modelo basado en eventos: toda interacción se captura como un evento con su nombre (event_name) y sus parámetros (page_location, value, etc.), bajo un esquema unificado para web y aplicación. La recogida se organiza en una propiedad que agrupa streams de datos (web, iOS, Android). En los streams web, la medición mejorada (Enhanced Measurement) captura de forma automática eventos comunes —page_view, scroll, clics salientes, búsqueda interna, vídeo, descargas— sin código adicional.

Los eventos se clasifican en cuatro tipos: recogidos automáticamente, de medición mejorada, recomendados (nombres y parámetros predefinidos por Google que desbloquean reporting) y personalizados. Cualquier evento puede marcarse como evento clave (key event, antes llamado «conversión»), que alimenta los informes de conversión y la atribución y puede sincronizarse con Google Ads. La plataforma integra de forma nativa Google Tag Manager para la recogida y la exportación a BigQuery para datos crudos sin agregar, disponible incluso en la versión gratuita.

La calidad del dato en GA4 está condicionada por varios límites propios de la herramienta: muestreo en las Explorations sobre datasets grandes, umbralización por privacidad cuando hay pocos usuarios, límite de cardinalidad que envía los valores excedentes a la fila «(other)» y retención de datos a nivel de evento de 14 meses como máximo en la interfaz. En 2026, Google añadió un canal nativo «AI Assistant» al Default Channel Group para clasificar el tráfico procedente de asistentes de IA, relevante para SEO y GEO.

Todo es un evento
GA4 mide por eventos, no por sesiones
01
Evento
Auto, recomendado o propio.
02
Parámetros
Contexto.
03
Conversión
Evento clave.

Por qué importa

GA4 no mide bien por defecto: cómo se configuran los streams, la medición mejorada, los eventos, la retención y la exportación condiciona la calidad del dato que se analiza después. Tres consecuencias prácticas. Primera: comparar cifras de GA4 con las de Universal Analytics 1:1 lleva a conclusiones erróneas, porque métricas como la tasa de rebote fueron sustituidas (engagement rate) y las sesiones se calculan de otro modo. Segunda: parte de los datos puede «desaparecer» de la vista sin perderse —agrupados en la fila «(other)» por cardinalidad, ocultos por umbralización de privacidad o reducidos por muestreo en Explorations—, lo que exige saber leer esos límites antes de sacar conclusiones. Tercera: el histórico a nivel de evento caduca a los 14 meses en la interfaz, salvo que se exporte a BigQuery, el Data warehouse (BigQuery) donde los eventos crudos quedan disponibles para SQL y modelado propio. Entender estos límites es condición para medir con criterio; no es, por sí solo, garantía de mejores resultados de negocio.

GA4 no opera aislado: es una pieza dentro de una Medición de extremo a extremo, que enlaza la captación con lo que pasa después de la conversión. Su recogida depende de Eventos y conversiones bien definidos —los key events son precisamente eso— y de la Atribución, que reparte el mérito de cada conversión entre los puntos de contacto. Y dado que toda esa captura está sujeta al consentimiento, su despliegue correcto exige Consent Mode v2, que ajusta el comportamiento de las etiquetas según lo aceptado por el usuario; el Google Tag Manager (GTM) integrado de forma nativa es el orquestador habitual de ese envío. Finalmente, el nuevo canal «AI Assistant» convierte a GA4 en un punto de Medición de la visibilidad en IA, relevante para GEO · Generative Engine Optimization, donde el reto es atribuir el tráfico que llega desde respuestas generativas.

En profundidad

Modelo de eventos frente a sesiones

En GA4, la unidad básica es el evento, no la sesión. Una propiedad agrupa streams de datos (web, iOS, Android) bajo un mismo esquema. En web, la medición mejorada captura automáticamente eventos comunes sin código. Los eventos se dividen en cuatro tipos: automáticos, de medición mejorada, recomendados (predefinidos por Google, que desbloquean reporting actual y futuro) y personalizados (que requieren informes a medida, porque no aparecen en los estándar). Cualquier evento puede promoverse a evento clave; este esquema de Eventos y conversiones es la base sobre la que después se calculan los informes de conversión y la Atribución.

Tipo de eventoCómo se generaReporting
AutomáticosRecogidos por GA4 sin configurarAparecen en informes estándar
Medición mejoradaActivados por toggle en el stream webEventos comunes sin código
RecomendadosNombres predefinidos por GoogleDesbloquea reporting actual y futuro
PersonalizadosDefinidos por tiRequieren informes a medida

Calidad y límites del dato: muestreo, umbralización, cardinalidad y retención

Cuatro límites condicionan lo que muestra la interfaz. Muestreo: los informes prefabricados no muestrean, pero las Explorations sí cuando el dataset es grande. Umbralización por privacidad: GA4 oculta filas basadas en pocos usuarios, lo que genera discrepancias con los totales reales. Cardinalidad: las dimensiones con demasiados valores distintos agrupan el exceso en «(other)». Retención: los datos a nivel de evento se conservan 14 meses como máximo en la UI (configurable a 2 o 14). Leer estos sesgos antes de analizar es parte de la Limpieza y calidad de datos: lo que la interfaz muestra no siempre es el dato bruto.

LímiteQué haceDónde afecta
MuestreoEstima sobre subconjuntoExplorations con dataset grande (no informes prefabricados)
UmbralizaciónOculta filas de pocos usuariosDiscrepancias frente a totales reales
CardinalidadAgrupa el exceso de valoresDimensiones con muchos valores → «(other)»
RetenciónCaduca el dato de eventoMáx. 14 meses en la UI (2 o 14)

Exportación a BigQuery: datos crudos sin sesgos de la interfaz

GA4 puede exportar a BigQuery los eventos crudos, sin agregar, sin muestreo, sin umbralización y sin límites de cardinalidad. Está disponible también en la versión gratuita; solo se paga el uso de Google Cloud por encima de la capa gratuita. Es la vía para conservar histórico más allá de los 14 meses de la interfaz y para análisis que la UI no permite por sus propios límites. Esa exportación convierte a GA4 en una fuente para un Data warehouse (BigQuery), sobre la que ya cabe construir ETL / pipelines de datos y Modelado de datos propio sin las restricciones de la interfaz.

1
Evento crudo
Cada evento sin agregar, tal cual ocurre
2
Export a BigQuery
Sin muestreo, umbralización ni límite de cardinalidad
3
Histórico propio
Conserva datos más allá de los 14 meses de la UI
4
Análisis libre
SQL para lo que la interfaz no permite

El canal «AI Assistant» y la laguna del referrer

En 2026, Google añadió «AI Assistant» como canal nativo del Default Channel Group, asignando un medium específico cuando el referrer coincide con un asistente reconocido. Antes, ese tráfico caía en Direct o Referral. La clasificación depende de que la herramienta de origen pase el referrer: en escritorio suele conservarse, pero en apps nativas el sistema operativo tiende a eliminarlo y la sesión se registra como Direct. Es la principal laguna de medición para SEO/GEO en este canal, y por tanto un límite de la Medición de la visibilidad en IA: no todo el tráfico que llega desde AI Overviews y AI Mode o desde otros motores generativos —el terreno de GEO · Generative Engine Optimization— queda correctamente atribuido.

AI Assistant es canal nativoMedium propio en el Default Channel Group cuando el referrer coincide con un asistente reconocido
Escritorio conserva el referrerLa sesión se clasifica correctamente como AI Assistant
Apps nativas eliminan el referrerEl SO lo borra y la sesión cae en Direct
Antes de 2026 no existía el canalEse tráfico caía en Direct o Referral

En vídeo y audio

Cómo rastrear el tráfico impulsado por IA en GA4 y Ahrefs Web Analytics (ChatGPT y más) | 4.1. Curso AEO de AhrefsYouTube · Ahrefs

Qué observar

Las señales que importan.

Muchos datos agrupados en la fila «(other)»

Una dimensión con demasiados valores distintos al día supera el límite de cardinalidad y manda los excedentes a la fila «(other)». Los datos no se han perdido, pero se pierde granularidad: es un diagnóstico frecuente confundido con un fallo de medición.

Las cifras de GA4 no cuadran con las de Universal Analytics

GA4 redefine métricas respecto a UA: la tasa de rebote da paso al engagement rate y las sesiones se calculan distinto. Comparar ambas plataformas 1:1 produce desviaciones que no reflejan un problema real de tráfico.

Las Explorations muestran muestreo o falta histórico más allá de 14 meses

Sobre rangos amplios, las Explorations aplican muestreo y los datos a nivel de evento se retienen como máximo 14 meses en la interfaz. Sin una estrategia de retención y exportación, el análisis a largo plazo queda incompleto.

Dudas sobre dónde cae el tráfico de asistentes de IA

Desde 2026 existe un canal nativo «AI Assistant» en el Default Channel Group, pero solo clasifica el tráfico si la herramienta de origen pasa el referrer. En apps nativas el sistema suele eliminarlo y la sesión llega como Direct, subestimando ese tráfico.

Necesidad de datos crudos sin muestreo ni umbralización

La interfaz de GA4 aplica muestreo, umbralización y límites de cardinalidad. Para análisis avanzado sin esos sesgos, la exportación a BigQuery entrega los eventos sin agregar, disponible incluso en la versión gratuita.

Conceptos clave

El vocabulario del término.

Stream de datos
Fuente de datos (web, iOS o Android) que envía eventos a una propiedad de GA4. Una propiedad puede agrupar varios streams bajo un mismo esquema.
Medición mejorada (Enhanced Measurement)
Función de los streams web que captura automáticamente eventos comunes —vistas, scroll, clics salientes, búsqueda interna, vídeo, descargas— sin necesidad de código adicional.
Evento clave (key event)
Evento promovido a métrica de conversión. Sustituye al término «conversión» de Universal Analytics; alimenta los informes de conversión y la atribución y puede sincronizarse con Google Ads.
Umbralización (data thresholding)
Mecanismo de privacidad que oculta filas basadas en muy pocos usuarios para evitar identificarlos. Suele activarse con Google Signals o datos demográficos y genera discrepancias con los totales reales.
Cardinalidad y fila «(other)»
Una dimensión con demasiados valores distintos al día se considera de alta cardinalidad. Al superar el límite de filas del informe, los valores excedentes se agrupan en una fila «(other)», perdiendo granularidad.
Exportación a BigQuery
Integración nativa que vuelca los eventos crudos de GA4 a BigQuery sin agregar, muestrear ni umbralizar. Disponible incluso en la versión gratuita; persiste el dato más allá de los 14 meses de la interfaz.
Default Channel Group
Conjunto de reglas con que GA4 clasifica el tráfico por canal (Orgánico, Directo, Referral…). En 2026 incorporó el canal nativo «AI Assistant» para el tráfico procedente de asistentes de IA.

Dónde lo aplicamos

Casos de uso · Google Analytics 4 (GA4)[PENDIENTE]

Aún no mostramos casos.

No inventamos resultados. Cuando tengamos casos reales —anonimizados y medibles— donde este concepto marcó la diferencia, vivirán aquí.

Una pieza del glosario.

Forma parte del glosario de SEO, analítica e IA de InnovaOrigen Tech: un mapa de conceptos definidos con criterio y fuentes. Si quieres llevarlo a tu caso, lo vemos sin compromiso.