Web scraping y connectors
Conjunto de técnicas de recolección de datos que alimentan la analítica: APIs y connectors, exports puntuales y web scraping. Capturan el dato en origen y lo depositan, de forma estructurada y trazable, en el destino donde se analizará.
Ver definición → AnalíticaETL / pipelines de datos
ETL (Extract-Transform-Load) y su variante moderna ELT (Extract-Load-Transform) son los patrones canónicos para mover datos desde sistemas de origen hacia un destino analítico y dejarlos en formato apto para consulta. La diferencia está en dónde ocurre la transformación: antes de cargar (ETL) o dentro del propio almacén (ELT).
Ver definición → AnalíticaLimpieza y calidad de datos
La limpieza y calidad de datos es la disciplina de detectar y corregir registros corruptos, inexactos, duplicados o irrelevantes antes de que contaminen el análisis. Mide la calidad sobre dimensiones medibles —exactitud, completitud, consistencia, validez, unicidad, integridad y oportunidad— y enruta lo dudoso a cuarentena en lugar de borrarlo a ciegas.
Ver definición → AnalíticaModelado de datos
El modelado de datos es la disciplina de definir cómo se estructuran, relacionan y almacenan los datos para que sirvan a un propósito analítico o de negocio. Traduce las necesidades del negocio a un esquema explícito y documentado: qué entidades existen, qué atributos las describen, cómo se relacionan y bajo qué reglas.
Ver definición → AnalíticaSeries temporales
Una serie temporal es una secuencia de datos indexados por el tiempo: cada punto lleva una marca temporal y uno o más valores. Su patrón de uso —escritura masiva en modo append y lectura por agregación sobre rangos— la distingue de un dato transaccional.
Ver definición → AnalíticaData warehouse (BigQuery)
Un data warehouse es una base de datos separada del sistema operacional, de solo lectura y optimizada para consultas analíticas (OLAP), con almacenamiento columnar. BigQuery es el almacén serverless y columnar de Google Cloud que se consulta con SQL.
Ver definición → AnalíticaAPI REST
Una API REST es un estilo arquitectónico para diseñar servicios web sobre HTTP, descrito por Roy Fielding en 2000. Expone datos y funciones como recursos identificados por URL, que el cliente consume con los métodos estándar de HTTP; una API que cumple sus restricciones se llama RESTful.
Ver definición → IAEmbeddings
Un embedding es un vector numérico denso que representa el significado de un objeto —texto, imagen, audio o nodo de un grafo— en un espacio continuo, de modo que los elementos parecidos quedan cerca y los distintos lejos.
Ver definición → IABase de datos vectorial
Sistema especializado en almacenar, indexar y recuperar embeddings —representaciones numéricas del significado de un dato— para encontrar los elementos más parecidos por similitud semántica, no por coincidencia exacta.
Ver definición → Infraestructura técnicaIntegración de APIs y ERP
La integración de APIs y ERP es la disciplina de conectar el sistema central de gestión de una empresa (ERP) con herramientas de terceros mediante sus APIs, para que los datos fluyan de forma automática y fiable entre sistemas en lugar de copiarse a mano.
Ver definición → AnalíticaAnálisis exploratorio de datos (EDA)
El análisis exploratorio de datos (EDA) es el enfoque que examina un dataset y resume sus características principales antes de modelar o contrastar hipótesis formales, dejando que los datos sugieran qué preguntar. Lo formalizó John Tukey en 1977.
Ver definición → AnalíticaOrquestación e integración de datos
La integración de datos conecta sistemas heterogéneos para que sus datos fluyan entre sí; la orquestación coordina esos flujos: decide cuándo se ejecutan, en qué orden y qué hacer si fallan.
Ver definición →Explora el glosario completo.
Un mapa de conceptos de SEO, analítica e IA, definidos con criterio y enlazados a sus fuentes.