Datos & ingeniería.

12 conceptos del glosario sobre datos & ingeniería. Definiciones con criterio y fuentes.

Web scraping y connectors

Conjunto de técnicas de recolección de datos que alimentan la analítica: APIs y connectors, exports puntuales y web scraping. Capturan el dato en origen y lo depositan, de forma estructurada y trazable, en el destino donde se analizará.

Ver definición → Analítica

ETL / pipelines de datos

ETL (Extract-Transform-Load) y su variante moderna ELT (Extract-Load-Transform) son los patrones canónicos para mover datos desde sistemas de origen hacia un destino analítico y dejarlos en formato apto para consulta. La diferencia está en dónde ocurre la transformación: antes de cargar (ETL) o dentro del propio almacén (ELT).

Ver definición → Analítica

Limpieza y calidad de datos

La limpieza y calidad de datos es la disciplina de detectar y corregir registros corruptos, inexactos, duplicados o irrelevantes antes de que contaminen el análisis. Mide la calidad sobre dimensiones medibles —exactitud, completitud, consistencia, validez, unicidad, integridad y oportunidad— y enruta lo dudoso a cuarentena en lugar de borrarlo a ciegas.

Ver definición → Analítica

Modelado de datos

El modelado de datos es la disciplina de definir cómo se estructuran, relacionan y almacenan los datos para que sirvan a un propósito analítico o de negocio. Traduce las necesidades del negocio a un esquema explícito y documentado: qué entidades existen, qué atributos las describen, cómo se relacionan y bajo qué reglas.

Ver definición → Analítica

Series temporales

Una serie temporal es una secuencia de datos indexados por el tiempo: cada punto lleva una marca temporal y uno o más valores. Su patrón de uso —escritura masiva en modo append y lectura por agregación sobre rangos— la distingue de un dato transaccional.

Ver definición → Analítica

Data warehouse (BigQuery)

Un data warehouse es una base de datos separada del sistema operacional, de solo lectura y optimizada para consultas analíticas (OLAP), con almacenamiento columnar. BigQuery es el almacén serverless y columnar de Google Cloud que se consulta con SQL.

Ver definición → Analítica

API REST

Una API REST es un estilo arquitectónico para diseñar servicios web sobre HTTP, descrito por Roy Fielding en 2000. Expone datos y funciones como recursos identificados por URL, que el cliente consume con los métodos estándar de HTTP; una API que cumple sus restricciones se llama RESTful.

Ver definición → IA

Embeddings

Un embedding es un vector numérico denso que representa el significado de un objeto —texto, imagen, audio o nodo de un grafo— en un espacio continuo, de modo que los elementos parecidos quedan cerca y los distintos lejos.

Ver definición → IA

Base de datos vectorial

Sistema especializado en almacenar, indexar y recuperar embeddings —representaciones numéricas del significado de un dato— para encontrar los elementos más parecidos por similitud semántica, no por coincidencia exacta.

Ver definición → Infraestructura técnica

Integración de APIs y ERP

La integración de APIs y ERP es la disciplina de conectar el sistema central de gestión de una empresa (ERP) con herramientas de terceros mediante sus APIs, para que los datos fluyan de forma automática y fiable entre sistemas en lugar de copiarse a mano.

Ver definición → Analítica

Análisis exploratorio de datos (EDA)

El análisis exploratorio de datos (EDA) es el enfoque que examina un dataset y resume sus características principales antes de modelar o contrastar hipótesis formales, dejando que los datos sugieran qué preguntar. Lo formalizó John Tukey en 1977.

Ver definición → Analítica

Orquestación e integración de datos

La integración de datos conecta sistemas heterogéneos para que sus datos fluyan entre sí; la orquestación coordina esos flujos: decide cuándo se ejecutan, en qué orden y qué hacer si fallan.

Ver definición →

Otros temas

Indexación & rastreo12 Arquitectura & enlazado8 Rendimiento & experiencia2 Contenido & intención17 Entidades & datos estructurados4 Búsqueda con IA (GEO/AIO)23 Medición & analítica10 Automatización & agentes14 Infraestructura & seguridad9 Accesibilidad & AUX3

Explora el glosario completo.

Un mapa de conceptos de SEO, analítica e IA, definidos con criterio y enlazados a sus fuentes.

Ver todo el glosario → Agenda una llamada