Arquitectura de Datos: guía completa 2026

Q: Cuanto cuesta disenar e implementar una arquitectura de datos desde cero

Para una empresa mediana con 3-5 fuentes de datos, un MVP de plataforma suele costar entre 15.000 y 40.000 euros. Incluye diseno de arquitectura, ingesta de fuentes prioritarias, capa de transformacion con dbt y un primer caso de uso de consumo. La infraestructura cloud posterior oscila entre 200 y 1.500 euros mensuales segun el volumen.

Q: Es mejor empezar con data warehouse o data lake

Para la mayoria de pymes y medianas empresas, el data warehouse es la opcion correcta. Si tus datos son principalmente tabulares (ERP, CRM, facturacion) y el objetivo es reporting y BI, el warehouse resuelve el problema con menos complejidad y menor coste operativo. El data lake tiene sentido cuando manejas datos no estructurados o volumenes de terabytes.

Q: Puedo usar dbt sin Airflow u otro orquestador

Si. Para equipos pequenos, dbt Core con un cron job o dbt Cloud con su scheduler integrado es suficiente. Airflow o Dagster aportan valor cuando tienes pipelines complejos con dependencias entre multiples sistemas o cuando necesitas orquestacion avanzada con reintentos, alertas y monitorizacion. No es necesario desde el dia uno.

Q: Snowflake o BigQuery para una empresa mediana en Espana

Ambos son buenas opciones. BigQuery encaja mejor si ya usas Google Workspace o GCP. Snowflake tiene ventaja en separacion de computacion y almacenamiento y en flexibilidad multi-cloud. Para empresas sin ecosistema cloud definido, Snowflake suele ganar en flexibilidad; para empresas ya en GCP, BigQuery es la opcion mas natural. El coste es similar a escalas medianas.

Q: Que es data mesh y cuando tiene sentido

Data mesh es un patron organizativo donde cada dominio de negocio gestiona sus propios datos como productos. Tiene sentido cuando la empresa es lo suficientemente grande como para que un equipo centralizado de datos sea un cuello de botella. Para empresas con menos de 200 personas o con un equipo de datos de menos de 5 personas, el data mesh anade mas complejidad que beneficio.

Q: Cuanto tiempo tarda en estar operativa la primera version de la plataforma

Un MVP con 2-3 fuentes integradas, un modelo de datos funcional y el primer caso de uso de reporting puede estar listo en 4-8 semanas. Plataformas mas completas con multiples departamentos, gobernanza y orquestacion avanzada requieren 3-6 meses. Lo importante es no intentar integrarlo todo en la primera fase.

Q: Necesito un equipo de data engineering interno para mantener la plataforma

Depende del alcance. Para un warehouse gestionado (Snowflake, BigQuery) con dbt, un perfil analitico con conocimientos de SQL puede cubrir la operacion basica. A medida que la plataforma crece, conviene contar con perfiles de data engineering, ya sea internos o a traves de un partner que gestione la evolucion y el mantenimiento.

Q: Que diferencia hay entre ETL y ELT y cual elegir en 2026

ETL transforma los datos antes de cargarlos. ELT carga primero en bruto y transforma despues dentro del warehouse. En 2026, ELT con dbt es el enfoque estandar para la mayoria de arquitecturas modernas: los warehouses cloud son suficientemente potentes para la transformacion, y dbt aporta versionado, tests y documentacion sobre SQL que el ETL tradicional no tiene.

Q: Como se si mi arquitectura actual necesita redisenarse

Senales claras: el pipeline tarda mas de lo que deberia y el equipo no sabe por que, hay tablas que nadie sabe exactamente que contienen, los informes cuadran a veces y a veces no, anadir una nueva fuente requiere semanas de trabajo, o la plataforma genera costes de cloud desproporcionados. Si reconoces tres o mas, merece la pena un diagnostico antes que un parche.

David Aldomar

arquitectura-datos datos estrategia data-engineering BI

Arquitectura de Datos: guía completa 2026

Todo lo que necesitas saber sobre arquitectura de datos en empresa: patrones principales, stack tecnologico, criterios de eleccion, costes orientativos y errores habituales.

David Aldomar19 de abril de 202618 min lectura

📌 En resumen

La arquitectura de datos es el conjunto de decisiones sobre como se recogen, almacenan, transforman y consumen los datos de una empresa. No existe una arquitectura correcta universal: la eleccion adecuada depende del volumen de datos, los casos de uso, el equipo tecnico disponible y el presupuesto. Segun Gartner (2025), el 75% de las empresas que fracasan en proyectos de plataforma de datos lo hace por elegir una arquitectura mas compleja de lo que su madurez organizativa puede mantener.

El error mas frecuente en proyectos de plataforma de datos es copiar la arquitectura de una empresa grande. Un data lakehouse con Databricks, Delta Lake y Spark puede ser la eleccion perfecta para una empresa con petabytes de datos y un equipo de ingenieria de veinte personas. Para una empresa mediana con tres fuentes de datos y dos analistas, es sobredimensionar por cinco.

Esta guia parte de lo que necesita una empresa real: entender que opciones existen, cuando tiene sentido cada una, que herramientas componen el stack y cuanto cuesta. Sin marketing de herramientas ni arquitecturas de referencia que nadie puede mantener.

Que es la arquitectura de datos y por que importa?

Gartner (2025) estima que las empresas con una arquitectura de datos bien definida reducen el tiempo de preparacion de informes hasta en un 60% y mejoran la fiabilidad de sus decisiones de negocio. La arquitectura de datos es el conjunto de decisiones tecnicas y organizativas sobre como se mueven, almacenan y transforman los datos desde las fuentes operacionales hasta los consumidores finales.

Sin una arquitectura clara, los sintomas son siempre los mismos: datos fragmentados en diferentes sistemas sin una fuente de verdad, informes que dan cifras distintas segun quien los prepare, proyectos de BI o IA que arrancan sobre datos de mala calidad, y equipos que dedican mas tiempo a preparar datos que a analizarlos.

Capa de ingesta: como entran los datos desde los sistemas operacionales (ERP, CRM, APIs, archivos). Herramientas habituales: Airbyte, Fivetran, Stitch, scripts Python.
Capa de almacenamiento: donde se guardan los datos (data warehouse, data lake, lakehouse). Decision mas importante de la arquitectura.
Capa de transformacion: como se limpian, normalizan y preparan los datos para el consumo. Herramienta estandar en 2026: dbt.
Capa de orquestacion: que gestiona el orden y la ejecucion de los pipelines. Opciones: Airflow, Dagster, Prefect, o el scheduler de dbt Cloud.
Capa de consumo: dashboards (Power BI, Looker, Tableau), APIs analiticas, modelos de ML, sistemas RAG.

Cuales son los 4 patrones principales de arquitectura de datos?

Segun Databricks (2024), mas del 70% de las empresas que adoptan arquitecturas de datos modernas elige entre data warehouse, data lake o lakehouse segun su caso de uso principal. El data mesh, como patron organizativo, se superpone a cualquiera de los tres anteriores.

Data warehouse

Almacen de datos estructurados optimizado para consultas analiticas. Los datos entran ya transformados y limpios. Es la opcion mas madura, la de menor complejidad operativa y la mas adecuada para empresas con datos principalmente tabulares y objetivo de BI y reporting. Herramientas lideres: Snowflake, Google BigQuery, Amazon Redshift, Azure Synapse, Microsoft Fabric.

Data lake

Repositorio que almacena datos en bruto, en cualquier formato: tablas, JSON, imagenes, logs, documentos. El almacenamiento es barato (S3, GCS, ADLS), pero la gobernanza es cara. Sin control riguroso sobre el esquema y la calidad, un data lake se convierte en un data swamp donde nadie encuentra nada ni confia en los datos. Encaja cuando hay datos no estructurados o necesidades de ML sobre volumenes grandes.

Lakehouse

Arquitectura que combina la flexibilidad del lake con las capacidades analiticas del warehouse. Tecnologias como Delta Lake, Apache Iceberg o Apache Hudi anaden transacciones ACID, control de esquema y versionado sobre un almacenamiento tipo lake. Databricks es el principal representante de este patron. Requiere mas madurez tecnica, pero permite unificar workloads de BI y ML sobre el mismo almacen.

Data mesh

Patron organizativo, no tecnologico. Cada dominio de negocio gestiona sus propios datos como productos y los publica para que otros dominios los consuman. La plataforma de datos es una infraestructura compartida, pero la responsabilidad es distribuida. Tiene sentido cuando la empresa es suficientemente grande para que un equipo centralizado sea cuello de botella. Para la mayoria de medianas empresas, el data mesh anade complejidad sin necesidad. Mas detalles en la guia sobre cuando elegir cada patron.

Comparativa de los cuatro patrones de arquitectura de datos segun criterios practicos de decision.
Patron	Tipo de datos	Caso de uso principal	Complejidad	Madurez necesaria
Data warehouse	Estructurados (tablas)	BI, reporting, analisis	Media	Media
Data lake	Todo tipo (bruto)	ML, IoT, datos no estructurados	Alta	Alta
Lakehouse	Estructurados y no estructurados	BI y ML sobre el mismo almacen	Media-alta	Alta
Data mesh	Cualquiera (patron org.)	Dominios autonomos en empresa grande	Muy alta	Muy alta

Cuando elegir cada patron segun tamano y madurez?

Snowflake (2024) indica que el 80% de las empresas que adoptan un data warehouse moderno tienen menos de 500 empleados. El patron correcto no depende solo del volumen de datos, sino de la combinacion de madurez tecnica del equipo, los casos de uso a 12 meses y el presupuesto operativo disponible.

Empresa con datos principalmente tabulares, ERP y CRM, objetivo de BI y reporting, equipo pequeno: data warehouse moderno. Snowflake, BigQuery o Microsoft Fabric segun el ecosistema cloud.
Empresa con datos mixtos (tablas, documentos e imagenes), necesidad de ML y BI combinados, equipo con experiencia en ingenieria de datos: lakehouse con Delta Lake o Iceberg.
Empresa con datos no estructurados masivos (industrial IoT, imagenes, logs), equipo de ingenieria de datos consolidado: data lake con capa de gobernanza.
Empresa con 500+ personas, multiples dominios de negocio, cuello de botella en el equipo central de datos: data mesh sobre la infraestructura ya existente.

ℹ️ Nota

Regla practica: si puedes describir el problema que la arquitectura debe resolver en una sola frase, la arquitectura necesaria probablemente es mas sencilla de lo que crees. Empieza por lo minimo viable que resuelve el problema real, y escala cuando el problema siguiente lo justifique.

Stack tecnologico por capa: ingesta, almacenamiento, transformacion y consumo

dbt Labs (2025) reporta que dbt se ha convertido en el estandar de facto para la capa de transformacion, con mas de 30.000 empresas usando dbt en produccion. El stack moderno de datos se compone de herramientas especializadas por capa, no de un unico sistema que lo hace todo.

Capa de ingesta: como entran los datos

Las herramientas de ingesta conectan los sistemas operacionales con el almacen de datos. Las opciones mas usadas en empresa mediana: Airbyte (open source, self-hosted, cubre mas de 300 conectores), Fivetran (gestionado, conectores muy fiables para ERP y SaaS estandar, coste basado en volumen de datos sincronizados), Stitch (mas sencillo, adecuado para stacks mas pequenos). Para sistemas muy especificos o sin conectores nativos, scripts Python con pandas o SQLAlchemy siguen siendo una opcion valida.

Capa de almacenamiento: donde viven los datos

La decision mas importante de la arquitectura. Snowflake destaca por su modelo de separacion de computacion y almacenamiento, su facilidad de escalado y su ecosistema de integraciones. BigQuery encaja de forma natural en entornos GCP. Databricks es la opcion dominante cuando la empresa necesita combinar BI y ML en un mismo entorno. Microsoft Fabric unifica almacenamiento, transformacion y BI en un unico ecosistema Microsoft. Una comparativa mas detallada en el articulo sobre Snowflake vs BigQuery.

Capa de transformacion: dbt como estandar

dbt (data build tool) se ha convertido en el estandar de la capa de transformacion en arquitecturas modernas. Permite escribir transformaciones en SQL con versionado en Git, tests automaticos de calidad y documentacion integrada. Elimina la capa de codigo Python de transformacion que antes era necesaria, y hace que las transformaciones sean mantenibles por perfiles analiticos sin profundos conocimientos de ingenieria. Mas detalles sobre como encaja dbt en la practica en la guia de dbt para empresas.

Capa de orquestacion: que gestiona el orden de los pipelines

Apache Airflow sigue siendo el estandar open source para orquestacion de pipelines. Dagster gana terreno por su modelo de activos y su mejor integracion con dbt. Prefect ofrece una curva de aprendizaje mas suave. Para equipos pequenos, el scheduler de dbt Cloud o incluso cron jobs bien monitorizados son suficientes. La orquestacion avanzada solo se justifica cuando hay dependencias complejas entre pipelines o necesidades de reintentos y alertas especificas.

Pasos para disenar e implementar la arquitectura de datos

Los proyectos de plataforma de datos que mejor funcionan siguen un enfoque iterativo: resolver un problema concreto, validar y ampliar. No intentar cubrir todo el alcance en la primera fase. El proceso detallado de implantacion, incluyendo fases, equipo y criterios de validacion, esta en nuestra pagina de plataforma de datos.

1. Diagnostico: fuentes, problemas y casos de uso

Siguiente paso

Plataforma de Datos para Empresas

Disenamos e implantamos tu plataforma de datos: data warehouse, pipelines dbt + Airflow y fuente unica de verdad para BI e IA. Diagnostico gratuito.

Saber más →

Mapea que sistemas generan datos, que problemas existen hoy (informes que no cuadran, datos duplicados, procesos manuales de preparacion) y que quieres resolver en los proximos 6-12 meses. Este diagnostico define el alcance del MVP y evita que la arquitectura se disene para casos de uso hipoteticos que quiza nunca se materializan.

2. Diseno de la arquitectura minima viable

Elige el patron (warehouse, lake, lakehouse) y las herramientas concretas para cada capa. Define el modelo de datos inicial: que entidades son criticas, como se relacionan, que metricas de negocio hay que calcular. Define tambien quien va a mantener la plataforma: equipo interno, partner o modelo mixto.

3. Implementacion del MVP: 2-3 fuentes y primer caso de uso

Conecta las fuentes prioritarias, construye el pipeline de ingesta y transformacion, y despliega el primer caso de uso de consumo. El equipo de negocio valida que los datos son correctos y que el primer entregable resuelve el problema inicial. Solo despues tiene sentido ampliar a nuevas fuentes.

4. Escalado: mas fuentes, gobernanza y orquestacion avanzada

A medida que se suman fuentes, equipos y casos de uso, la gobernanza se vuelve necesaria: catalogo de datos, linaje, calidad automatizada, control de acceso. La orquestacion avanzada (Airflow, Dagster) tiene sentido cuando los pipelines son muchos y las dependencias complejas. No hay que llegar aqui en la primera fase.

Errores habituales en proyectos de plataforma de datos

Los errores mas frecuentes en proyectos de arquitectura de datos no son tecnicos. Son de enfoque, alcance y gestion de expectativas. Reconocerlos de antemano permite evitarlos.

Sobredimensionar desde el inicio: montar un lakehouse con Databricks y Spark cuando tienes tres tablas de ERP y un CRM. La complejidad del sistema se paga en coste de mantenimiento mensual durante anos.
Elegir la herramienta antes que la arquitectura: la tecnologia concreta deberia ser la ultima decision, despues de entender el problema, los casos de uso y el equipo. Comprar una licencia de Snowflake el primer dia sin haber definido el modelo de datos es poner el carro delante del caballo.
No involucrar a negocio: si la arquitectura la disena solo el equipo tecnico, acabara resolviendo problemas tecnicos que nadie tiene. El modelo de datos tiene que reflejar como el negocio entiende sus entidades y metricas.
Ignorar la gobernanza hasta que es tarde: no hace falta un programa formal desde el dia uno, pero si definir quien es responsable de cada fuente y que significa que un dato sea correcto.
No planificar el mantenimiento: las fuentes cambian, las reglas de negocio evolucionan, los volumenes crecen. Una plataforma de datos sin presupuesto de mantenimiento se degrada en meses.

Costes orientativos por tipo de arquitectura

Los rangos que siguen son orientativos para proyectos de empresa mediana espanola. El coste real depende del numero de fuentes, la complejidad del modelo de datos y el equipo tecnico disponible. En todos los casos hay que sumar el coste de infraestructura cloud mensual al coste inicial del proyecto.

Rangos orientativos de coste de implementacion por tipo de arquitectura de datos. Los costes de infraestructura son mensuales.
Tipo de arquitectura	Coste de proyecto inicial	Infraestructura cloud (mensual)	Complejidad de mantenimiento
Data mart departamental	8.000-20.000 EUR	100-300 EUR/mes	Baja
Data warehouse corporativo	20.000-60.000 EUR	300-1.500 EUR/mes	Media
Lakehouse con Delta Lake o Iceberg	40.000-120.000 EUR	800-3.000 EUR/mes	Alta
Data mesh (multi-dominio)	80.000-200.000+ EUR	2.000-8.000+ EUR/mes	Muy alta

⚠️ Atención

Desconfia de presupuestos que no incluyen el coste de mantenimiento. Una plataforma de datos requiere mantenimiento continuo: nuevas fuentes, cambios en reglas de negocio, actualizaciones de modelos y monitorizacion de pipelines. Presupuesta entre un 15% y un 20% del coste inicial como coste anual de mantenimiento.

Como evaluar si tu arquitectura actual necesita rediseno?

No todas las empresas necesitan reisenar su arquitectura de datos. Pero hay senales claras de que el sistema actual ya no escala: los pipelines tardan mas de lo esperado y el equipo no sabe por que, anadir una nueva fuente de datos requiere semanas de trabajo, los costes de infraestructura cloud crecen sin explicacion clara, los informes dan cifras distintas segun quien los prepare, o los proyectos de BI e IA arrancan siempre con retrasos por problemas de datos.

Si reconoces tres o mas de estas senales, el problema probablemente no es la herramienta sino la arquitectura. Antes de anadir mas herramientas encima del sistema actual, merece la pena hacer un diagnostico de la situacion. Puedes contactarnos para una primera conversacion sin compromiso o revisar como abordamos estos proyectos en nuestra pagina de plataforma de datos.

Preguntas frecuentes sobre arquitectura de datos

Que es un data mart y cuando tiene sentido?

Un data mart es un subconjunto del data warehouse centrado en un area de negocio especifica (ventas, finanzas, operaciones). Tiene sentido como primer paso antes de un warehouse corporativo, o como capa de consumo optimizada para un equipo especifico. Es mas sencillo de implementar y mantener, y resuelve el problema de un departamento sin necesidad de integrar toda la empresa desde el principio.

Es dbt suficiente o necesito un ETL tradicional?

Para la mayoria de casos en 2026, dbt mas una herramienta de ingesta (Airbyte, Fivetran) es suficiente y mejor que un ETL tradicional. El ETL tradicional mezcla ingesta y transformacion en un sistema dificil de testear y versionar. El enfoque ELT (ingestar primero, transformar despues con dbt) es mas mantenible, mas transparente y mas facil de depurar cuando algo falla.

Cuando tiene sentido Databricks frente a Snowflake?

Databricks tiene ventaja cuando necesitas combinar BI y ML en el mismo entorno, cuando trabajas con grandes volumenes de datos no estructurados, o cuando tu equipo tiene experiencia en Spark. Snowflake es mas sencillo de operar para equipos que vienen del mundo SQL y cuyo caso de uso principal es reporting y BI. Para la mayoria de pymes y medianas empresas, Snowflake o BigQuery son suficientes y mas faciles de gestionar.

Siguiente paso recomendado

Plataforma de Datos para Empresas

Disenamos e implantamos tu plataforma de datos: data warehouse, pipelines dbt + Airflow y fuente unica de verdad para BI e IA. Diagnostico gratuito.

Ver Plataforma de Datos para Empresas Reservar diagnóstico (20 min)

Sin compromiso · Respuesta en < 24h

Autor

David Aldomar

Fundador y Consultor de Datos e IA

David Aldomar es fundador y consultor principal de MERIDIAN Data & IA, consultora especializada en ayudar a pymes y empresas medianas en España a tomar mejores decisiones con sus datos. Su trabajo se centra en cuatro áreas: diseño e implantación de plataformas de datos (data warehouses, pipelines ETL con dbt, integración de ERPs y CRMs), reporting y dashboards ejecutivos en Power BI, automatización de procesos de negocio con herramientas como n8n, y desarrollo de soluciones de inteligencia artificial aplicada — desde modelos de forecasting de demanda hasta copilots internos basados en RAG con LangChain y FastAPI. Ha liderado proyectos en sectores como logística y transporte, retail y distribución, servicios financieros, manufacturing y construcción, siempre con un enfoque pragmático: diagnóstico corto, entregables concretos y transferencia de conocimiento al equipo del cliente para que sea autónomo desde el primer día. Antes de fundar MERIDIAN, acumuló experiencia en consultoría de datos y transformación digital trabajando con stacks variados — desde entornos Microsoft (SQL Server, Power BI, Azure) hasta ecosistemas open source (Python, dbt, BigQuery). Su filosofía es que un buen proyecto de datos no se mide por la tecnología que usa, sino por las decisiones de negocio que permite tomar. Escribe regularmente en el blog de MERIDIAN sobre reporting, gobierno del dato, automatización e IA aplicada, con guías prácticas orientadas a responsables de negocio y equipos técnicos de empresas que quieren sacar partido real a sus datos sin depender de grandes consultoras.

Ver perfil meridiandata.es/autores/david-aldomar

Fuentes

Contenido y servicios relacionados

Seguir leyendo

Arquitectura de Datos: guía completa 2026

Que es la arquitectura de datos y por que importa?

Cuales son los 4 patrones principales de arquitectura de datos?

Data warehouse

Data lake

Lakehouse

Data mesh

Cuando elegir cada patron segun tamano y madurez?

Stack tecnologico por capa: ingesta, almacenamiento, transformacion y consumo

Capa de ingesta: como entran los datos

Capa de almacenamiento: donde viven los datos

Capa de transformacion: dbt como estandar

Capa de orquestacion: que gestiona el orden de los pipelines

Pasos para disenar e implementar la arquitectura de datos

1. Diagnostico: fuentes, problemas y casos de uso

2. Diseno de la arquitectura minima viable

3. Implementacion del MVP: 2-3 fuentes y primer caso de uso

4. Escalado: mas fuentes, gobernanza y orquestacion avanzada

Errores habituales en proyectos de plataforma de datos

Costes orientativos por tipo de arquitectura

Como evaluar si tu arquitectura actual necesita rediseno?

Preguntas frecuentes sobre arquitectura de datos

Que es un data mart y cuando tiene sentido?

Es dbt suficiente o necesito un ETL tradicional?

Cuando tiene sentido Databricks frente a Snowflake?

Plataforma de Datos para Empresas

Contenido y servicios relacionados

Artículos relacionados

Cómo elegir la plataforma de datos adecuada para tu empresa

Big data en empresas: beneficios reales, limitaciones y cómo empezar

Customer MDM en retail B2C: cómo construir una vista única del cliente

Arquitectura de datos por etapas: cómo escalar desde cero sin sobredimensionar

Qué es un data mart, en qué se diferencia de un data warehouse y cuándo lo necesitas

Arquitectura de Datos: guía completa 2026

Que es la arquitectura de datos y por que importa?

Cuales son los 4 patrones principales de arquitectura de datos?

Data warehouse

Data lake

Lakehouse

Data mesh

Cuando elegir cada patron segun tamano y madurez?

Stack tecnologico por capa: ingesta, almacenamiento, transformacion y consumo

Capa de ingesta: como entran los datos

Capa de almacenamiento: donde viven los datos

Capa de transformacion: dbt como estandar

Capa de orquestacion: que gestiona el orden de los pipelines

Pasos para disenar e implementar la arquitectura de datos

1. Diagnostico: fuentes, problemas y casos de uso

2. Diseno de la arquitectura minima viable

3. Implementacion del MVP: 2-3 fuentes y primer caso de uso

4. Escalado: mas fuentes, gobernanza y orquestacion avanzada

Errores habituales en proyectos de plataforma de datos

Costes orientativos por tipo de arquitectura

Como evaluar si tu arquitectura actual necesita rediseno?

Preguntas frecuentes sobre arquitectura de datos

Que es un data mart y cuando tiene sentido?

Es dbt suficiente o necesito un ETL tradicional?

Cuando tiene sentido Databricks frente a Snowflake?

Plataforma de Datos para Empresas

Contenido y servicios relacionados

Artículos relacionados

Cómo elegir la plataforma de datos adecuada para tu empresa

Big data en empresas: beneficios reales, limitaciones y cómo empezar

Customer MDM en retail B2C: cómo construir una vista única del cliente

Arquitectura de datos por etapas: cómo escalar desde cero sin sobredimensionar

Qué es un data mart, en qué se diferencia de un data warehouse y cuándo lo necesitas