Seis KPIs de calidad de datos con fórmulas de cálculo, umbrales recomendados, diseño de dashboard y opciones de automatización para monitorizar la calidad de forma continua.
📌 En resumen
Medir la calidad de datos requiere KPIs concretos, no declaraciones de intenciones. Los seis indicadores fundamentales son completitud, unicidad, exactitud, consistencia, oportunidad y validez. Cada uno tiene una fórmula de cálculo clara, umbrales de referencia y un papel específico en la operativa de la empresa. Esta guía detalla cómo calcularlos, qué umbrales fijar según el contexto, cómo diseñar un dashboard de calidad y cómo automatizar la monitorización.
La frase «nuestros datos no son fiables» aparece en casi todas las reuniones sobre BI, IA o automatización. Pero cuando preguntas qué significa exactamente «no fiables», la respuesta suele ser vaga. Faltan datos, hay duplicados, los números no cuadran. Todo a la vez y nada concreto.
El problema no es que la calidad sea mala. El problema es que no se mide. Y lo que no se mide no se gestiona. Definir KPIs de calidad de datos convierte una queja difusa en algo accionable: un número, un umbral, un responsable y un proceso de corrección.
La calidad de datos no es un tema académico. Tiene impacto directo en tres áreas que afectan a la cuenta de resultados.
Según DAMA International, los seis pilares de calidad de datos más aceptados son: completitud, unicidad, exactitud, consistencia, oportunidad y validez. No son los únicos posibles, pero cubren la práctica totalidad de problemas habituales.
Mide el porcentaje de campos que tienen un valor frente al total de campos que deberían tenerlo. No todos los campos vacíos son un problema (hay campos opcionales), así que la completitud se mide sobre campos obligatorios o esperados.
Fórmula: Completitud (%) = (Registros con el campo relleno / Total de registros) × 100
Ejemplo: si tu tabla de clientes tiene 10.000 registros y 9.200 tienen el campo «email» relleno, la completitud de email es del 92 %.
Umbral orientativo: para campos críticos (email de contacto, NIF, código de producto), lo razonable es exigir un 95 %+ de completitud. Para campos secundarios, un 80 % puede ser aceptable.
Mide el porcentaje de registros que son únicos frente al total, identificando duplicados. Los duplicados son uno de los problemas más comunes y más dañinos: inflan métricas, generan comunicaciones dobles y distorsionan análisis.
Fórmula: Unicidad (%) = (Registros únicos / Total de registros) × 100
Ejemplo: si tienes 10.000 registros de clientes y 400 son duplicados, la unicidad es del 96 %.
Umbral orientativo: en tablas maestras (clientes, productos, proveedores), la unicidad debería ser superior al 98 %. En tablas transaccionales, el umbral depende del proceso, pero un 99 %+ es deseable.
Mide si los valores almacenados reflejan correctamente la realidad. Es el KPI más difícil de medir porque requiere una fuente de verdad contra la que comparar. No siempre es posible validar todos los registros, pero sí se pueden aplicar controles sobre muestras o mediante cruces con fuentes externas.
Fórmula: Exactitud (%) = (Registros correctos según fuente de referencia / Total de registros verificados) × 100
Ejemplo: verificas una muestra de 500 direcciones de envío contra la base de datos de Correos y 470 son correctas. La exactitud de direcciones es del 94 %.
Umbral orientativo: depende mucho del dominio. Para datos financieros o de facturación, la exactitud debería ser superior al 99 %. Para datos de contacto, un 90-95 % ya es un buen indicador.
Mide si el mismo dato tiene el mismo valor en distintos sistemas o tablas. Si el importe de una factura es diferente en el ERP y en el data warehouse, hay un problema de consistencia. Este KPI es especialmente relevante en empresas con múltiples sistemas que comparten datos.
Fórmula: Consistencia (%) = (Registros coincidentes entre sistemas / Total de registros comparados) × 100
Ejemplo: comparas 5.000 facturas entre el ERP y el warehouse. En 4.850 casos el importe coincide exactamente. La consistencia es del 97 %.
Umbral orientativo: para datos financieros, la consistencia debería ser del 99 %+. Para datos operativos que pasan por transformaciones, un 95 %+ es razonable como punto de partida.
Mide si los datos están disponibles cuando se necesitan. Un dato correcto que llega tres días tarde puede ser inútil para una decisión que se toma hoy. La oportunidad se mide como el porcentaje de datos que cumplen con el SLA de frescura definido.
Fórmula: Oportunidad (%) = (Cargas dentro del SLA / Total de cargas programadas) × 100
Ejemplo: tienes un pipeline que debe actualizar datos de ventas cada día a las 7:00. En los últimos 30 días, 28 cargas se completaron a tiempo. La oportunidad es del 93 %.
Umbral orientativo: para procesos críticos (reporting diario, alimentación de modelos), un 95 %+ es el mínimo. Para procesos menos urgentes, un 90 % puede ser aceptable.
Mide si los datos cumplen con las reglas de formato, dominio y lógica de negocio definidas. Un email sin arroba, un código postal de seis dígitos en España o una fecha de nacimiento en el futuro son ejemplos de datos no válidos.
Fórmula: Validez (%) = (Registros que cumplen las reglas de validación / Total de registros) × 100
Ejemplo: aplicas 15 reglas de validación sobre tu tabla de pedidos (formato de código, rangos de importe, fechas lógicas). De 20.000 registros, 19.400 pasan todas las reglas. La validez es del 97 %.
Umbral orientativo: un 95 %+ es un objetivo razonable para tablas críticas. Las reglas deben ser específicas y mantenidas: una regla desactualizada genera falsos positivos que erosionan la confianza en la métrica.
Siguiente paso
Gobierno del dato y calidad
Definimos y monitorizamos los KPIs de calidad correctos para tu empresa.
Saber más →Medir los KPIs está bien. Que alguien los vea y actúe sobre ellos es lo que marca la diferencia. Un dashboard de calidad de datos centraliza los indicadores, muestra tendencias y alerta cuando algo se degrada. Si ya usas Power BI, es una extensión natural de tu entorno de reporting. Lo cubrimos en calidad de datos en informes de Power BI.
Un buen dashboard de calidad debería incluir:
ℹ️ Nota
El dashboard de calidad no es un informe bonito para una presentación. Es una herramienta operativa que el equipo de datos y los data owners deberían consultar con la misma frecuencia con la que se actualizan los datos.
Los umbrales no son universales. Dependen del dominio, de la criticidad del dato y de lo que tu empresa puede absorber como error. Estos son los criterios para definirlos.
Medir manualmente no escala. Si tienes decenas de tablas y cientos de campos, necesitas que las validaciones se ejecuten automáticamente como parte de tus pipelines de datos. Lo abordamos en detalle en calidad de datos en pipelines ETL.
Las herramientas más utilizadas para automatizar:
Lo mínimo viable: alertas automáticas (email, Slack, Teams) cuando un KPI cae por debajo del umbral rojo. Sin alertas, el dashboard se convierte en algo que nadie mira hasta que ya es tarde.
Medir es el primer paso, pero el valor está en lo que haces con los resultados. Un proceso de mejora de calidad de datos funciona así:
Si necesitas ayuda para diseñar e implementar un marco de calidad de datos, puedes ver cómo lo abordamos en nuestra página de gobierno del dato y calidad o contactarnos para una evaluación inicial.
Para mas informacion, puedes consultar la informe de Gartner sobre datos listos para IA.
No necesariamente. Puedes empezar con consultas SQL que calculen los KPIs sobre tus tablas principales. A medida que escalas, herramientas como Great Expectations o Soda facilitan la automatización y la gestión de reglas. La herramienta llega después de tener claras las métricas y los umbrales.
Conecta la calidad de datos con dinero. Cuántas horas se dedican a limpiar datos manualmente. Cuántas decisiones se han tomado con cifras erróneas. Cuántos informes se han rehecho por duplicados o inconsistencias. Cuando el coste de la mala calidad se cuantifica, la inversión se justifica sola.
Los seis KPIs están pensados para datos estructurados (tablas, registros, campos). Para datos no estructurados (documentos, imágenes, texto libre), se aplican métricas diferentes: actualización del documento, formato accesible, cobertura temática. Si tu foco es preparar datos no estructurados para IA, lo cubrimos en datos listos para IA: calidad como requisito.
Siguiente paso recomendado
Definimos y monitorizamos los KPIs de calidad correctos para tu empresa.
Sin compromiso · Respuesta en < 24h
Autor
Fundador y Consultor de Datos e IA
David Aldomar es fundador y consultor principal de MERIDIAN Data & IA, consultora especializada en ayudar a pymes y empresas medianas en España a tomar mejores decisiones con sus datos. Su trabajo se centra en cuatro áreas: diseño e implantación de plataformas de datos (data warehouses, pipelines ETL con dbt, integración de ERPs y CRMs), reporting y dashboards ejecutivos en Power BI, automatización de procesos de negocio con herramientas como n8n, y desarrollo de soluciones de inteligencia artificial aplicada — desde modelos de forecasting de demanda hasta copilots internos basados en RAG con LangChain y FastAPI. Ha liderado proyectos en sectores como logística y transporte, retail y distribución, servicios financieros, manufacturing y construcción, siempre con un enfoque pragmático: diagnóstico corto, entregables concretos y transferencia de conocimiento al equipo del cliente para que sea autónomo desde el primer día. Antes de fundar MERIDIAN, acumuló experiencia en consultoría de datos y transformación digital trabajando con stacks variados — desde entornos Microsoft (SQL Server, Power BI, Azure) hasta ecosistemas open source (Python, dbt, BigQuery). Su filosofía es que un buen proyecto de datos no se mide por la tecnología que usa, sino por las decisiones de negocio que permite tomar. Escribe regularmente en el blog de MERIDIAN sobre reporting, gobierno del dato, automatización e IA aplicada, con guías prácticas orientadas a responsables de negocio y equipos técnicos de empresas que quieren sacar partido real a sus datos sin depender de grandes consultoras.
Fuentes
Diseño e implantación de marcos de gobernanza y calidad de datos adaptados a tu empresa.
Cómo la calidad de los datos afecta a tus informes de BI y qué controles aplicar.
Dónde y cómo integrar validaciones de calidad dentro de tus pipelines de datos.
Qué nivel de calidad necesitan tus datos antes de alimentar modelos de inteligencia artificial.
Con el gobierno en marcha, define los KPIs de calidad correctos.
Lectura complementaria sobre calidad de datos BI.
Seguir leyendo
11 min lectura
10 min lectura
10 min lectura
10 min lectura
11 min lectura
Última revisión: