Datos de CRM para un modelo de scoring útil

Q: Que datos del CRM son mas utiles para un modelo de scoring?

Los que reflejan comportamiento real: frecuencia de interacciones, historico de compras, tiempo desde la ultima actividad, tickets abiertos, y engagement con comunicaciones. Los datos demograficos ayudan pero no son suficientes solos.

Q: Mi CRM tiene muchos campos vacios, puedo hacer scoring?

Depende de que campos esten vacios. Si faltan los campos de comportamiento (compras, interacciones), el modelo sera pobre. Si faltan datos secundarios (sector, tamaño), el modelo puede funcionar pero con menor precision.

Q: Necesito un CRM especifico para hacer scoring?

No. El scoring se construye sobre los datos, no sobre la herramienta. Lo importante es que el CRM tenga un historico suficiente (12+ meses) y que los datos esten razonablemente completos en los campos criticos.

David Aldomar

retención CRM datos ventas machine-learning

Datos de CRM para un modelo de scoring útil

Un modelo de scoring es tan bueno como los datos del CRM que lo alimentan. Qué campos importan de verdad, cuáles sobran y cómo preparar los datos para que el modelo funcione.

David Aldomar3 de abril de 2026Actualizado: 17 de abril de 20267 min lectura

Qué datos de CRM necesitas para un modelo de scoring que sea útil

📌 En resumen

La calidad de un modelo de scoring comercial depende enteramente de los datos del CRM que lo alimentan. Antes de construir el modelo, hay que evaluar si los datos de actividad, perfil y resultado están completos, actualizados y capturados de forma consistente. Los campos imprescindibles son historial de interacciones, resultado de oportunidades (ganadas y perdidas), datos firmográficos del cliente y tiempo medio del ciclo de venta.

Los modelos de scoring —ya sea para priorizar leads o para clasificar clientes por valor potencial— son uno de los proyectos de IA más demandados en equipos comerciales. La promesa es clara: en lugar de que el comercial decida por intuición a quién llamar primero, un score numérico prioriza las oportunidades por probabilidad de conversión o por valor esperado.

Pero la calidad del scoring depende enteramente de los datos que lo alimentan. Y la realidad de la mayoría de CRMs es que los datos están incompletos, desactualizados o capturados de forma inconsistente. Antes de construir el modelo, hay que entender qué datos importan y cómo hay que prepararlos.

¿Cuáles son los 3 tipos de datos que alimentan un scoring?

Un modelo de scoring combina tres tipos de información, cada uno con un papel distinto:

1. Datos de perfil (quién es el lead o cliente)

Sector de la empresa, tamaño (empleados, facturación), cargo de la persona de contacto, ubicación geográfica, canal de captación. Son los datos que suelen estar en el CRM desde la creación del registro. Su valor predictivo es moderado —ayudan a filtrar— pero rara vez son suficientes por sí solos para un scoring útil.

2. Datos de comportamiento (qué ha hecho)

Visitas a la web, descargas de contenido, asistencia a webinars, apertura de emails, interacciones con el equipo comercial (llamadas, reuniones, demos). Estos datos tienen mucho más poder predictivo que los de perfil porque reflejan intención real. Un CEO de una empresa de 200 empleados que ha visitado la página de precios tres veces tiene más probabilidad de convertir que uno que solo ha descargado un ebook.

3. Datos de historial comercial (qué ha pasado antes)

Si el lead ya fue cliente o tuvo interacciones comerciales anteriores, ese historial es muy predictivo: duración del ciclo de venta anterior, motivo de no conversión si no compró, productos contratados si fue cliente, incidencias que tuvo. En CRMs con suficiente historial, este bloque suele ser el más valioso.

Los campos del CRM que más impactan en el scoring

De toda la información que un CRM puede almacenar, estos son los campos que, en la práctica, más impacto tienen en la precisión del modelo:

Canal de origen: no todos los canales producen leads de la misma calidad. Los leads que llegan por referencia o búsqueda orgánica suelen tener tasas de conversión muy superiores a los de campañas de pago genéricas.
Número y tipo de interacciones en los últimos 30/60/90 días: la recencia y la intensidad de las interacciones son de los predictores más fuertes. Un lead que interactuó 5 veces el último mes es muy distinto de uno que no ha hecho nada en 90 días.
Cargo o nivel de decisión del contacto: en B2B, si el contacto es un director o un responsable de compras, la probabilidad de conversión es mayor que si es un analista junior haciendo investigación.
Tamaño de empresa: no porque las empresas grandes conviertan más, sino porque el valor de la conversión es distinto. El scoring puede combinar probabilidad con valor esperado para priorizar de forma más inteligente.
Etapa actual en el pipeline: los leads que ya han tenido una demo o una reunión de descubrimiento tienen señales más claras que los que acaban de registrarse.

Los problemas de datos que rompen un scoring

Estos son los problemas que encontramos con más frecuencia al analizar los datos de CRM antes de construir un modelo:

1Campos vacíos o con valores genéricos. Si el 40% de los registros tienen «sector: otros» o el cargo está vacío, el modelo pierde variables predictivas. La solución no es inventar datos: es mejorar el proceso de captura para que los nuevos registros estén completos.
2Historial comercial no registrado. Si los comerciales no registran las interacciones (llamadas, emails, reuniones) en el CRM, el modelo no tiene datos de comportamiento. Es el problema más habitual y el más difícil de resolver: requiere cambio de hábitos del equipo comercial.
3Definición inconsistente de «conversión». Si unos comerciales marcan una oportunidad como ganada cuando se firma el contrato y otros cuando se envía la propuesta, el modelo aprende con datos contaminados. Hay que estandarizar la definición antes de entrenar.
4Falta de histórico de «no conversiones». Un modelo necesita ejemplos de leads que SÍ convirtieron y de leads que NO convirtieron. Si el CRM solo guarda los que avanzaron por el pipeline y borra o archiva los que no, hay un sesgo de supervivencia que distorsiona el scoring.
5Datos desactualizados. Un lead que se registró hace 18 meses con un email personal y cargo «freelance» puede haber cambiado de empresa dos veces. Si el CRM no se actualiza, el modelo trabaja con una foto antigua.

⚠️ Atención

No construyas un modelo de scoring sobre datos mal cualificados. Un scoring basado en datos incompletos genera dos problemas: el equipo no confía en los scores (porque ven que no cuadran con su experiencia) y deja de usarlos. Una vez perdida la confianza, es muy difícil recuperarla.

Cómo preparar los datos antes de construir el modelo

El trabajo previo al modelo es más importante que el modelo en sí. Empieza por auditar la calidad del CRM: ¿qué porcentaje de campos clave está completo? ¿Los comerciales registran las interacciones? ¿La definición de conversión es consistente? Si la auditoría revela problemas graves, primero hay que resolverlos. Si la calidad es razonable (70-80% de campos clave completos, historial de 12+ meses), ya puedes construir un primer modelo. En nuestro servicio de inteligencia artificial el análisis de calidad de datos es siempre el primer paso antes de construir cualquier modelo predictivo, y si el problema es más profundo, la auditoría de calidad de datos cubre el diagnóstico y la corrección de los problemas desde el origen.

Como preparar los datos del CRM para un modelo de scoring

Un modelo de scoring necesita datos que reflejen comportamiento, no solo datos demograficos. El paso previo a construir el modelo es preparar las variables: transformar los datos brutos del CRM en indicadores que el modelo pueda usar. Por ejemplo, el numero de interacciones del ultimo mes, los dias desde la ultima compra, el importe medio por pedido, y la tendencia de compra (creciente, estable, decreciente).

RFM basico: recencia (dias desde ultima compra), frecuencia (compras en los ultimos 12 meses), monetario (importe acumulado). Son los tres indicadores minimos para cualquier scoring.
Engagement: emails abiertos, clics en campañas, visitas al portal de cliente, llamadas realizadas. Si tu CRM registra estas interacciones, son predictores potentes.
Tendencia: no solo el valor actual sino la direccion. Un cliente que antes compraba mensual y ahora compra trimestral esta en riesgo aunque su RFM absoluto sea bueno.
Datos de soporte: numero de incidencias abiertas, tiempo medio de resolucion, satisfaccion declarada. Un cliente con muchas incidencias recientes es candidato a churn.

Errores al construir un scoring sobre datos de CRM

El error mas comun es incluir variables que correlacionan con el resultado pero no lo causan. Por ejemplo, los clientes que mas facturan suelen tener un comercial asignado senior. Si incluyes la seniority del comercial como variable, el modelo aprende que los comerciales senior predicen alta facturacion, que es cierto pero inutil: no puedes asignar un comercial senior a cada cliente.

Otro error frecuente es no actualizar el modelo. Un scoring construido con datos de hace dos años refleja patrones que pueden haber cambiado. Si tu mercado, tu producto o tu politica comercial han cambiado, el modelo necesita reentrenarse con datos recientes. Como minimo, valida el rendimiento del modelo cada trimestre y reentrena cada 6-12 meses.

Para mas contexto, puedes consultar la informe de Gartner sobre datos listos para IA.

Siguiente paso recomendado

IA aplicada para empresas

Convertimos los datos de tu CRM en un modelo de scoring accionable.

Ver IA aplicada para empresas Reservar diagnóstico (20 min)

Sin compromiso · Respuesta en < 24h

Autor

David Aldomar

Fundador y Consultor de Datos e IA

David Aldomar es fundador y consultor principal de MERIDIAN Data & IA, consultora especializada en ayudar a pymes y empresas medianas en España a tomar mejores decisiones con sus datos. Su trabajo se centra en cuatro áreas: diseño e implantación de plataformas de datos (data warehouses, pipelines ETL con dbt, integración de ERPs y CRMs), reporting y dashboards ejecutivos en Power BI, automatización de procesos de negocio con herramientas como n8n, y desarrollo de soluciones de inteligencia artificial aplicada — desde modelos de forecasting de demanda hasta copilots internos basados en RAG con LangChain y FastAPI. Ha liderado proyectos en sectores como logística y transporte, retail y distribución, servicios financieros, manufacturing y construcción, siempre con un enfoque pragmático: diagnóstico corto, entregables concretos y transferencia de conocimiento al equipo del cliente para que sea autónomo desde el primer día. Antes de fundar MERIDIAN, acumuló experiencia en consultoría de datos y transformación digital trabajando con stacks variados — desde entornos Microsoft (SQL Server, Power BI, Azure) hasta ecosistemas open source (Python, dbt, BigQuery). Su filosofía es que un buen proyecto de datos no se mide por la tecnología que usa, sino por las decisiones de negocio que permite tomar. Escribe regularmente en el blog de MERIDIAN sobre reporting, gobierno del dato, automatización e IA aplicada, con guías prácticas orientadas a responsables de negocio y equipos técnicos de empresas que quieren sacar partido real a sus datos sin depender de grandes consultoras.

Ver perfil meridiandata.es/autores/david-aldomar

Fuentes

Contenido y servicios relacionados

Seguir leyendo

Datos de CRM para un modelo de scoring útil

¿Cuáles son los 3 tipos de datos que alimentan un scoring?

1. Datos de perfil (quién es el lead o cliente)

2. Datos de comportamiento (qué ha hecho)

3. Datos de historial comercial (qué ha pasado antes)

Los campos del CRM que más impactan en el scoring

Los problemas de datos que rompen un scoring

Cómo preparar los datos antes de construir el modelo

Como preparar los datos del CRM para un modelo de scoring

Errores al construir un scoring sobre datos de CRM

IA aplicada para empresas

Contenido y servicios relacionados

Artículos relacionados

Segmentación de clientes con IA: cuándo merece la pena frente a reglas simples

Scoring de clientes con IA: cómo priorizar sin depender de la intuición del comercial

Cómo reducir el churn con modelos predictivos de abandono

Retención de clientes con IA: qué señales anticipan una baja antes de que llegue

Forecasting de demanda: Python vs herramientas no-code, cuándo usar cada opción

Datos de CRM para un modelo de scoring útil

¿Cuáles son los 3 tipos de datos que alimentan un scoring?

1. Datos de perfil (quién es el lead o cliente)

2. Datos de comportamiento (qué ha hecho)

3. Datos de historial comercial (qué ha pasado antes)

Los campos del CRM que más impactan en el scoring

Los problemas de datos que rompen un scoring

Cómo preparar los datos antes de construir el modelo

Como preparar los datos del CRM para un modelo de scoring

Errores al construir un scoring sobre datos de CRM

IA aplicada para empresas

Contenido y servicios relacionados

Artículos relacionados

Segmentación de clientes con IA: cuándo merece la pena frente a reglas simples

Scoring de clientes con IA: cómo priorizar sin depender de la intuición del comercial

Cómo reducir el churn con modelos predictivos de abandono

Retención de clientes con IA: qué señales anticipan una baja antes de que llegue

Forecasting de demanda: Python vs herramientas no-code, cuándo usar cada opción