Mejor toma de decisiones con datos alternativos

Publicado el: 2026-04-11 18:18:29

“Basura entra, basura sale. O, dicho de forma más feliz: el árbol de la tontería se riega con error, y de sus ramas cuelgan las calabazas del desastre.”

Esta frase de The Gone-Away World también encaja con la toma de decisiones.

Decisimo decision engine

Try our decision engine.

Toma de decisiones mejorada

La autenticidad y la integridad de los datos utilizados en el proceso de toma de decisiones determinan la calidad de la decisión. También afectan al resultado. Las fuentes de datos se dividen en 2 categorías: primarias y secundarias.

La fuente de datos primaria procede del cliente o usuario que introduce datos y responde preguntas en el flujo de datos. Las fuentes secundarias incluyen proveedores de datos alternativos y brókers de datos. Si recopilas menos datos del cliente, necesitas recopilar o enriquecer más datos de fuentes secundarias o brókers.

Los datos utilizados para el enriquecimiento pueden incluir identificadores personales tradicionales como números de teléfono, direcciones de correo electrónico y direcciones físicas. También pueden incluir datos técnicos como información del dispositivo, datos del navegador y direcciones IP.

 

Recopilación de datos con inicio de sesión asistido

Los brókers de datos utilizan fuentes que incluyen solicitudes API y la “recopilación de datos con inicio de sesión asistido”. Las solicitudes API son sencillas. Se envía una solicitud y se reciben los datos en la respuesta. La recopilación de datos con inicio de sesión asistido plantea más desafíos para la calidad y la integridad de los datos.

La recopilación de datos con inicio de sesión asistido puede abarcar desde estándares API de Open Banking hasta el scraping de cuentas. El scraping de cuentas suele producirse cuando los usuarios proporcionan credenciales de acceso en un sitio. En segundo plano, los proveedores de datos inician sesión y extraen los datos. Los limpian y los envían a la empresa donde el usuario proporcionó las credenciales. Algunos sitios web intentan impedir el scraping, por lo que en esos casos no se recopilan datos.

 

Retos del uso de datos alternativos

Debido a cómo se recopilan y procesan los datos alternativos, pueden estar incompletos. La calidad de los datos puede ser cuestionable y pueden carecer de la integridad necesaria para ser útiles. A veces, todo el servicio no está disponible. Eso ocurre cuando el sitio del que se extraen los datos bloquea la recopilación.

Tradicionalmente, los datos alternativos se utilizan para una mejor segmentación y elaboración de perfiles de clientes en marketing. Se usan para entrenar modelos predictivos de scoring crediticio, enriquecer perfiles de usuario y verificar la identidad del usuario. También pueden reducir el fraude y el uso indebido de datos.

El uso de fuentes de datos alternativas presenta 2 retos principales: la legalidad y las interrupciones del servicio. Aunque el cliente es propietario de la información, las plataformas que se extraen suelen oponerse. Intentan activamente impedirlo y pueden describirlo como “robo” de datos.

Otro reto son las interrupciones del servicio que provocan errores técnicos como “servicio no disponible”. Las respuestas de datos pueden estar incompletas incluso cuando parecen correctas. Faltan algunos valores y los datos están incompletos. Los tiempos de respuesta a veces son más largos de lo que permiten los procesos de negocio. Eso hace imposible recopilar correctamente los datos requeridos.

Teniendo esto en cuenta, algunas buenas prácticas y controles pueden ayudar al trabajar con datos alternativos:

  • Asume que habrá problemas con los datos.
  • Diseña flujos de decisión que sigan ejecutándose cuando falten datos.
  • Cuando uses varias fuentes de datos, consúltalas en paralelo para reducir el tiempo de ejecución.
  • Almacena en caché los datos durante el periodo en el que estés seguro de que, desde el punto de vista del negocio, no podrían haber cambiado. A veces ayuda preguntar a la fuente con qué frecuencia se actualizan los datos.
  • Al crear modelos predictivos y categorizar variables, separa “sin respuesta”, “sin datos” y “valor nulo”. Cada uno tiene un significado de negocio distinto y puede tener diferente poder predictivo. Si los combinas en un solo “valor nulo”, puedes perder una señal predictiva útil.

Usar fuentes de datos alternativas no tiene por qué perjudicar la calidad del proceso de toma de decisiones ni su resultado. Puedes establecer medidas de protección para evitar el escenario de “basura entra, basura sale”.

Decisimo decision engine

Try our decision engine.