A medida que el análisis de marketing evoluciona rápidamente hacia un campo impulsado por la IA, un desafío importante amenaza con descarrilar el progreso: los datos incorrectos. Si bien la IA destaca por convertir grandes cantidades de información en conocimientos prácticos, su eficacia depende de conjuntos de datos bien planificados y bien gestionados.
Los datos incorrectos conducen a predicciones deficientes, sesgos, conocimientos erróneos y resultados no deseados. Para abordar estos riesgos, las empresas invierten mucho en limpieza, validación y gobernanza de datos, un proceso esencial, complejo y que requiere mucho tiempo.
Para los analistas, es fundamental priorizar una mejor medición y comprender el contexto empresarial detrás de sus datos. Es por eso que los analistas deben liderar los esfuerzos para optimizar los datos para la IA. A continuación se presentan cuatro estrategias para extraer información de conjuntos de datos defectuosos y al mismo tiempo mejorar la higiene y la planificación de los datos.
1. Identificar datos que lo corroboren
A menudo es posible utilizar otras fuentes de datos para corroborar las métricas que intenta medir. Por ejemplo, trabajé con un minorista que afirmaba que los datos de su inventario no eran confiables, un problema importante. Sin embargo, los datos de los puntos de venta (POS) identificaron SKU de rápido movimiento que de repente mostraron cero ventas.
Aunque el sistema de inventario mostró niveles bajos de existencias (pero no agotamiento), los patrones de ventas indicaron claramente un problema de inventario que afectaba los ingresos. Utilizando esta información, ajustamos los umbrales de reabastecimiento y los factores desencadenantes para mantener en stock la mercancía de alta demanda, mitigando la pérdida de ingresos.
Profundizar más: Cómo asegurarse de que sus datos estén preparados para la IA
2. Investigar la ‘mala reputación’
A veces, un conjunto de datos se gana una mala reputación debido a «valores atípicos ruidosos» que reciben una atención desproporcionada. Si bien son notables, estos errores a menudo representan una pequeña proporción de datos que de otro modo serían precisos.
Por ejemplo, trabajé en datos de pólizas domésticas para una aseguradora de líneas personales. Hubo casos en los que las pólizas se agruparon erróneamente en el mismo hogar o se separaron incorrectamente. Descubrimos que varios problemas, como direcciones y pólizas incorrectas o repetidas vendidas por diferentes agentes, provocaron la mayoría de los errores. Limpiamos el conjunto de datos escribiendo código correctivo, convirtiéndolo en un recurso confiable.
3. Diferenciar entre cero y nulo
Los datos faltantes pueden dificultar la toma de decisiones. Entonces, el primer paso es determinar si realmente faltan valores o simplemente se registran como cero. Comprender la lógica detrás de cómo se generan los datos es crucial, ya que “sin actividad” (cero) no es lo mismo que “información faltante” (nula). Si realmente faltan datos, tiene dos opciones.
- ¿Existen valores sustitutos o variables que puedan estimar los valores faltantes? Esto puede implicar experimentación con variables combinadas.
- ¿Se puede seguir abordando la cuestión empresarial utilizando los datos disponibles?
En la mayoría de los casos, los datos faltantes son más un obstáculo que un obstáculo insuperable.
Profundizar más: La jerarquía del análisis de datos: dónde encaja la IA generativa
4. Utilice el error aleatorio a su favor
A veces, los datos incorrectos requieren demasiado tiempo para corregirse o simplemente no son reparables. Sin embargo, si los errores son aleatorios, pueden anularse entre sí. Esto permite seguir midiendo diferencias significativas entre grupos o períodos.
Por ejemplo, mi equipo trabajó con datos de tráfico web de dos marcas recientemente fusionadas. Cada marca tenía su propia plataforma de análisis, que proporcionaba mediciones ligeramente diferentes y enfrentaba problemas de identificación de visitantes.
Dado que no había ninguna razón para creer que la plataforma de una marca tuviera significativamente más fallas que la otra, asumimos que los errores eran aleatorios. Los factores de segmentación fueron similares en ambas marcas, lo que nos permitió analizar las diferencias a nivel de segmento de manera efectiva. Esta estrategia combinada impulsada por segmentos le ahorró millones a la empresa.
Aprovechar al máximo los datos defectuosos en un mundo impulsado por la IA
Estas estrategias no son exhaustivas, ya que cada desafío de datos es único. Sin embargo, con demasiada frecuencia, las empresas abandonan prematuramente conjuntos de datos defectuosos y se centran únicamente en el largo proceso de corregir los datos. Estas estrategias provisionales demuestran cómo todavía se pueden extraer conocimientos valiosos de conjuntos de datos imperfectos.
Al mismo tiempo, las empresas no deben sentirse limitadas por sus datos actuales. En muchos casos, la generación de datos nuevos y más relevantes puede ocurrir rápidamente, particularmente en el marketing digital. Utilizando datos que lo corroboren, abordando cuestiones de reputación, distinguiendo entre ceros y nulos y utilizando estratégicamente errores aleatorios, los analistas pueden desbloquear el valor de conjuntos de datos defectuosos y ayudar a construir una base sólida para el éxito impulsado por la IA.
Profundizar más: El camino impulsado por la IA hacia un marketing más inteligente
Se invita a los autores contribuyentes a crear contenido para MarTech y son elegidos por su experiencia y contribución a la comunidad martech. Nuestros colaboradores trabajan bajo la supervisión del personal editorial y se verifica la calidad y relevancia de las contribuciones para nuestros lectores. Las opiniones que expresan son propias.
Versión en Inglés 4 formas de corregir datos incorrectos y mejorar tu IA



