En el último post hablamos del entusiasmo creciente que se está generando alrededor del ‘Big Data’ (ya sé que en latín ‘data’ es plural, pero los anglosajones pasan de ello, así que me conformo con la costumbre de considerarlo un singular). Hablamos, un poco por encima, de qué es ‘Big Data’ y en qué consiste su explotación para fines de Business Intelligence. Finalmente, manifestamos cierto criticismo hacia el entusiasmo de aquellos que perciben el ‘Big Data’ como un cambio paradigmático en el mundo empresarial.
Nos quedaba pendiente hacer hincapié en algunos de los principales caveats que hay que tener en cuenta antes de lanzarse boca abajo en el mundo del ‘Big Data’ y llenar de datos el disco duro. Vamos a enumerarlos.
1. Lo dicho. ‘Big Data’ es BIG. Son muchos y muchos bits de información. Su descarga, almacenamiento y análisis tiende a ralentizar inevitablemente la performance de vuestro ordenador. Consejo: mejor si trabajáis con una fracción aleatoria de todos los datos (es importante que sea aleatoria, de lo contrario acabaréis sesgando el análisis).
2. ‘Big Data’ es caótico. Las bases de datos suelen ser desordenadas. Nada que ver con datos de encuesta, donde cada variable se corresponde a una pregunta. A veces hay que pasar horas tratando entender qué es exactamente cada variable y cómo se relaciona con todas las demás. Peor todavía si el database de procedencia es relacional. En este caso habrá varias bases de datos que – en teoría – comparten un identificador. Consejo: guardar un esquema que ilustre la arquitectura de los datos. Normalmente el departamento de IT guarda ese esquema, pero si no lo pedís no lo sueltan.
3. ‘Big Data’ requiere trabajo en equipo. No se trata solo de sacar tablas y producir gráficos. Hay que entender como funciona el negocio y por lo tanto hacer muchas preguntas a varias personas. ¿En qué categorías están organizados los productos? ¿A qué tipologías de promociones corresponden estos códigos? ¿Cómo se obtiene este importe? Podríamos seguir hasta el infinito. Consejo: mantener varias reuniones regulares con todas las personas involucradas en el proyecto desde su comienzo.
4. Una vez aclarados todos los detalles, es la hora de ponerse con los datos. Importante: a pesar de que la minería de datos es fundamentalmente un proceso data-driven, necesitaréis igualmente unas hipótesis de partida y posiblemente una buena teoría sobre cómo funciona – o cómo debería funcionar – el negocio que estáis observando. De lo contrario exploraréis datos durante días sin llegar a ninguna conclusión sólida. Consejo: intentar acotar con el cliente los objetivos del análisis para que sea lo más eficiente posible.
5. Mejor empezar con análisis sencillos. Si creéis que vais a descubrir algún patrón en los datos que hará despegar verticalmente las ventas, la correlación más fuerte la tendréis entre vuestra frustración y el tiempo pasado delante a una hoja de cálculo. El comportamiento humano, guste o no guste, está dominado por decisiones impulsivas y poco racionales. Entre ellas, las decisiones de compra destacan por ser especialmente impulsivas e irracionales. La idea de descubrir un orden oculto donde no lo hay puede transformarse en un gran perdida de tiempo. Consejo: mejor concentrarse sólo en las correlaciones estadísticamente significativas. Eso os ayudará a eliminar parte del ruido y a ganar tiempo.
6. El análisis del ‘Big Data’ pueden ofrecer muchos insights útiles para el fine-tuning de un negocio. Lo que no puede hacer es solucionar fallos estructurales en el business plan, mejorar productos que son de mala calidad o modificar las necesidades de los consumidores.
7. Casi siempre ‘Big Data’ es anónimo. Cuando analizamos, por ejemplo, datos procedentes de un e-commerce, la información que tenemos se centra en transacciones de las que sabemos mucho (qué producto se ha vendido, cuales fueron el día y la hora de la compra, el importe monetario, etc.), pero relativamente poco sobre el comprador. La idea de abandonar la investigación cuantitativa tradicional para lanzarse a la piscina del Big Data, puede no ser la mejor que vais a tomar. Sin información sobre las principales variables socio-demográficas de los compradores, cualquier tipo de análisis será inevitablemente parcial y limitado. Consejo: mejor combinar la minería de datos con datos procedentes de encuestas y, si es posible cruzar la información.
En este post hemos hecho algunas consideraciones, seguramente superficiales, sobre el análisis de las grandes cantidades de datos que se están almacenando como consecuencia de la multitud de negocios online que han florecido en los últimos años. La semana que viene, en otro post dedicado al data mining, hablaremos del RFM. Un análisis relativamente sencillo pero muy eficaz para mover los primeros pasos en el Big Data. Stay tuned.
© 2019 Empirica Influentials & Research
Add comment