Ejemplo DSS: Pañales y cervezas

DSS
jueves, 29 de octubre de 2009

Historia de los pañales y la cerveza como ejemplo paradigmático de minería de datos y Business Intelligence

Lo bueno de dedicarse a un mundo tan especializado como el Business Intelligence en general, o el data mining en particular, es que con muy poco puedes ser considerado como todo un experto, y captar la atención del auditorio.

Para ser todo un experto en mineria de datos, sólo es necesario saber dos historias. Una la contaré hoy, y otra la dejaré para el próximo artículo, de esta manera -me cuentan- se consigue un mayor suspense y aumenta el interés hacia este blog, tan interesante ya de por sí :-)

La historia, real o imaginaria, se situa a finales de lo 90, en la sede central de la cadena de supermercados Wal-Mart, donde decidieron iniciar un proyecto de basket analysis utilizando la ingente cantidad de información contenida en su Teradata datawarehouse.

Inicialmente, los resultados no parecieron muy espectaculares, ya que vieron que quien compraba pasta dentífrica también compraba cepillos de dientes; tampoco sorprendió que quien comprase whisky DYC inevitablemente adquiriese Cocacola... La sorpresa fue observar una correlación estadísticamente significativa entre la compra de pañales y cerveza.

Incorporaron la información de sus tarjetas de fidelización para profundizar en el estudio, y vieron que los compradores de cerveza y pañales eran varones de entre 25 y 35 años, que solían comprar estos productos conjuntamente los viernes por la tarde.

Con todos estos datos, fue fácil dar una explicación al fenómeno, y tomar medidas comerciales para aumentar las ventas, y justificar así el sueldo de todos estos analistas. Como los pañales son voluminosos, las madres enviaban a los padres de las criaturas a comprar los pañales, estos esperaban a último momento para hacerlo, y aprovechaban para comprar cervezas que se tomarían en casa, ya que en la sociedad americana está mal visto que un padre de familia frecuente los bares hasta tarde, y vuelva a casa dando tumbos...

Sea como fuere, tomaron la decisión de colocar las cervezas cerca de los pañales, con la intención de que los padres que compraban pañales y que no solían comprar cerveza, se acordasen que faltaba cerveza en casa. Me imagino que el argumento contrario también debe ser cierto, es decir, que los señores que iban a comprar cerveza, se acordasen que tienen un niño en casa.

Los resultados fueron espectaculares, o no estaría escribiendo sobre esto, y aumentaron entre un diez y un quince por cierto tanto las ventas de cevezas como de pañales.

La historia, real o no, es un buen ejemplo de los beneficios que puede aportar la minería de datos y, en particular, al análisis de la cesta de la compra (market basket analysis). Para que veais que no me lo he inventado íntegramente, aquí tenéis dos artículos que hablan sobre ello:

Recordad que esta es sólo una de las cosas que debéis saber sobre data mining. La otra -mucho más importante y crucial- la explicaré en el próximo artículo.