Business Intelligence fácil
Business Intelligence
martes, 01 de marzo de 2011

Cuadrante mágico de Gartner para sistemas Data Warehouse (Enero 2011)

Hace unos días hablaba del cuadrante mágico de Gartner para plataformas Business Intelligence. Casi al mismo tiempo, los analistas de Gartner publicaban también su estudio sobre las soluciones de datawarehousing disponibles. Este es el famoso cuadrante:

Figure 1.Magic Quadrant for Data Warehouse Database Management Systems

Las bases de datos en general, y las dedicadas a sistemas DWH en particular, son un software crucial en todas las empresas, se trata de un mercado súper desarrollado, todas las soluciones son estables, súper eficientes, y gestionan cantidades enormes de información. Aún hoy siguen invirtiendo muchísimo dinero en seguir optimizando y potenciando todas estas soluciones. Como anécdota, diré que jamás he encontrado un bug relevante en ninguna de las soluciones con las que he trabajado (y en cambio es habitual encontrar problemas serios trabajando con las plataformas BI, por ejemplo). ¿Qué quiero decir? Que salvo que trabajes en WalMart o en General Motors, cualquiera de estos sistemas puede ser adecuado para tu empresa (con un correcto dimensionado y, sobre todo, ¡¡¡con un buen modelo de datos!!!).

Sobre el informe de Gartner, destaca- una vez más- el dominio de Teradata sobre todos los demás, aunque Oracle e IBM se mantienen fuertes justo detrás. Esta vez, Microsoft ya no aparece en el cuadrante de los líderes, aunque es justo reconocer que en este estudio no han considerado la solución MPP de Microsoft (SQL Server 2008 R2 Parallel Data Warehouse, PDW) debido al retraso en su lanzamiento (el reléase oficial fue en Noviembre del 2010, como los atentos lectores de BI fácil saben).

También es interesante observar que:

  • Fabricantes pequeños están haciéndose un hueco en este mercado super-maduro y competitivo.
  • Las soluciones appliance (combinación preconfigurada de software y hardware) ganan aceptación .
  • Las bases de datos basadas en columnas también obtienen un buen resultado y un hueco en el cuadrante.
  • Cada vez los requerimientos de volumetría son mayores, y se sigue innovando para mejorar rendimiento, escalabilidad... y aprovechando las nuevas características hardware (SSD).
  • Como curiosidad, aún aparecen los nombres de Netezza y Sybase... ya veremos si en el 2012 sólo aparecen las compañías que las compraron (IBM y SAP, respectivamente).

Por supuesto, realizar un estudio comparativo entre plataformas DWH es sumamente complicado (y caro). La experiencia propia de cada uno, o cualquier comparativa que puedas hacer en un servidor de tu empresa es irrelevante, por lo que carezco de criterio para decir si estos resultados me parecen bien o mal. Me fio de Gartner (igual que no me fiaría de IDC). Aquí os dejo el estudio:

Sin embargo, al leer este estudio tengo la impresión que han valorado las características técnicas (rendimiento, escalabilidad, volumetría,...) de cada solución, pero que han ignorado otros aspectos que facilitan la implantación del DWH, y que también son importantes. Me estoy refiriendo a la usabilidad del ecosistema de aplicaciones que acompaña cada plataforma DWH...

Por ejemplo, ayer instalé Oracle Database 10g Express Edition para Windows, y el asistente de instalación seguía los estándares propios de los años 90 (pantalla gris, iconos de 16 bits, asistente confuso...), y las herramientas web de administración son patéticas (al menos visualmente). Estoy seguro que ese asistente lo habremos utilizado cientos de miles de usuarios, y cada uno de ellos termina con este triste diálogo...

¿Qué me estás preguntando?

No es un caso único. Las herramientas de Teradata (líder indiscutible) son todavía peores (BTEQ, Queryman... arghhh), propias de principios de los 80...

La verdad es que me cuesta de entender estos defectos de usabilidad (que –en definitiva- acaban suponiendo un coste en la productividad). Supongo que confían mucho en las características propias e inigualables de sus gestores de datos... pero, la verdad, ya se podrían plantear renovar el interfaz de usuario...

Si no lo digo, reviento.

lunes, 07 de marzo de 2011

La injustificada e injustificable limitación a 110 km/h

Hoy a las 6:00 ha entrado en vigor la limitación general de velocidad a 110km/h

Hoy a las 6:00 ha entrado en vigor la limitación de velocidad a 110 kilómetros por hora en todas las autovías y autopistas de España. A esa velocidad, dicen, los coches consumen un 15% menos de gasolina, y eso puede suponer un ahorro del 4% en el consumo de petróleo...

Ni a Rubalcaba ni al ministro Sebastián se les supone un especial conocimiento sobre el consumo de gasolina de los vehículos. Para eso tienen expertos, comisiones y departamentos enteros que deben (o deberían) informar y asesorar adecuadamente...

Lamentablemente, no han justificado esos datos, ni han dicho de donde los han sacado, ni cual es la manera de interpretarlos correctamente. Luego se quejarán de que no han sabido explicar sus acciones de gobierno...

Esos datos son falsos e insostenibles. Yo no tengo esos asesores de los que ellos disponen, pero tengo a Google. Me han bastado 60 minutos de “investigación” para darme cuenta que esos números que están haciendo público no hay por dónde cogerlos.

Por muchas razones:

  • El consumo de gasolina no es solo de los coches que van por autopista o autovías a velocidad constante. Hay un porcentaje muy alto de coches que circulan por comarcales, por entradas de ciudades y por ciudades. Además la limitación no afecta a los camiones y autocares.
  • El consumo de gasolina en automoción sólo representa el 8% del consumo de productos petrolíferos (según datos del propio ministerio).
  • Tampoco es cierto que a 110 km/h se consuma un 15% menos. Es falso. Y ningún estudio –teórico o empírico- puede afirmarlo.

¿Y cuál es el ahorro que supone conducir a 110 frente a 120? Según los estudios más optimistas, un 5%. No lo digo yo, lo dice el departamento de Energia del gobierno americano. Por supuesto, datos similares se pueden encontrar en la Wikipedia, y en otros sesudos estudios. Teniendo en cuenta los factores anteriormente enumerados, ese 5% representa menos del 0,16% del consumo total de petróleo (0,05*0,4*0,08, y soy generoso con todas las estimaciones). ¡¡El 0,16%!! (¿El 0,2% o 0,3% incluyendo los diésel?)

Sí que es cierto que el menor consumo se produce alrededor de 80km/h. A mayor velocidad, más consumo. Pero ni las cifran que dan son ciertas, ni es el único factor que influye. Afecta mucho, por ejemplo, el tipo de conducción (a más aceleraciones y desaceleraciones, más consumo). Por ejemplo, en las rondas de Barcelona la gente va frenando para evitar los radares, y en las entradas y salidas de Barcelona, la gente también frenaba para intentar cumplir los estúpidos límites de velocidad (80km/h en autopistas semivacías de 3 o 4 carriles). ¿Y eso supone un ahorro de combustible o un descenso significativo de la polución? (Un inciso: Para justificar los buenos resultados de la medida de los 80km/h, encargaron un estudio a unos señores con bata blanca que no se molestaron en salir de su sótano para tomar ninguna medición real de la contaminación...en su día les solicité más información sobre la nota de prensa, y no obtuve respuesta).

Antes de tomar esta decisión por nosotros (al final, somos nosotros los que pagamos la mucha o poca gasolina que consumimos), hubiese sido un detalle hacer una prueba empírica: Medir el consumo de 100 coches al realizar 1.000 Km a 120Km/h y a 110 km/h. No parece un estudio ni muy complejo ni muy caro (y menos teniendo en cuenta que el Plan de Ahorro Energético cuenta con 2.300 millones de euros aportados por las Administraciones públicas). ¿Se ha hecho ese estudio con coches reales, conductores reales y carreteras reales?

¿Y por qué cuento esto en un blog de Business Intelligence?

  • Para insistir en la importancia de tomar decisiones basadas en datos reales y contrastados, y no en meras creencias, intuiciones, o suposiciones sin fundamento.
  • Para recordar la importancia de fijar objetivos y medir resultados. Ya se han aprobado paquetes similares en otros momentos, cuya aplicación, eficiencia e impacto desconocemos porque no se ha hecho una evaluación de los mismos (o no se ha comunicado). De aquí 3 o 4 semanas, podrían presentar datos reales del consumo de combustible antes y después de la medida. No lo harán.
  • Y para pedir a gritos que nuestros gobernantes se tomen en serio la APERTURA DE DATOS PÚBLICOS. Debería ser trivial consultar todos estos datos, o la recaudación en concepto de multas, o los estudios que encargan (y que pagamos todos) para legislar del modo en que lo hacen... (¡¡¿¿En qué se han basado para tomar esta medida??!! ¿Quién, cómo y cuándo les ha asesorado? ¡¡Datos, datos, datos!!)

Más información:

Los trenes del AVE suelen ir medio vacios (o vacios completamente) debido a los elevados precios. Reduciendo precios, los vuelos Madrid-Barcelona deberían  desaparecer completamente. Eso sí que sería ahorro energético.

Otros blogs:

ACTUALIZACIÓN: He buscado y encontrado el origen de los datos que mencionaba Nacho en el último link. Son datos del Ministerio. Y no tienen desperdicio.

martes, 08 de marzo de 2011

Según los cálculos del Ministerio, cada vehículo recorre 226 km diariamente

Ayer hablaba de la medida que limita la velocidad en las autopistas y autovías de España a 110Km/h. Decía que lo de los #110 se trataba de una limitación “injustificada”. Sin embargo, en el blog de Ignacio Escolar (del diario “Público”) se mencionaban unas cifras para intentar justificar los beneficios económicos de la medida, y esto me sirvió como punto de partida para encontrar las estimaciones que buscaba. Y las he encontrado. Los datos están recogidos en la página 6 de la Memoria Económica del Plan de Ahorro Energético aprobado por el Ministerio.

Los cálculos son estos:

Resumen de los cálculos incluidos en la memoria económica del Plan de Ahorro Energético (limitación de velocidad a 110 km/h)

Desconozco en que estadísticas se han basado para obtener esas extrañas hipótesis de consumo, y tampoco entiendo todos los cálculos intermedios que realizan. No sé qué es la “Movilidad por cada 100 kms”, ni entiendo las multiplicaciones que han hecho. Mi calculadora da unos resultados diferentes, por lo que agradeceré que probéis de hacer vosotros los cálculos, y me indiquéis qué y cómo están multiplicando...

Sí que entiendo el resultado, y se trata de un resultado absolutamente inverosímil. Se mire como se mire.

Según esta Memoria del Ministerio, la medida de los #110 supondrá un ahorro de 14.876 millones de litros de combustible al año... Catorce mil millones son muchos millones. Para ahorrar esa cantidad, cada uno de los turismos de España debería realizar diariamente más de 226 km en autopistas de peajes y otras vías de alta velocidad. ¡¡226 kilómetros diarios!! ¡¡De media!!

Para obtener este resultado, sólo hay que aplicar varias reglas de tres:

  • Cada año se ahorrarán 14.876.379.070 litros
  • Como cada año tiene 365 días, lo anterior equivale a 40.757.203 litros ahorrados cada día
  • Como en España hay unos 25 millones de turismos, lo anterior equivale a un ahorro de 1,63 litros diarios por cada turismo
  • Como se ahorran 0,72 litros cada 100 km (según las hipótesis del propio estudio), cada vehículo recorrerá 226 kilómetros cada día.

En este cálculo, sólo han considerado la circulación en tramos de autovías y autopistas donde se puede circular a 120 110 kilómetros por hora... por lo que faltaría añadir varios centenares de kilómetros adicionales... cada día... para cada coche...

Por si alguno aún no se ha dado cuenta, es absolutamente imposible e inverosímil que, de media, cada coche realice 226 km cada día... (¡82.000 kilómetros anuales por vehículo! – y sólo en autopistas...).

Además, como yo teletrabajo, hay algún pobre desgraciado que debe hacer 500 kilómetros diarios...(Por cierto, ¿Por qué no se potencia el teletrabajo para mejorar la balanza comercial? Podéis quedaros con la idea, no pido nada a cambio...).

La moraleja es clara: Para validar unos datos, transfórmalos a unas unidades de medida que te sean familiares. Si el resultado es una burrada, no se lo entregues a tu jefe (... especialmente si es Ministro).

Como profesional del Business Intelligence, aprovecho la ocasión para recomendar cuadros de mandos y herramientas analíticas a todos aquellos que tienen que tomar decisiones importantes a partir de la información. Incluso existen opciones que favorecen la balanza comercial :-)

ACTUALIZACIÓN: En el siguiente artículo, he hecho el cálculo correcto del ahorro de combustible, creo.

jueves, 10 de marzo de 2011

La nueva limitación de velocidad solo ahorrará el 0,21% del petróleo consumido (según los datos del Ministerio)

Ayer comentaba que la estimación del ahorro del Ministerio tenía necesariamente algún error (los resultados obtenidos eran imposibles e inverosímiles). En los comentarios de Menéame varias personas trataron de localizar el error de cálculo. El problema principal era el término “Movilidad por cada 100 kms”, que resultaba extraño y desconocido.

el cálculo se basan en un término que no definen y que llaman 'movilidad cada 100 km', medido en unidades de vehículos por año.

Finalmente, alguien dio con la clave: La “movilidad” debe ser la longitud total recorrida en el conjunto de autovías y autopistas (la unidad correcta es vehículos-km). Efectivamente, el número de coches que circula por las autovías y autopistas españolas no es un dato a imaginar: está medido a través de contadores (esos cables negros que muchas veces cruzamos por carretera). Este dato aparece en la página 228 del “Anuario Estadístico” del Ministerio de Fomento:

Longitud total recorrida en el conjunto de las redes de carreteras por tipo de vía.

Los datos marcados en rojo son del año 2009, y se parecen a los que incluyeron los técnicos en los cálculos del “Plan de Ahorro Energético” (probablemente, eran datos del 2010).

En cualquier caso, como ya tenemos la longitud total recorrida en autopistas y autovías, y tenemos la estimación de ahorro por kilómetro, podemos calcular fácilmente los beneficios de la medida (siguiendo exclusivamente datos e hipótesis del Ministerio). Según las estimaciones del Ministerio, se ahorrarán 144 Ktep anualmente, que equivale al 0,21% del total de consumo de petróleo. (en los medios se dice que el ahorro será del 3%... ¡Ups!)

Los cálculos son muy sencillos:

  • Cada año se recorren 24.915 millones de kilómetros en autopistas de peaje (he tomado los datos del 2009, por ser los datos oficiales más recientes).
  • Cada año se recorren 104.597 millones de kilómetros en autovías.
  • Sumando lo anterior tenemos que se recorren 129.512 millones de kilómetros.
  • Manteniendo la estimación del ministerio de que solo el 20% de los vehículos se ven afectados por la reducción del límite de la medida (el resto son camiones, atascos, o tramos con otros límites de velocidad inferiores), tenemos que se ahorrará combustible en 25.902 millones de kilómetros.
  • Como se ahorran 0,72 litros cada 100 km (según las hipótesis del propio estudio), ahorraremos 186 millones de litros.
  • Como la densidad energética de la gasolina es 1.290 l/tep, ahorraremos 144 Ktep.
  • El consumo anual de petróleo del 2010 fue de 67.103 Ktep, por lo que el ahorro equivale solo al 0,21%.

De hecho, creo que este es exactamente el cálculo que se quería hacer, aunque se encadenaron dos errores... La malinterpretación de la “movilidad cada 100 kms” (¡Los “kms de vía” es una dato innecesario!), y la conversión de litros de combustible a ktep, que también es incorrecta:

Cada paso del cálculo incluía un error de concepto o un error de cálculo. En este caso, hasta la conversión final es incorrecta.

Por cierto, la ponderación del ahorro en gasolina y en gasóleo también era errónea (los coches diésel afectados por la medida no representan el 80%), y es excesivamente voluntarioso suponer que a 110 km/h se reduce el consumo un 11%, pero eso ya es otro tema...

Todos los datos empleados en el cálculo son públicos:

A pesar de este artículo, quiero dejar claro que las iniciativas de reducir el consumo energético me parecen necesarias y positivas, por supuesto. Y, en este sentido, este paquete de medidas ha ayudado a concienciar del problema y a dar a conocer cosas como la “conducción eficiente” o el peligro que supone la subida de los precios del petróleo sobre la balanza comercial. Sin embargo, pienso que la medida de los 110km/h es absolutamente ridícula, e ineficaz, y no puedo entender cómo la han aprobado con esta precipitación y esta urgencia (...aquí en Barcelona al menos nos avisaron con unos meses de lo de los 80km/h...aunque también tuvimos que tragar).

PD: A mis lectores habituales os pido perdón por los artículos de esta semana....Una vida “cuadrando” datos debe tener consecuencias necesariamente.