El “Parallel Data Warehouse” de Microsoft Business Intelligence

Productos
miércoles, 10 de noviembre de 2010

La Appliance de Microsoft Business Intelligence

Hace más de un año anunciábamos que la integración de DATAllegro con SQL Server estaba cercana, y hace 6 meses decíamos que este lanzamiento del “Parallel Datawarehouse” se retrasaba, y no concretaban una fecha para su lanzamiento.

Pues bien, Microsoft ya ha anunciado la disponibilidad de este interesante producto. Forma parte de la familia de productos de SQL Server y, formalmente, se llama “Microsoft SQL Server 2008 R2 Parallel Data Warehouse” (y lo abrevian como PDW).

Se trata de una “Appliance”, es decir, se distribuye junto con un Hardware específico previamente configurado, y ofrece una alta escalabilidad (hasta cientos de Terabytes) para las necesidades de Business Intelligence y datawarehousing de gama alta.

Técnicamente, se caracteriza por una arquitectura MPP (procesamiento masivamente paralelo), y por una infraestructura “shared nothing”. Es decir, los N nodos que forman el Datawarehouse no comparte ni memoria, ni capacidad de proceso, ni nada entre sí. En teoría esto permite doblar el rendimiento del sistema doblando el número de servidores. Este aumento lineal del rendimiento (tan deseable) no es posible conseguirlo con otro tipo de arquitectura (y me estoy acordando de las promesas del Oracle RAC...).

El rival a batir es Teradata, que ofrece una combinación hardaware/software similar desde hace más de 20 años, y lidera el segmento de las bases de datos DWH para entornos Business Intelligence...

La solución equivalente de Oracle es Oracle Exadata Database Machine. Aunque mientras Teradata y el Microsoft PDW están diseñados específicamente para sistemas analíticos, Oracle asegura que Exadata es adecuado también para sistema OLTP. Carezco de información y experiencia para opinar sobre Exadata, pero sinceramente me resulta muy extraño que una misma combinación HW/SW sirva tanto para un sistema OLAP y un sistema OLTP. Las necesidades de uno y otro son muy diferentes, y lo que requiere uno, penaliza al otro... Aunque es sabido que los folletos comerciales nunca entran en estos detalles “intrascendentes”:

  • Extreme performance for data warehouses
  • Extreme performance for OLTP applications

En fin, que está interesante, y los clientes BI tendrán más opciones donde elegir. También es presumible un descenso de los precios (aunque antes Microsoft deberá documentar un número considerable de casos de éxito).

Os dejo a continuación la hoja de producto de las tres alternativas comentadas: