Business Intelligence fácil
Business Intelligence
miércoles, 05 de octubre de 2011

Modelos de construcción de Data Warehouses (de vueltas con ROLAP, MOLAP, MOLAP, ROLAP)

Últimamente, en este mismo blog, hemos tenido discusiones sobre si es mejor el modelo MOLAP o el modelo ROLAP. Sabéis que soy un firme defensor del modelo ROLAP, aunque no se me caen los anillos por recomendar MOLAP (y especialmente el MOLAP de Microsoft) en muchas circunstancias.

Pues bien, acabo de leer un artículo de José María Arce, un referente en esto del BI en España, que habla de esto y con el que me he sentido muy identificado. El artículo merece una lectura íntegra –aquí lo tenéis-, aunque me permito entresacar algunos fragmentos:

Volúmenes y capacidades. Posiblemente el éxito de los modelos ROLAP viene especialmente por esta capacidad. Son los únicos que pueden enfrentarse a volúmenes de Gb e incluso Teras de información, algo simplemente imposible en el mundo MOLAP. Lo cual lógicamente hace que sus respuestas no ofrezcan unos tiempos óptimos, pero en otras soluciones simplemente no se puede hacer. La arquitectura ROLAP es la clara vencedora por capacidad y flexibilidad. Dejando el mundo MOLAP a soluciones o necesidades muy controladas, pequeñas, departamentales o, hablando en cristiano, de “andar por casa”.

Este otro fragmento también me resulta muy revelador:

La única alternativa eficaz, flexible y que siempre nos permitirá una crecimiento acorde a nuestras necesidades, (...), es montar el datawarehouse bajo arquitectura ROLAP, como se ilustra en la figura 1.

Bajo esta figura podemos ofrecer lo mejor de los dos mundos. Dado la limitación física de los MOLAP, dejemos los cimientos del BI bajo ROLAP, y diseñemos estructuras MOLAP para accesos controlados, rápidos y eficaces a los departamentos o necesidades específicas.

Arquitectura ROLAP para datawarehouses.

Es decir, José María recomienda construir los cimientos del Business Intelligence de la organización utilizando un datawarehouse relacional y, luego, si es necesario, construye los datamarts, o los cubos, que sean necesarios.

También comenta muchas otras cosas interesantes, por ejemplo:

  • Menciona que la sofisticación de las herramientas BI ha potenciado la aparición de profesionales BI más técnicos y con menos visión de negocio. Y es verdad.
  • También me resulta interesante la crítica que hace a los modelos en estrella (y que es extrapolable a los “cubitos” y “nubes” varias)... que son muy sencillitos y muy monos, pero que se quedan cortos para cubrir las necesidades reales de las empresas.
  • O cuando dice que las necesidades de los usuarios finales no están alineadas con las estrategias comerciales de algunos fabricantes, como los que venden la idea de construir DW en 10 minutos, o los que ofrecen vitales análisis en iPad que funcionan por los pelos.

El artículo se encuentra en el último número de la revista Novática que incluye un monográfico sobre Business Intelligence (espero encontrar tiempo para leer el resto de artículos, y para comentar los más relevante aquí).

Por cierto, entre las referencias útiles sobre Business Intelligence que incluye este número de Novática está el blog “Business Intelligence fácil” que estás leyendo. ¡Gracias Jorge!

El blog "Business Intelligence fácil" está considerado como una de las principales referencias útiles sobre Business Intelligence

Más información

jueves, 06 de octubre de 2011

Los metadatos de las distintas soluciones BI

En este artículo comentaré, a grandes rasgos, como son los metadatos (o modelo semántico) de las distintas herramientas Business Intelligence. Si estás leyendo esto, doy por supuesto que conoces qué son los metadatos, y por qué es una pieza fundamental de cualquier solución BI.

Me centraré solo en los proveedores ROLAP, ya que por alguna razón que se me escapa los proveedores MOLAP (y similares) creen no necesitar una capa semántica. Para ellos, la propia estructura del cubo es su semántica... Y no son los únicos que prescinden: Los productos de “reporting corporativo” y los de “cuadros de mando” tampoco suelen tener una verdadera metadata.

Me centraré en los tres productos históricos, que obviamente son una buena muestra de lo que hay: Business Objects, Microstrategy, y Cognos.

SAP Business Objects

Los metadatos de BO se llaman universos, y en el ejemplo más sencillo posible tienen este aspecto:

Pantallazo del histórico diseñador de universos de SAP Business Objects.

BO tiene, tal vez, la capa semántica más conocida. Se trata de un modelo amplísimamente utilizado, y tremendamente sencillo y útil. Básicamente, para crear un universo se tiene que informar al sistema de la relación entre las tablas, y definir las dimensiones y objetos que verá el usuario. La relación entre las tablas se establece gráficamente utilizando un diagrama de tablas. Y las dimensiones e indicadores se definen a través de los campos o cálculos SQL necesarios...

Con eso y un poco más (contextos, aggregate awares, incompatibilidades....), Business Objects ya tiene suficiente para traducir las consultas de los usuarios en queries SQL.

Debo decir que es el modelo que más conozco, y también el que más me gusta. Es genial.

Dicho esto, digo también que los universos de BO apenas han cambiado en los últimos 20 años. Lo que era un buen interfaz de usuario hace 15 años, ahora resulta antiguo y vulgar. Y arrastran las mismas deficiencias de entonces. La imagen de arriba es el universo más sencillo del mundo, y nada tiene que ver con los universos que se ven en estos mundos de Dios. Un universo típico de BO es un galimatías intratable de tablas y flechas, y supone un freno al avance de los proyectos. Los técnicos tienen miedo a tocarlo, desconocen las implicaciones de cada cambio, y desconocen si existen tablas, relaciones o contextos enteros obsoletos...

Microstrategy

Después de las históricas demandas entre Microstrategy y BO, la metadata de los proyectos de Microstrategy tienen este aspecto:

Pantallazo del Architect de Microstrategy Business Intelligence para definir su capa semántica.

En mi opinión, el proceso de creación de la metadata resulta menos intuitivo que en el caso de BO. De manera manual, y con pocos asistentes gráficos, se informa al sistema de cuáles son las tablas de hechos, que indicadores y atributos tienen, y cuáles son las tablas de lookup... De este modo, se van importando el resto de tablas al sistema...

Muchos creen que esfuerzo para mantener el sistema es relativamente pequeño, y que resulta más sencillo que en el caso de BO. A mí me parece de un farragosismo similar.

IBM Cognos

La mejor representación gráfica que he encontrado del Framework Manager de IBM Cognos es ésta:

Una pizarra es la mejor manera que ofrece Cognos para mostrar la relación entre las tablas.

Porque, de hecho, el asistente de Cognos para la generación de su metamodelo no incluye una representación gráfica como tal. En su lugar, tenemos un montón de formularios (con muchas pestañas y muchas opciones, eso sí, es potentísimo)

Imagen del Framework Manager de Cognos

Las tablas que aparecen a la izquierda de la pantalla superior están relacionadas entre sí, claro. Pero no sabes qué tablas ni cómo. Para averiguarlo, tienes que buscar entre un listado de relaciones... Es un sistema muy propenso a errores, y muy difícil de mantener.

Puede que haya salido una nueva versión que resuelva estas deficiencias evidentes. Aunque no me consta. ¿Lo sabes tú?

ACTUALIZACIÓN: Tal y como me confirman en los comentarios –gracias,gracias- IBM Cognos sí que incluye una representación gráfica de los modelos. He escrito un artículo hablando del IBM Cognos Framework Manager, y aclarando la confusión. Os dejo aquí un pantallazo del diagrama de Cognos:

Diagrama de tablas del IBM Cognos 10 Framework Manager

Otros proveedores

Otros proveedores (Oracle y Microsoft, fundamentalmete) también tienen su capa semántica. Y poco a poco van mejorando también en este aspecto.

Sin embargo, en mi opinión, adolecen de los mismos problemas descritos arriba. Parece que los grandes proveedores hacen grandes esfuerzos en facilitar la vida al usuario final, con unas soluciones de BI cada vez más potentes y usables, pero se olvidan de los técnicos. Parece que da igual que las herramientas de los técnicos no sean todo lo productivas que podrían ser.

Bingo Intelligence

Si has visto el vídeo sobre cómo construir un catálogo que publiqué haces unos días y que se encuentra debajo de estas líneas, tal vez pienses que se parece bastante al modelo semántico de Business Objects. Sin duda, es más parecido a BO que a otros.

Sin embargo existen diferencias claves que lo hacen muy distinto, e incluso se asemeja más a Cognos o Microstrategy en muchos aspectos...

En Bingo Intelligence hemos hecho un esfuerzo para que la herramienta sea sencilla y fácil de usar, tanto para el usuario final como para el técnico. Si comparas los catálogos de Bingo con los de BO verás que nosotros no tenemos contextos, ni aggregate awares, ni incompatibilidades... y la generación de los SQL de uno y otro no tienen nada que ver. Por no tener, en Bingo Intelligence prescindimos incluso del diagrama de tablas que tanto caracteriza a BO.

Sí, a pesar de lo que acabas de ver en el vídeo: puedes prescindir del diagrama de tablas, si quieres. Y consideramos que eso es una “feature” interesantísima. Para tener un diagrama como el de BO, mejor no tenerlo...

Mañana os explico cómo lo hace Bingo Intelligence. El administrador de tablas y relaciones que se menciona al final de este vídeo es la clave.

Por cierto, ¿Os acordáis que este mes de octubre es la presentación de Bingo Intelligence 2012? ¡Estad atentos!

viernes, 07 de octubre de 2011

Facilitando la vida al equipo técnico

Como comentaba en el artículo de ayer las herramientas para preparar la metadata de los principales fabricantes de Business Intelligence flojean en el tema de la usabilidad. Y prometí que hoy os contaría como lo resuelve Bingo Intelligence.

No hablo solo de que las aplicaciones tradicionales no sean bonitas, o de que tengan una barra de botones más poblada que la M-30 a las 8:00. El problema fundamental es la dificultad de mirar las relaciones existentes entre las tablas. Si no se tiene clara la relación entre todas las tablas, el mantenimiento del sistema siempre será costoso.

Para solucionar este problema Bingo Intelligence ofrece dos funcionalidades que facilitan enormemente el trabajo de los técnicos que deben configurar el sistema (y mantenerlo):

  • En primer lugar, es posible crear varios diagramas dentro de un mismo catálogo. Cada uno en una pestaña independiente. De esta manera, es posible independizar los diagramas de cada tabla de hechos (o de cada jerarquía...).
  • Pero lo verdaderamente innovador es lo que hemos denominado el administrador de tablas y relaciones. Para crear la metadata no necesitamos ver continuamente todos los campos de las tablas, ni ver que todas las relaciones son siempre PK-FK. Ya se sabe. De toda la vida. Lo único verdaderamente importante es saber cuáles son las tablas de hechos, y con qué tablas de dimensión se relacionan.

Se entiende mejor con una imagen. Observar cómo es posible representar jerárquicamente un modelo típico en copo de nieve/estrella:

El administrador de tablas de Bingo Intelligence muestra la relación entre las tablas de manera jerárquica.

Y observad los beneficios que aporta:

  • En el espacio que antes mostrábamos una tabla, ahora mostramos todo el copo de nieve.
  • Mientras antes necesitábamos fijarnos con atención en el sentido de las relaciones para entender el modelo, ahora se entiende nada más ver la jerarquía de tablas.

Para finalizar, os dejo un vídeo donde se muestra la construcción de un catálogo de Bingo utilizando el administrador de tablas. Sin utilizar un puñetero diagrama. Y se trata de un modelo relativamente complejo (4 tablas de hechos, dimensiones compartidas, tablas agregadas,...).

El vídeo dura 5 minutos. Si te interesa, busca un momento para verlo tranquilamente.

¿Qué te ha parecido?

sábado, 08 de octubre de 2011

Sábado de película

Esta semana os he hablado del modelo semántico de Bingo Intelligence:

Los artículos incluían un par de vídeos que muestran las características principales de los catálogos de Bingo. Aquí os dejo este contenido por si no habéis tenido ocasión de verlo durante la semana.

Cómo construir un catálogo (10 minutos)

El administrador de tablas y relaciones (5 minutos)

miércoles, 26 de octubre de 2011

Faltan 5 días para Bingo Intelligence 2012

Ya es oficial.

Según acabo de leer en el BLOG DE BINGO INTELLIGENCE el lanzamiento de Bingo Intelligence 2012 será el próximo 31 de octubre. ¡El próximo lunes!

Por primera vez, la versión de evaluación de este software de Business Intelligence estará disponible para que cualquier persona pueda descargársela y conocerla de primera mano.

Además, hemos preparado un vídeo para la ocasión. Espero que os guste:

Por cierto, si quieres estar informado de todas las novedades sobre Bingo Intelligence, suscríbete a su nuevo blog por correo electrónico o por RSS.