Incluye el detalle en 3NF en el datawarehouse

Definiciones
viernes, 4 de enero de 2013

Arquitectura básica de cualquier datawarehouse, con sus áreas de staging, modelo normalizado, y modelos multidimensional.

Cada vez es más frecuente incluir en la arquitectura del DWH una “zona” con la información normalizada (prácticamente en tercera forma normal).

En la veterana serie sobre “cómo construir un datawarehouse” ya hablé sobre esto e insistía en la necesidad de tener un modelo relacional con el máximo nivel de detalle y con la información normalizada, limpia e integrada. En los proyectos en los que participamos siempre lo recomendamos y nunca nos hemos arrepentido.

Por el contrario, encontramos numerosos proyectos donde no se contempló este “modelo normalizado” en la arquitectura del Datawarehouse, y la evolución del sistema ha resultado lenta y llena de dificultades. El caso extremo es considerar que el DWH en un motor relacional es opcional y que lo verdaderamente importante es construir un cubo a partir de las fuentes de datos. No me cansaré de insistir en lo erróneo de este planteamiento.

Los modelos en estrella (o los cubos, en el caso extremo) son útiles durante la explotación con Excel o con una herramienta de BI. Sin embargo, un DWH bien diseñado debe ser capaz de responder a las necesidades actuales y futuras de los usuarios, y esta es la piedra en la que siempre tropiezan estos modelos simplificados. Por esta razón, los cubitos se multiplican como setas, y van apareciendo cada vez más informes que requieren su propia estrella para ejecutarse en un tiempo razonable… Cargar y mantener estas estructuras es complicado… salvo que tengas un entorno en 3NF con la información ya limpia, detallada, integrada, y actualizada. Este modelo normalizado será el origen de los cubos y estrellas que convienen a la capa de presentación…

Llegados a este punto, siempre surge la duda… ¿este modelo 3FN debe incluir todo el detalle? ¿todo? Sí. Todo el detalle posible.

Si te apetece, utiliza los comentarios para decirnos si tu datawarehouse incluye un área con la información normalizada, o si crees que es necesario matizar alguna cuestión…

Actualización: Estrenamos diseño en el blog. Si nos lees desde el newsletter o desde algún lector RSS, visita la web de “Business Intelligence fácil” y dinos que te parece el nuevo diseño :-)