CUBOS OLAP

¿QUE ES UN CUBO OLAP?

OLAP significa, procesamiento analítico en línea (On-Line Analytical Processing), que es una manera de organizar los datos contenidos en una base de datos para que se ajusten al modo que tienen los usuarios de analizarlos: en categorías jerárquicas y en valores de resumen previamente calculados.
Un cubo OLAP proporciona sólo los resultados resumidos de los informes, en vez de una gran cantidad de registros individuales, para que sea posible analizar muchos datos que, de otra forma, no podrían manejar los recursos del sistema.
Cuando se crea un cubo OLAP a partir de los datos de una base de datos relacional, se llevan a cabo los pasos iniciales de la creación de informes que necesiten los usuarios.

CONCEPTOS BÁSICOS RELACIONADOS CON LOS CUBOS OLAP

Campos de datos y dimensiones.

Una consulta OLAP permite elegir una serie de datos plana, aplicar una organización jerárquica a los campos y definir los valores de resumen que desee calcular.
El cubo resultante contiene dos tipos de datos: valores resumidos y sus hechos descriptivos. Los valores que se van a resumir, como el número de elementos vendidos, se denominan campos de datos. Los hechos descriptivos, como la fecha y la ubicación de cada venta, se organizan por niveles de detalle denominados dimensiones.
Para organizar los campos se puede utilizar el mismo tipo de categorías que los usuarios emplean para analizar los datos de los informes. Los campos de datos y las dimensiones facilitan el proceso de mostrar resúmenes de alto nivel en los informes, como el total de ventas de un país o de una región, y también muestran los detalles de bajo nivel, como los lugares en los que las ventas son especialmente altas o bajas.
En el diseño de un cubo debemos especificar el origen de datos más eficazmente.
Todos los campos de un cubo deben ser campos de datos o dimensiones y cada uno de los campos de datos debe designarse como uno de los dos tipos. Para que una consulta o una selección se ejecute más eficazmente y que los informes que se realicen a partir de ella se actualicen más rápidamente, debe incluir en el cubo sólo los campos que vaya a utilizar. Antes de continuar con este asistente, es posible que desee comprobar si la consulta o la selección de los datos de origen incluye todos los datos deseados y únicamente esos datos.

VISUALIZACION DE LOS DATOS EN CUBO OLAP

Los datos se almacenan en una estructura de cubo (es como si estuviera totalmente indexado) y la velocidad de acceso se hace mucho mas eficiente.
En este caso, la primera consulta nos muestra los puntos que han acumulado los titulares de la tarjeta clásica, en todos los tipos de cabinas y en todos los meses. Mientras, que en la segunda filtramos el cubo para los que volaron en turista. Este tipo de consultas devuelve los datos de forma instantánea.

EJEMPLO CUBO OLAP EN LA EMPRESA


Un analista financiero podría querer ver los datos de diversas formas, por ejemplo, visualizándolos en función de todas las ciudades (que podrían figurar en el eje de abscisas) y todos los productos (en el eje de ordenadas), y esto podría ser para un período determinado, para la versión y el tipo de gastos.


Después de haber visto los datos de esta forma particular el analista podría entonces querer ver los datos de otra manera y poder hacerlo de forma inmediata. El cubo podría adoptar una nueva orientación para que los datos aparezcan ahora en función de los períodos y el tipo de coste.

Debido a que esta reorientación implica resumir una cantidad muy grande de datos, esta nueva vista de los datos se debe generar de manera eficiente para no malgastar el tiempo del analista, es decir, en cuestión de segundos, en lugar de las horas que serían necesarias en una base de datos relacional convencional.

MODELO DE DATOS


MOLAP: usa unas bases de datos multidimensionales para proporcionar el análisis, su principal premisa es que los datos se encuentran almacenados en una estructura de datos multidimensionales para ser visualizada en varias dimensiones de análisis. El sistema MOLAP utiliza una arquitectura de dos niveles: la bases de datos multidimensionales y el motor analítico. La base de datos multidimensional es la encargada del manejo, acceso y obtención del dato.

ROLAP: La arquitectura ROLAP, accede a los datos almacenados en una data Warehouse para proporcionar los análisis OLAP. La premisa es que los datos se encuentran almacenados en bases de datos relacionales. El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona la funcionalidad analítica. El nivel de base de datos usa bases de datos relacionales para el manejo, acceso y obtención del dato. El nivel de aplicación es el motor que ejecuta las consultas multidimensionales de los usuarios. El motor ROLAP se integra con niveles de presentación, a través de los cuáles los usuarios realizan los análisis OLAP. Después de que el modelo de datos para el data Warehouse se ha definido, los datos se cargan desde el sistema operacional. Se ejecutan rutinas de bases de datos para agregar el dato, si así es requerido por los modelos de datos. Se crean entonces los índices para optimizar los tiempos de acceso a las consultas. Los usuarios finales ejecutan sus análisis multidimensionales, a través del motor

ROLAP, que transforma dinámicamente sus consultas a consultas SQL. Se ejecutan estas consultas en las bases de datos relacionales, y sus resultados se relacionan mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los usuarios.

HOLAP: Un desarrollo un poco más reciente ha sido la solución OLAP híbrida (HOLAP), la cual combina las dos arquitecturas anteriores para brindar una solución con las mejores características de ambas: desempeño superior y gran escalabilidad. Un tipo de HOLAP, lo que hace es mantener los registros de detalle (los volúmenes más grandes) en la base de datos relacional, mientras que los datos agregados se almacenan en una base de datos multidimensional separada.