Data Integration: La clave del éxito de cualquier proyecto de BI
Cuando tomamos la decisión de realizar un proyecto de BI, en muchas ocasiones empezamos a pensar en qué indicadores vamos a analizar, es decir qué queremos obtener.
No es mal comienzo, seguramente es lo que deseamos y necesitamos, pero enseguida nos albergarán dudas de cómo obtener y relacionar toda la información necesaria para conseguir esos indicadores. Este es el punto clave para que realmente tengamos un sistema de BI serio y escalable.
Continuamente aparecen y nos ofrecen soluciones de Business Intelligence y Analytics impactantes desde el punto de vista de presentación de KPI’s. Estos sistemas nos muestran cómo subir unos datos en Excel y obtener enseguida gráficos y otros elementos en la pantalla.
La verdad es que es impactante y a simple vista parece sencillo. Sin embargo, todos los profesionales que han estado involucrados en proyectos de este tipo saben que la presentación de los KPIs únicamente es el envoltorio final del proyecto.
A continuación vamos a ver las componentes, de forma resumida, que debemos tener en cuenta si queremos realizar un proyecto de BI escalable y mantenido en el tiempo.

En este artículo queremos describiros, de una manera ágil, los componentes relacionados con el Data Integration; analizando su nivel de importancia.
Comencemos:
DATA SOURCES
Lo primero que tenemos que hacer antes de comenzar con el proceso de Data Integration es recopilar todas las fuentes de datos que nos van a ser necesarias para el cálculo de indicadores e informaciones que queramos mostrar finalmente en los dashboards.
Es importante que las fuentes de datos tengan la mayor granularidad posible, ya que si partimos de fuentes de datos con información ya agregada o calculada, nos limitará en el momento de presentar la información, porque no podremos obtener ciertos detalles o niveles.
ETL (EXTRACT, TRANSFORM AND LOAD)
Este componente es la primera capa crítica para nuestra solución de BI (Data Integration), se encarga de extraer la información de las fuentes de datos, transformarlos a través de reglas y también limpiarlos y cargarlos a la siguiente capa: el Data Warehouse.
Dependiendo de la fuente de datos, estas operaciones serán más o menos complejas, aunque la parte más crítica de esta capa suele ser la transformación de los datos en base a reglas, la limpieza y armonización de estos.
DATA WAREHOUSE
Detallar lo que compone Data Warehouse sería muy extenso, por lo que vamos a describir este componente de forma sencilla sin adentrarnos en muchas de sus características y funcionalidades.
Como su nombre bien indica, este almacén de datos es el lugar donde se van guardando los datos de forma organizada en estructuras de datos empresariales, agrupando los mismos en conjuntos de datos más reducidos (datamarts) de forma agregada y generalmente en estructuras de datos multidimensionales y con jerarquías, esto es lo que conocemos como cubos OLAP; que se inventaron para ofrecer a los analistas un mejor rendimiento en la consultas de datos frente al modelo transaccional normalizado OLTP.
De aquí que sea un modelo muy utilizado tanto para la consulta de datos por parte de las herramientas de generación de dashboards como para la presentación que se utiliza para la toma de decisiones de negocio.
En muchas ocasiones, los sistemas de Data Warehouse incluye también la capa de ETL para extracción, transformación y carga de datos.
MASTER DATA MANAGEMENT
De forma sencilla, se entiende por MDM a las herramientas y metodología dedicadas a gestionar y almacenar datos maestros. Pero, ¿qué son estos datos maestros? Realmente, son las tablas de entidades, base de un modelo de datos, por ejemplo, los datos maestros de producto, que incluirían el código, la descripción del producto y sus propiedades.
Pongamos un ejemplo, en un sistema de BI para efectividad comercial de la industria farmacéutica necesitamos gestionar los datos de la estructura territorial de la red de ventas, que como todo el mundo sabe, esta estructura territorial está en constante cambio y con reorganizaciones constantes.
Si no tenemos capacidad de actualizar rápidamente estos datos maestros estaremos continuamente mostrando análisis que no reflejan la realidad, y por tanto, nuestro sistema de BI no servirá para el fin último que fue construido, que no era otro que la ayuda a la toma de decisiones.
Como hemos podido comprobar durante la descripción de las capas más focalizadas a la integración y tratamiento de datos de un sistema de BI, el trabajo del Data Integration es la parte quizás más tediosa y larga en un proyecto de BI. Tanto al inicio e implementación del sistema como durante toda la vida de este.
Debemos tener siempre presente que un sistema de BI no es estático y cambia constantemente, con el objetivo de reflejar las estrategias de negocio de la compañía.
Por toda la explicación hasta este punto, podemos llegar a la conclusión, que la integración de los datos de una forma bien estructurada, es la clave para que nuestro sistema de BI crezca, sea escalable y se adapte constantemente a las estrategias de negocio y nos sirva como herramienta de toma de decisiones, reflejando los indicadores deseables y correctos.