viernes, 2 de julio de 2010

Investigación Data Warehouse

Introducción

Con la informatización de la sociedad, y por lo tanto, de las empresas que se encuentran en ella, se ha producido un crecimiento a nivel mundial de la capacidad de generación y almacenamiento de la información. Sin embargo, esta información ya no puede ser analizada por los métodos tradicionales existentes, debido a que mientras mayor es la capacidad para almacenar cada vez más datos, mayor es la incapacidad para extraer información realmente útil de éstos en las empresas. Por ello, mucha información importante, quedaba sepultada y disgregada, a causa de que los sistemas existentes no estaban preparados para el nuevo reto.

Actualmente, existe una gran cantidad de información acerca de la Era de la Información y sus ventajas. Sin embargo, en este fenómeno, lo que constituye un valioso recurso para la mayoría, se ha tornado en un problema para otros: manejar de forma óptima grandes volúmenes de información.

Dentro de la competencia en el nuevo ambiente corporativo, donde, en general, todo está influido por la información, es trascendente saber dónde y cómo se organiza toda la información de interés. Es así como, en este contexto, surgen términos que se convierten en conceptos y filosofías de trabajo, tales como “Data Warehouse”.

Un Data Warehouse o Almacén de Datos, es una colección de datos orientada a un determinado ámbito al interior de una empresa o una organización. Es un sistema integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se dice que representa un expediente completo de una organización, el que va más allá de tan sólo la información transaccional y operacional.

De acuerdo a lo anterior, en el presente trabajo se dará a conocer algunos conceptos relacionados a Data Warehouse, incluyendo ejemplos claros de estas definiciones. Además se buscará un área de negocio donde se pueda aplicar Business Intelligence, desarrollando un Data Warehouse. Posteriormente, se concluirá respecto de los temas tratados en la investigación.

Desarrollo de las Actividades

Business Intelligence

Se denomina inteligencia empresarial o inteligencia de negocios al conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización.

El término inteligencia empresarial se refiere al uso de datos en una empresa para facilitar la toma de decisiones. Abarca la comprensión del funcionamiento actual de la empresa, así como también la anticipación de acontecimientos futuros, con el objetivo de ofrecer conocimientos para respaldar las decisiones empresariales.

Las herramientas de inteligencia se basan en la utilización de un sistema de información de inteligencia que se forma con distintos datos.

Mediante las herramientas y técnicas ELT (extraer, cargar y transformar), o actualmente ETL (extraer, transformar y cargar) se extraen los datos de distintas fuentes, se depuran y preparan (homogeneización de los datos) para luego cargarlos en un almacén de datos.

La vida o el periodo de éxito de un software de inteligencia de negocios dependerá únicamente del nivel de éxito del cual haga en beneficio de la empresa que lo usa, si esta empresa es capaz de incrementar su nivel financiero, administrativo y sus decisiones mejoran el accionar de la empresa, la inteligencia de negocios usada estará presente por mucho tiempo, de lo contrario será sustituido por otro que aporte mejores resultados y más precisos.

Características

Este conjunto de herramientas y metodologías tienen en común las siguientes características:

  • Accesibilidad a la información. Los datos son la fuente principal de este concepto. Lo primero que deben garantizar este tipo de herramientas y técnicas será el acceso de los usuarios a los datos con independencia de la procedencia de estos.
  • Apoyo en la toma de decisiones. Se busca ir más allá en la presentación de la información, de manera que los usuarios tengan acceso a herramientas de análisis que les permitan seleccionar y manipular sólo aquellos datos que les interesen.
  • Orientación al usuario final. Se busca independencia entre los conocimientos técnicos de los usuarios y su capacidad para utilizar estas herramientas.

Niveles de realización de BI

De acuerdo a su nivel de complejidad se pueden clasificar las soluciones de Business Intelligence en:

- Consultas e informes simples (Querys y reports).

- Cubos OLAP (On-Line Analytic Processing).

- Data Mining o minería de datos.

- Sistemas de previsión empresarial; predicción mediante estudio de series temporales.

(http://informationmanagement.wordpress.com/2007/11/19/diseno-de-un-data-warehouse-estrella-y-copo-de-nieve/)

Interfaz Web

Es una conexión física y funcional entre dos sistemas independientes que deben tener una comunicación entre sí, donde la interfaz es el mecanismo o herramienta que hace posible dicha comunicación.

Cuando uno de los sistemas que se comunican es un ser humano pasamos al concepto de interfaz de usuario, la que se utiliza en muchos sistemas que nos rodean y hacen nuestra vida más cómoda y segura. Por un lado tenemos un sistema informático y por otro a una persona que desea interaccionar con él, darle instrucciones concretas, siendo la interfaz de usuario la herramienta que entiende a ambos y es capaz de traducir los mensajes que se intercambian.

Por ejemplo, el sistema de botones de control de un televisor o el mando a distancia que lo controla, los diferentes mecanismos de control de un automóvil o los sistemas de puesta en hora de un reloj.

Inicialmente las interfaces de usuario eran desarrolladas pensando solamente en su correcto funcionamiento, luego se comprobó la necesidad de que fueran fácilmente usables y después se hizo importante la estética en las mismas, destacando el diseño gráfico en las interfaces de usuario, ya que un sistema de este tipo no sólo tiene que funcionar, sino que además debe ser bonito y acorde con las inquietudes estéticas del mundo que nos rodea.

Se crearon interfaces basadas en iconos y menús, accesibles por medio del ratón, surgiendo los entornos de ventanas, como Windows o MAC, que empezaron a utilizar interfaces gráficas de usuario, verdaderas protagonistas del mundo informático actual.

Estamos tan acostumbrados a las interfaces gráficas que se puede afirmar que si desaparecieran la gran mayoría del los usuarios de aplicaciones informáticas quedarían anulados. Tanto es así que sistemas operativos y programas que antes funcionaban casi exclusivamente en modo de comandos han tenido que actualizarse y ofrecer a los usuarios interfaces gráficas equivalentes para no quedarse olvidados por el público general.

Las páginas Web supusieron la aparición de las interfaces Web, interfaces gráficas de usuario con unos elementos comunes de presentación y navegación que se convirtieron rápidamente en estándar. Este tipo de interfaces deben servir de intermediarias entre usuarios poco acostumbrados al uso de aplicaciones informáticas, y sistemas de información y procesos transaccionales, debiendo posibilitar la localización de la información deseada, el entendimiento claro de las funcionalidades ofrecidas, la realización práctica de tareas específicas por parte de los usuarios y la navegación intuitiva por las diferentes páginas del sitio Web.

Buscando una homogeneidad entre los millones de páginas Web que existen actualmente en Internet, el diseño de las mismas ha evolucionado con el tiempo hacia un esquema general perfectamente definido, ofreciendo unas interfaces bien definidas, con un conjunto de componentes gráficos y funcionales similares que hacen posible que sea cual sea el usuario que accede a un sitio Web cualquiera la comunicación entre ellos sea posible y efectiva.

ERP

Es un sistema abierto de gestión de la información estructurado para satisfacer la demanda de soluciones de gestión empresarial, el cual se basa en el ofrecimiento de una solución completa que permite a las empresas evaluar, implementar y gestionar más fácilmente su negocio. Las soluciones ERP se caracterizan por su modularidad, integración de la información, estandarización e interfaces con otras aplicaciones.

Otro aspecto importante a considerar es que las tendencias comerciales actuales y futuras obligan a las empresas a ser cada vez más competitivas, por lo que es necesario que una compañía tenga integrado sus flujos internos de información y sus relaciones comerciales externas para así mejorar la productividad, la calidad, el servicio al cliente y reducir costos.

Disponer de una solución ERP integrada no solo es un beneficio para la compañía, sino que también una garantía de actualización continua y más inmediata de la aplicación a las necesidades del negocio y la reducción de los costos fijos. El máximo beneficio de la implantación de un ERP, la que es muy compleja debido a su profundo impacto en los procesos de la empresa, debido a los distintos cambios de la empresa y el entorno, solamente se obtiene cuando todas las aplicaciones de la compañía están totalmente integradas, incluido sus proyectos de comercio electrónico, y cuando esta integración se realiza en el menor plazo de tiempo posible.

Algunas de las amenazas de un Proyecto ERP es el mal manejo del proyecto, Sub o Sobre estimación de los alcances del ERP, vulnerabilidad al tener datos valiosos con muy fácil acceso, perder flexibilidad para asimilar nuevas olas tecnológicas, interdependencia de las áreas de una empresa y no generar una ventaja competitiva. Por último, una ERP se compone por un determinado número de módulos funcionales, es decir, módulos básicos, opcionales y Verticales, donde se comparte base de datos. Todas las aplicaciones ofrecen una misma interfaz de usuario, ofreciendo alta adaptabilidad a la situación particular de cada empresa que cuente con Group Ware, Internet y comercio electrónico.

Modelos de DW

Star Schema

El Esquema en Estrella consiste en estructurar la información en procesos, vistas y métricas recordando a una estrella (por ello el nombre star schema). Es decir, tendremos una visión multidimensional de un proceso que medimos a través de unas métricas. A nivel de diseño, consiste en una tabla de hechos en el centro para el hecho objeto de análisis y una o varias tablas de dimensión por cada dimensión de análisis que participa de la descripción de ese hecho. En la tabla de hecho encontramos los atributos destinados a medir (cuantificar) el hecho: sus métricas. Mientras, en las tablas de dimensión, los atributos se destinan a elementos de nivel (que representan los distintos niveles de las jerarquías de dimensión) y a atributos de dimensión (encargados de la descripción de estos elementos de nivel). En el esquema en estrella la tabla de hechos es la única tabla del esquema que tiene múltiples joins que la conectan con otras tablas (foreign keys hacia otras tablas). El resto de tablas del esquema (tablas de dimensión) únicamente hacen join con esta tabla de hechos. Las tablas de dimensión se encuentran además totalmente denormalizadas, es decir, toda la información referente a una dimensión se almacena en la misma tabla.

Snowflake Schema

El Esquema en Copo de Nieve es un esquema de representación derivado del esquema en estrella, en el que las tablas de dimensión se normalizan en múltiples tablas. Por esta razón, la tabla de hechos deja de ser la única tabla del esquema que se relaciona con otras tablas, y aparecen nuevas joins gracias a que las dimensiones de análisis se representan ahora en tablas de dimensión normalizadas. En la estructura dimensional normalizada, la tabla que representa el nivel base de la dimensión es la que hace join directamente con la tabla de hechos. La diferencia entre ambos esquemas (star y snowflake) reside entonces en la estructura de las tablas de dimensión. Para conseguir un esquema en copo de nieve se ha de tomar un esquema en estrella y conservar la tabla de hechos, centrándose únicamente en el modelado de las tablas de dimensión, que si bien en el esquema en estrella se encontraban totalmente denormalizadas, ahora se dividen en subtablas tras un proceso de normalización. Es posible distinguir dos tipos de esquemas en copo de nieve, un snowflake completo (en el que todas las tablas de dimensión en el esquema en estrella aparecen ahora normalizadas en el snowflake) o un snowflake parcial (sólo se lleva a cabo la normalización de algunas de ellas).

(http://informationmanagement.wordpress.com/2007/11/19/diseno-de-un-data-warehouse-estrella-y-copo-de-nieve/)

ER (entidad-relación)

400px-Ejemplo_Diagrama_E-R_extendido

Ejemplo de diagrama E-R.

El Modelo Entidad-Relación, también conocido como DER (diagramas entidad-relación) es una herramienta de modelado de un sistema de información, mediante el cual se pretende 'visualizar' los objetos que pertenecen a la Base de Datos como entidades las cuales tienen unos atributos y se vinculan mediante relaciones.

Es una representación conceptual de la información.

El modelado entidad-relación es una técnica para el modelado de datos utilizando diagramas entidad relación. No es la única técnica pero sí la más utilizada.

Brevemente consiste en los siguientes pasos:

  1. Se parte de una descripción textual del problema o sistema de información a automatizar (los requisitos).
  2. Se hace una lista de los sustantivos y verbos que aparecen.
  3. Los sustantivos son posibles entidades o atributos.
  4. Los verbos son posibles relaciones.
  5. Analizando las frases se determina la cardinalidad de las relaciones y otros detalles.
  6. Se elabora el diagrama (o diagramas) entidad-relación.
  7. Se completa el modelo con listas de atributos y una descripción de otras restricciones que no se pueden reflejar en el diagrama.

Base Teórica y Conceptual

El modelo entidad-relación se basa en los conceptos descritos a continuación para representar un modelo de la vida real.

Entidad: Representa una “cosa” u "objeto" del mundo real con existencia independiente, es decir, se diferencia unívocamente de cualquier otro objeto o cosa, incluso siendo del mismo tipo, o una misma entidad.

Una entidad puede ser un objeto con existencia física como: una persona, un animal, una casa, etc. (entidad concreta), o un objeto con existencia conceptual como: un puesto de trabajo, una asignatura de clases, un nombre,etc. (entidad abstracta).

Una entidad está descrita y se representa por sus características o atributos. Por ejemplo, la entidad Persona puede llevar consigo las características: Nombre, Apellido, Género, Estatura, Peso, Fecha de nacimiento, etc.

Conjunto de entidades: es una colección de entidades que comparten los mismos atributos o características.

Atributos: son las propiedades que describen a cada entidad en un conjunto de entidades. Los atributos identificativos son aquellos que permiten diferenciar a una instancia de la entidad de otra distinta. Para cada atributo, existe un dominio del mismo, este hace referencia al tipo de datos que será almacenado o a restricciones en los valores que el atributo puede tomar. Cuando una entidad no tiene un valor para un atributo dado, este toma el valor nulo, bien sea que no se conoce, que no existe o que no se sabe nada al respecto del mismo.

Relación: Describe cierta dependencia entre entidades o permite la asociación de las mismas. Una relación tiene sentido al expresar las entidades que relaciona.

Conjunto de relaciones: Consiste en una colección, o conjunto, de relaciones de la misma naturaleza. La dependencia o asociación entre los conjuntos de entidades es llamada participación. Se llama grado del conjunto de relaciones a la cantidad de conjuntos de entidades participantes en la relación.

Restricciones

Son reglas que deben mantener los datos almacenados en la base de datos.

Correspondencia de cardinalidades: dado un conjunto de relaciones en el que participan dos o más conjuntos de entidades, la correspondencia de cardinalidad indica el número de entidades con las que puede estar relacionada una entidad dada. La correspondencia de cardinalidades puede ser:

- Uno a uno: Una entidad de A se relaciona únicamente con una entidad en B y viceversa.

- Uno a varios: Una entidad en A se relaciona con cero o muchas entidades en B. Pero una entidad en B se relaciona con una única entidad en A.

- Varios a uno: Una entidad en A se relaciona exclusivamente con una entidad en B. Pero una entidad en B se puede relacionar con 0 o muchas entidades en A.

- Varios a varios: Una entidad en A se puede relacionar con 0 o muchas entidades en B y viceversa.

Restricciones de participación: Dado un conjunto de relaciones R en el cual participa un conjunto de entidades A, dicha participación puede ser de dos tipos:

- Total: Cuando cada entidad en A participa en al menos una relación de R.

- Parcial: Cuando al menos una entidad en A NO participa en alguna relación de R.

Claves

Es un subconjunto del conjunto de atributos comunes en una colección de entidades, que permite identificar unívocamente cada una de las entidades pertenecientes a dicha colección. Asimismo, permiten distinguir entre sí las relaciones de un conjunto de relaciones.

Dentro de los conjuntos de entidades existen los siguientes tipos de claves:

Superclave: Es un subconjunto de atributos que permite distinguir unívocamente cada una de las entidades de un conjunto de entidades. Si se añade un atributo al anterior subconjunto, el resultado seguirá siendo una superclave.

Clave candidata: Dada una superclave, si ésta deja de serlo quitando únicamente uno de los atributos que la componen, entonces ésta es una clave candidata.

Clave primaria: Es una clave candidata, elegida por el diseñador de la base de datos, para identificar unívocamente las entidades en un conjunto de entidades.

(es.wikipedia.org/wiki/Modelo_entidad-relación)

UML (Lenguaje Unificado de Modelado)

UML es el lenguaje de modelado de sistemas de software más conocido y utilizado en la actualidad. Es un lenguaje gráfico para visualizar, especificar, construir y documentar un sistema.

UML ofrece un estándar para describir un "plano" del sistema (modelo), incluyendo aspectos conceptuales tales como procesos de negocio y funciones del sistema, y aspectos concretos como expresiones de lenguajes de programación, esquemas de bases de datos y componentes reutilizables.

Es importante resaltar que UML es un "lenguaje de modelado" para especificar o para describir métodos o procesos. Se utiliza para definir un sistema, para detallar los artefactos en el sistema y para documentar y construir. En otras palabras, es el lenguaje en el que está descrito el modelo.

UML no puede compararse con la programación estructurada, pues UML significa Lenguaje Unificado de Modelado, no es programación, sólo se diagrama la realidad de una utilización en un requerimiento. Mientras que, programación estructurada, es una forma de programar como lo es la orientación a objetos, sin embargo, la programación orientada a objetos viene siendo un complemento perfecto de UML, pero no por eso se toma UML sólo para lenguajes orientados a objetos.

UML cuenta con varios tipos de diagramas, los cuales muestran diferentes aspectos de las entidades representadas.

Diagramas

600px-Uml_diagram-es

Jerarquía de los diagramas UML 2.0, mostrados como un diagrama de clases

En UML 2.0 hay 13 tipos diferentes de diagramas. Para comprenderlos de manera concreta, a veces es útil categorizarlos jerárquicamente, como se muestra en la figura.

Los Diagramas de Estructura enfatizan en los elementos que deben existir en el sistema modelado:

- Diagrama de clases

- Diagrama de componentes

- Diagrama de objetos

- Diagrama de estructura compuesta (UML 2.0)

- Diagrama de despliegue

- Diagrama de paquetes

Los Diagramas de Comportamiento enfatizan en lo que debe suceder en el sistema modelado:

- Diagrama de actividades

- Diagrama de casos de uso

- Diagrama de estados

- Diagrama de secuencia

Los Diagramas de Interacción son un subtipo de diagramas de comportamiento, que enfatiza sobre el flujo de control y de datos entre los elementos del sistema modelado:

- Diagrama de secuencia

- Diagrama de comunicación, que es una versión simplificada del Diagrama de colaboración (UML 1.x)

- Diagrama de tiempos (UML 2.0)

- Diagrama global de interacciones o Diagrama de vista de interacción (UML 2.0)

(es.wikipedia.org/.../Lenguaje_Unificado_de_Modelado)

OO (Orientación a Objetos)

Bases de datos orientadas a objetos

Este modelo, bastante reciente, y propio de los modelos informáticos orientados a objetos, trata de almacenar en la base de datos los objetos completos (estado y comportamiento).

Una base de datos orientada a objetos es una base de datos que incorpora todos los conceptos importantes del paradigma de objetos:

· Encapsulación - Propiedad que permite ocultar la información al resto de los objetos, impidiendo así accesos incorrectos o conflictos.

· Herencia - Propiedad a través de la cual los objetos heredan comportamiento dentro de una jerarquía de clases.

· Polimorfismo - Propiedad de una operación mediante la cual puede ser aplicada a distintos tipos de objetos.

Programación orientada a objetos

La programación orientada a objetos es un paradigma de programación que usa objetos y sus interacciones, para diseñar aplicaciones y programas de ordenador. Está basado en varias técnicas, incluyendo herencia, abstracción, polimorfismo y encapsulamiento. En la actualidad, existe variedad de lenguajes de programación que soportan la orientación a objetos.

Los objetos son entidades que combinan estado (atributo), comportamiento (método) e identidad:

- El estado está compuesto de datos, será uno o varios atributos a los que se habrán asignado unos valores concretos (datos).

- El comportamiento está definido por los procedimientos o métodos con que puede operar dicho objeto, es decir, qué operaciones se pueden realizar con él.

- La identidad es una propiedad de un objeto que lo diferencia del resto, dicho con otras palabras, es su identificador (concepto análogo al de identificador de una variable o una constante).

La programación orientada a objetos, es necesaria en la vida de un programador ya que con esta visualizamos las actividades de cada una de esas. Un objeto contiene toda la información que permite definirlo e identificarlo frente a otros objetos pertenecientes a otras clases e incluso frente a objetos de una misma clase, al poder tener valores bien diferenciados en sus atributos. A su vez, los objetos disponen de mecanismos de interacción llamados métodos, que favorecen la comunicación entre ellos. Esta comunicación favorece a su vez el cambio de estado en los propios objetos. Esta característica lleva a tratarlos como unidades indivisibles, en las que no se separa el estado y el comportamiento.

Los métodos (comportamiento) y atributos (estado) están estrechamente relacionados por la propiedad de conjunto. Esta propiedad destaca que una clase requiere de métodos para poder tratar los atributos con los que cuenta. El programador debe pensar indistintamente en ambos conceptos, sin separar ni darle mayor importancia a alguno de ellos. Hacerlo podría producir el hábito erróneo de crear clases contenedoras de información por un lado y clases con métodos que manejen a las primeras por el otro. De esta manera se estaría realizando una programación estructurada camuflada en un lenguaje de programación orientado a objetos.

La Programación Orientada a Objetos difiere de la programación estructurada tradicional, en la que los datos y los procedimientos están separados y sin relación, ya que lo único que se busca es el procesamiento de unos datos de entrada para obtener otros de salida. La programación estructurada anima al programador a pensar sobre todo en términos de procedimientos o funciones, y en segundo lugar en las estructuras de datos que esos procedimientos manejan. En la programación estructurada sólo se escriben funciones que procesan datos. Los programadores que emplean Programación Orientada a Objetos, en cambio, primero definen objetos para luego enviarles mensajes solicitándoles que realicen sus métodos por sí mismos.

Conceptos fundamentales

La programación orientada a objetos es una forma de programar que trata de encontrar una solución a estos problemas. Introduce nuevos conceptos, que superan y amplían conceptos antiguos ya conocidos. Entre ellos destacan los siguientes:

· Clase: definiciones de las propiedades y comportamiento de un tipo de objeto concreto. La instanciación es la lectura de estas definiciones y la creación de un objeto a partir de ellas.

· Herencia: Es la facilidad mediante la cual la clase D hereda en ella cada uno de los atributos y operaciones de C, como si esos atributos y operaciones hubiesen sido definidos por la misma D. Por lo tanto, puede usar los mismos métodos y variables públicas declaradas en C. Los componentes registrados como "privados" (private) también se heredan, pero como no pertenecen a la clase, se mantienen escondidos al programador y sólo pueden ser accedidos a través de otros métodos públicos.

· Objeto: entidad provista de un conjunto de propiedades o atributos (datos) y de comportamiento o funcionalidad (métodos) los mismos que consecuentemente reaccionan a eventos. Se corresponde con los objetos reales del mundo que nos rodea, o a objetos internos del sistema (del programa). Es una instancia a una clase.

· Método: Algoritmo asociado a un objeto (o a una clase de objetos), cuya ejecución se desencadena tras la recepción de un "mensaje". Desde el punto de vista del comportamiento, es lo que el objeto puede hacer. Un método puede producir un cambio en las propiedades del objeto, o la generación de un "evento" con un nuevo mensaje para otro objeto del sistema.

· Evento: Es un suceso en el sistema (tal como una interacción del usuario con la máquina, o un mensaje enviado por un objeto). El sistema maneja el evento enviando el mensaje adecuado al objeto pertinente. También se puede definir como evento, a la reacción que puede desencadenar un objeto, es decir la acción que genera.

· Mensaje: una comunicación dirigida a un objeto, que le ordena que ejecute uno de sus métodos con ciertos parámetros asociados al evento que lo generó.

· Propiedad o atributo: contenedor de un tipo de datos asociados a un objeto (o a una clase de objetos), que hace los datos visibles desde fuera del objeto y esto se define como sus características predeterminadas, y cuyo valor puede ser alterado por la ejecución de algún método.

· Estado interno: es una variable que se declara privada, que puede ser únicamente accedida y alterada por un método del objeto, y que se utiliza para indicar distintas situaciones posibles para el objeto (o clase de objetos). No es visible al programador que maneja una instancia de la clase.

· Componentes de un objeto: atributos, identidad, relaciones y métodos.

· Identificación de un objeto: un objeto se representa por medio de una tabla o entidad que esté compuesta por sus atributos y funciones correspondientes.

(http://es.wikipedia.org/wiki/Base_de_datos_orientada_a_objetos; (http://es.wikipedia.org/wiki/Programaci%C3%B3n_orientada_a_objetos)

Describir cada etapa del diseño de un DW

1. Análisis de requerimientos.

· Identificar preguntas para las que queremos tener respuesta y los objetivos que se quieren conseguir con el nuevo sistema.

· Analizar las preguntas para determinar las perspectivas de análisis y los indicadores de negocio.

· Diseñar el modelo conceptual, que incluirá las perspectivas e indicadores identificados. A través del modelo se podrán alcanzar claramente cuáles son los alcances del proyecto, y será un punto de partida con alto nivel de definición para su exposición a los usuarios y responsables.

2. Análisis de los sistemas transaccionales.

· Determinación de indicadores: identificar el origen de los indicadores en los sistemas transaccionales y determinar la forma de su cálculo.

· Correspondencias: establecer correspondencias entre los elementos definidos en el modelo conceptual y las fuentes de datos existentes en elos OLTP (sistemas transaccionales).

· Definición del nivel de granuralidad: nivel de detalle de los datos a obtener para cada dimensión de análisis.

· Modelo conceptual ampliado con los campos identificados para cada perspectiva.

3. Modelo lógico del ETL.

· Tipo de modelo lógico del DW: selección del tipo de esquema que utilizaremos (estrella, copo de nieve, etc).

· Tabla de dimensiones: Construcción de las tablas de dimensiones para cada una de las perspectivas de análisis considerada.

· Tablas de Hechos: definición de las tablas de hechos que contendras la información a partir de los cuales construiremos los indicadores de análisis.

· Uniones: relaciones entre las tablas de dimensiones y las tablas de hechos.

4. Procesos ETL.

Análisis, definición y desarrollo de todos aquellos procesos necesarios para la extracción, transformación y carga de datos desde los sistemas origen para “llenar” el DW.

5. Performance y Mantenimiento del DW

Ajustes en el diseño del DW y mantenimiento en el tiempo.

Etapa

Entrada

Salida

Involucrados

I

Análisis de los

Documentación

Esquemas de bases de

Diseñador y administradores

sistemas de Información

Existente

datos

de los sistemas de info.

II

Especificación

Esquemas de

Hechos y cargas

Diseñador y usuarios

de requerimientos

bases de datos

de trabajo preliminares

finales

III

Diseño conceptual

Esquemas de bases

Esquemas

Diseñador

de datos, hechos y

dimensionales

cargas de trabajo

preliminares

IV

Refinamiento de cargas

esquemas

Carga de trabajo

Diseñador y usuarios

de trabajo y validación

dimensionales y

finales

de esquemas

cargas preliminares

dimensionales

V

Diseño lógico

Esquema

Esquema DW lógico

Diseñador

dimensional,

modelo lógico

objeto y cargas de

Trabajo

VI

Diseño físico

Esquema de DW

Esquema físico del DW

Diseñador

lógico, DBMS

destino y cargas

de trabajo

(http://churriwifi.wordpress.com/2009/12/05/5-fases-en-la-implantacion-de-un-sistema-dw-metodologia-para-la-construccion-de-un-dw/)

Negocio para desarrollar un DW – Gimnasio

Claramente el deporte en Chile ha ido aumentando de manera considerable, a pesar de no tener una cultura deportiva como en otros países, como por ejemplo, Estados Unidos, Alemania, Argentina, entre otros, las personas se van dando cuenta que tanto por temas de salud y sociales, el tener una vida y cuerpo sano afecta en magnitud las posibilidades de llevar a cabo las actividades cotidianas de la mejor forma posible. En relación a lo anterior, no está demás mencionar, que el hecho de ser deportista y tener una imagen como tal, aumenta claramente las ventajas de obtener un mejor puesto laboral en comparación con las demás personas. En consecuencia, el negocio que se ha escogido está relacionado con el boom del deporte, y sin duda, no existe otro mejor espacio para llevar a cabo las diferentes actividades deportivas como en un gimnasio, representando ésta misma la industria la cual es objetivo de análisis. Por esta razón, es indispensable tener un sistema para ir haciendo mantención a las diversas maquinas que se utilizan en estos centros deportivos, considerando el uso que se les da, existen varios elementos que se pueden remplazar a medida que transcurre el tiempo. Como por ejemplo las mismas máquinas, los cables sostenedores de los pesos, las bicicletas, las mancuernas, entre otros.

Se establecen intervalos de tiempos adecuados para evaluar las máquinas, estos son mensuales, trimestrales, semestrales y anuales. Para lo cual es necesario determinar el tipo de máquina y la categoría a la que corresponde para realizar su reemplazo si es que es necesario efectuarlo, es decir, contactar a uno de los proveedores del determinado aparato, quienes se han clasificado en ciudades, regiones y países, considerando las características de algunas máquinas probablemente no todas son posible adquirirlas en Chile.

Debido a lo anteriormente mencionado, es posible efectuar análisis en el transcurso del tiempo de los reemplazos y reparaciones que se tienen que realizar, como por ejemplo, en un año se debe reemplazar las maquinas de tipo spinning, correspondientes a la categoría de fitness, en donde los proveedores se ubican en Chile, Región Metropolitana, Santiago.

Conclusión

Efectivamente debido a la gran cantidad de información que presentan generalmente las empresas de gran envergadura, resulta indispensable llevar a cabo un ordenamiento de ésta para satisfacer las distintas necesidades dentro de una organización. Por esta razón, como se ha observado tanto a través de los conceptos y el ejemplo de los gimnasios, resulta indispensable utilizar Data Warehouses para tomar las decisiones correctas en los momentos precisos, es decir, está orientado para establecer análisis y consultas de los usuarios en el transcurso del tiempo. De esta forma es posible facilitar el acceso a los usuarios finales a los almacenes de datos para obtener específicamente los datos que se requieren.

Por esta razón, es fundamental utilizar las herramientas y técnicas para extraer, cargar y transformar datos de diversas fuentes, para posteriormente depurarlos y prepararlos para cargarlos en un almacén de datos, generando siempre valor agregado para la empresa que los utiliza. Es en este aspecto en donde cumple suma relevancia el Business Intelligence, en donde los resultados de las aplicaciones de los software de inteligencia se ven si es que ha aumentado los beneficios tanto financieros, administrativos, y sin duda, un aumento en la correcta toma de decisiones de los distintos departamentos que se encuentran presente en una organización. De lo contrario, se buscarán nuevos métodos más eficientes para llevar a cabo los procesos que presentan falencias.

Como se ha observado son mucho los procesos que se realizan al mantener un Data Warehouse, por lo cual, pueden presentar costos bastantes elevados para las empresas, y podría ser una de las causas que las pequeñas y medianas empresas no los utilicen. Además, la información va cambiando rápidamente, y se requiere claramente un análisis minucioso para actualizar la información, de modo que esta siga siendo relevante.

No hay comentarios:

Publicar un comentario