DATA WAREHOUSE
EQUIPO: 3
1. Alberto Linares faustinos
2. Nelson Morales Cordova
3. Arturo Tlatilpa Banda
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
INTRODUCCIÓN AL CONCEPTO
DATA WAREHOUSE
CENTRO DE INVESTIGACIÓN EN
INGENIERÍA Y CIENCIAS APLICADAS
CIICAp
Un almacén de datos (del Ingles) Data warehouse, es el centro de la
arquitectura para los sistemas de información en la década de los '90.
Soporta el procesamiento informático al proveer una plataforma sólida,
a partir de los datos históricos para hacer el análisis. Facilita la
integración de sistemas de aplicación no integrados.
Organiza y almacena los datos que se necesitan para el procesamiento
analítico, informático sobre una amplia perspectiva de tiempo.
Un Data warehouse o almacén de Datos es una colección de datos
orientado a temas, integrado, no volátil, de tiempo variante, que se usa
para el soporte del proceso de toma de decisiones gerenciales.
El ingreso de datos en el data warehouse viene desde el ambiente
operacional en casi todos los casos. El data warehouse es siempre un
almacén de datos transformados y separados físicamente de la
aplicación donde se encontraron los datos en el ambiente operacional.
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
CARACTERISTICAS DE UN
DATA WAREHOUSE
Entre las principales se tiene:
•
Orientado al tema
•
Integrado
•
De tiempo variante
•
No volátil
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
Orientado a Temas
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
http://www.sqlmax.com/dataw1.asp
Integración
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
http://www.sqlmax.com/dataw1.asp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
De Tiempo Variante
http://www.sqlmax.com/dataw1.asp
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
No Volátil
http://www.sqlmax.com/dataw1.asp
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
ESTRUCTURA DEL DATA
WAREHOUSE
CENTRO DE INVESTIGACIÓN EN
INGENIERÍA Y CIENCIAS APLICADAS
CIICAp
Los data warehouse hay niveles diferentes de esquematización y
detalle que lo delimitan.
componentes del data warehouse y son:
• Detalle de datos actuales
• Detalle de datos antiguos
• Datos ligeramente resumidos
• Datos completamente resumidos
• Meta data
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
ESTRUCTURA DEL DATA
WAREHOUSE
CENTRO DE INVESTIGACIÓN EN
INGENIERÍA Y CIENCIAS APLICADAS
CIICAp
• Detalle de datos actuales.-Refleja las ocurrencias más recientes, las cuales son
de gran interés, es voluminoso.
• Detalle de datos antiguos.- La data antigua es aquella que se almacena sobre
alguna forma de almacenamiento masivo. No es frecuntemente accesada y se
almacena a un nivel de detalle, consistente con los datos detallados actuales.
•Datos ligeramente resumidos.- La data ligeramente resumida es aquella que
proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este
nivel del data warehouse casi siempre se almacena en disco. Los puntos en los que
se basa el diseñador para construirlo son:
Que la unidad de tiempo se encuentre sobre la esquematización hecha.
Qué contenidos (atributos) tendrá la data ligeramente resumida.
• Datos completamente resumidos.- Los datos completamente resumidos, estos
datos son compactos y fácilmente accesibles.
ESTRUCTURA DEL DATA WAREHOUSE
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
http://www.sqlmax.com/dataw1.asp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
ESTRUCTURA DEL DATA
WAREHOUSE
CENTRO DE INVESTIGACIÓN EN
INGENIERÍA Y CIENCIAS APLICADAS
CIICAp
La metadata. Juega un rol especial y muy importante en la data
warehouse y es usada como:
•Un directorio para ayudar al analista a ubicar los contenidos del data
warehouse.
•Una guía para el mapping de datos de cómo se transforma, del ambiente
operacional al de data warehouse.
•Una guía de los algoritmos usados para la esquematización entre el detalle
de datos actual, con los datos ligeramente resumidos y éstos, con los datos
completamente resumidos, etc.
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
Elementos constituyentes de una
Arquitectura Data Warehouse
CENTRO DE INVESTIGACIÓN EN
INGENIERÍA Y CIENCIAS APLICADAS
CIICAp
La arquitectura se constituye de un número de partes
interconectadas:
•
•
•
•
•
•
•
•
Base de datos operacional / Nivel de base de datos externo
Nivel de acceso a la información
Nivel de acceso a los datos
Nivel de directorio de datos (Metadata)
Nivel de gestión de proceso
Nivel de mensaje de la aplicación
Nivel de data warehouse
Nivel de organización de datos
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
Operaciones en un
Data Warehouse
CENTRO DE INVESTIGACIÓN EN
INGENIERÍA Y CIENCIAS APLICADAS
CIICAp
Los tipos de operaciones que se efectúan dentro de un
ambiente data warehousing son:
•Sistemas Operacionales
•Extracción, Transformación y Carga de los Datos
•Metadata
•Plataforma del data warehouse
•Datos Externos
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
Operaciones en un
Data Warehouse
http://www.sqlmax.com/dataw1.asp
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
TRANSFORMACION
DE DATOS
http://www.sqlmax.com/dataw1.asp
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
FLUJO DE DATOS
CENTRO DE INVESTIGACIÓN EN
INGENIERÍA Y CIENCIAS APLICADAS
CIICAp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
Al ingresar al data warehouse, la información va
al nivel de detalle actual. Se queda allí y se usa
hasta que ocurra uno de los tres eventos
siguientes:
·
·
·
Sea eliminado
Sea resumido
Sea archivado
FLUJO DE DATOS
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
CENTRO DE
INVESTIGACIÓN EN
INGENIERÍA Y
CIENCIAS APLICADAS
CIICAp
http://www.sqlmax.com/dataw1.asp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
•
•
•
•
•
•
•
•
•
•
•
BENEFICIOS DE TRABAJAR CON
EL DW
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
Reducción de tiempos y costos asociados con la consolidación de datos
provenientes de distintas fuentes.
Acceso inmediato y flexible a información crítica de la organización
resultando esto en ventajas competitivas.
Mejoras en la calidad de los datos : consistencia, precisión y
documentación.
Creación de una infraestructura flexible, capaz de adaptarse
rápidamente a los cambios tácticos y estratégicos de negocio.
Mayor conocimiento de las necesidades y expectativas de los clientes,
pudiendo segmentar el mercado de acuerdo a intenciones de negocios.
Decisiones más rápidas.
Mejor entendimiento del negocio.
Descubrimiento de nuevas oportunidades de negocio.
Incremento de productividad y reducción de costos en la disponibilidad
de información.
Monitoreo del normal desenvolvimiento de las operaciones de la
organización.
Capacidad de realizar comparaciones y obtener tendencias centrando la
atención sobre los verdaderos puntos problemas.
DEBILIDADES Y FORTALEZAS
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
DEBILIDADES
•Falta de normalización.
•Alto costo.
•Reanálisis del modelo de datos,
objetos, transacciones,
almacenamiento.
•Diseño complejo y multidisciplinar.
•Cambio dinámico de requerimientos
de información.
•Administración y mantenimiento.
•Sistemas,aplicaciones y
almacenamiento específico
FORTALEZAS
•Integrador de sistemas.
•Consistencia.
•Accesibilidad.
•Disponibilidad.
•Menor costo de difusión y
formación.
•Visión amplia de negocio.
•Orientado a la toma de decisiones.
•Modelización y simulación.
•Información consolidada.
•Extracción de información –
conocimiento,
http://www.seis.es/seis/inforsalud2001/cientificas2/diaz.htm
TABLAS COMPARATIVAS
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
OLTP
•Mueve dinero entre cuentas
•Número de usuarios mayor
•Consulta en segundos
•Menor tamaño
•Es un sistema
•Número mayor de tablas con
pocas columnas
•Son actualizados día a día
•La estructura es muy estable
Data Warehouse
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
•Organizado en base de conceptos,
clientes, facturas, productos.
•Número de usuarios menor.
•Consulta en minutos
•Gran tamaño
•Desnormalizados
•El número de tablas es menor, pero
mayor el número de columnas.
•Son actualizados por periodos.
•Sufren cambios según el desarrollo
y actualización.
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBressa
n.htm#Qué%20es%20Data%20Warehousing
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
COSTOS
ACTUALIZADOS
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
• Muchos proyectos de data warehouse usan productos como
Warehouse Manager de Prism Solutions o Passport de Carleton,
para una gama de tareas de gestión de data warehouse, que
incluyen:
– Extracción de los datos desde las bases de datos operacionales
– Preparación de los datos para cargarlos en una base de datos
del depósito,
– Administración de la metadata.
• Estos productos cuestan desde $ 75,000 a más de $ 200,000 Dls,
dependiendo del tamaño y la complejidad del proyecto y pueden
también limpiar, transformar y validar.
•
http://www.inei.gob.pe/biblioineipub/bancopub/Inf/Lib5084/2242.HTM
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
•
•
La empresa Enterprise/Integrator ofrece no solamente limpieza de datos, sino
también extracción, transformación, carga de datos, repetición, sincronización y
administración de la metadata. Es bastante caro (de $130,000 a $250,000 Dls), pero
se puede ahorrar dinero si elimina la necesidad de otras herramientas de gestión de
data warehouse.
Arthur Andersen: Las soluciones orientadas al nombre y la dirección pueden costar
en cualquier parte desde $30 000 a mas de $200 000 Dls.
http://www.inei.gob.pe/biblioineipub/bancopub/Inf/Lib5084/2242.HTM
• Servicios prestados por Leviminod Consultora
Consultoría
Diseño Data Warehouse / Data mart
Diseño Modelo de Datos (Data Model)
Análisis y estudio de herramientas.
Capacitación a usuario y presentaciones
Programación
Soporte Técnico (Windows NT, MS-SQL Server, etc.)
http://www.calvache.com/cya_datawarehouse.htm
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
DIAGRAMA DE FUNCIONAMIENTO
DE UN DATA WAREHOUSE
http://www.um.es/eempresa/angel/ppt/datawarehouse.htm
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
DEMOSTRACIÓN DEL USO DE UN
DATA WAREHOUSE
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
http://www.monografias.com/trabajos6/dawa/dawa.shtml
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
OTRO EJEMPLO DEL USO DEL
DATA WAREHOUSE
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
http://www.sqlmax.com/dataw1.asp
USO DE UN SISTEMA OPERACIONAL
UNIVERSIDAD
AUTÓNOMA
DEL ESTADO DE
MORELOS
(Este sistema es operado por secciones, siendo de
menor tamaño y volátil), por lo tanto no es un DW
Procesamiento
Manual
http://www.sqlmax.com/dataw1.asp
CENTRO DE
INVESTIGACIÓN EN
INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
EMPRESAS QUE USAN EL DATA
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
WAREHOUSE
Los sectores donde principalmente se ha implantado data warehouse son
los siguientes:
Empresas de telecomunicaciones. Jazztel, Vodafone, France
Telecom...
Empresas de transporte. British Airways, Union Pacific, Air France,
etc.
Empresas de fabricación de bienes de consumo masivo. Coca-Cola,
Adidas, Nike, 3M, Bosh Siemens,
Entidades Financieras. BBVA, Caja Madrid, Caja Extremadura
Comercio Minorista. Corte Inglés, Cortefiel, Eroski.
Y otras mas como:
Wal*Mart, Kmart, Sears, Meijer, Kohl's Department Stores, American
Stores (Jewel/OSCO/Lucky/Savon/ACME/SuperSaver), Mervyn's,
Buttrey Food & Drug, QVC Home Shopping, Canadian Tyre, WH Smith
Books (Gran Bretaña), Great Universal (GB), Supermercados Casino
(Francia), Migrosgenossenschaftsbund (Suiza), Otto Versand (Alemania).
Procter & Gamble, Hallmark, Maybelline, Helene Curtis, Owens Corning
Glass, Karsten Ping Golf Clubs, Walt Disney, Whirlpool.
http://www.monografias.com/trabajos6/dawa/dawa.shtml
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
TUTORIALES
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
http://www.preciomania.com/search_getprod.php/masterid=/isbn=9780201760330
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
CONCLUSIÓN
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
• El DW es un proceso, no un producto
• Es un conjunto de procesos y acciones, orientados a
un tema, integrados y no volátiles que sirve para la
toma de decisiones de la gerencia.
• E data warehouse a pesar de su alto costo, sigue
funcionando y brindando credibilidad a la información
que provee a los usuarios.
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
•
•
•
•
•
BIBLIOGRAFIA
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
•
•
•
Laudon Keneth C., Laudon Jane P. , Sistemas de Información Gerencial (8ª ed.)
México, Pearson Educación, (2004)
http://www.dwinfocenter.org/casefor.html
http://datawarehouse.ittoolbox.com/
http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/MineriaDatosBr
essan.htm
http://www.monografias.com/trabajos17/data-warehouse/data-warehouse.shtml
http://www.inei.gob.pe/biblioineipub/bancopub/Inf/Lib5084/214.HTM
http://www.monografias.com/trabajos11/basda/basda.shtml#d
Ralph Kimball, Laua Reeves, Margy Ross, Warren ....The Data Warehouse Lifecycle
Toolkit
http://www.navactiva.com/web/es/atic/aseso/desarrollo/asesor1/2005/33153.php
http://www.monografias.com/trabajos6/dawa/dawa.shtml
http://www.calvache.com/cya_datawarehouse.htm
•
http://www.sqlmax.com/dataw1.asp
•
•
•
•
UNIVERSIDAD AUTÓNOMA
DEL ESTADO DE MORELOS
GLOSARIO
CENTRO DE INVESTIGACIÓN
EN INGENIERÍA Y CIENCIAS
APLICADAS CIICAp
OLTP (On-Line Transaction Processing)
Son aplicaciones que definen el comportamiento habitual de un entorno
operacional de gestión y ejecutan las operaciones del día a día.
EIS/DSS
Sistemas de Información Ejecutivos (EIS),
Los sistemas DSS/EIS están orientados al análisis y al reporte de la información
existente en los Datawarehouse.
Estos sistemas no se limitan a proporcionar informes estáticos sino que a partir
de ellos se puede dinámicamente ascender y descender a través de jerarquías
predefinidas, rotar los ejes del análisis, incorporar funcionalidades como
botones, alertas, listas desplegables...
http://www.progres.com.ar/businessint_2.asp
Descargar

data warehouse - Universidad Autónoma del Estado de Morelos