DATA WAREHOUSE
Presentador Por:
Andrés Fabián Cortes Solano
TEMARIO
1. ¿Qué es Data Warehouse?
2. Conceptos básicos:
a.
Características
b.
Aplicaciones
c.
Alternativas de Diseño
d.
Herramientas Utilizadas
e.
Datamining
f.
Base de Datos Multidimensional
g.
Metadatos
h.
Procesos de Construcción
i.
Técnicas Explotación
Data Warehouse
Es un repositorio estructurado, a
nivel Empresa, de datos orientados
hacia áreas de negocio, que
contiene datos históricos y que
está preparado para facilitar la
toma de decisiones.
Diferencias
Base de Datos Operacional
Data Warehouse
Datos Operacionales
Datos del negocio para Información
Orientado a la aplicación
Orientado al sujeto
Actual
Actual + histórico
Detallada
Detallada + más resumida
Cambia continuamente
Estable
Características
Entre las principales se tiene:
·
Orientado al tema
·
Integrado
·
Variante en el Tiempo
·
No volátil
Orientado al Tema
Una primera característica
del data warehouse es que
la información se clasifica
en base a los aspectos que
son de interés para la
empresa.
Ejemplo: Para un fabricante
pueden
ser
cliente,
vendedor y producto.
Integrado
La base de datos contiene
los datos de todos los
sistemas operacionales de
la organización, y dichos
datos
deben
ser
consistentes.
Variante en el Tiempo
Como la información en el
data
warehouse
es
solicitada en cualquier
momento (es decir, no
"ahora mismo"), los datos
encontrados en el depósito
se llaman “variante en el
tiempo".
No volátil
La información no se
modifica ni se elimina, una
vez almacenado un dato,
éste se convierte en
información de sólo lectura,
y se mantiene para futuras
consultas.
Aplicaciones
- Sistemas de Marketing
- Análisis de Riesgo Financiero
- Análisis de Riesgo de Crédito
- Control de Gestión
- Logística
- Recursos Humanos
Alternativas de Diseño
1. Creación de varios Datamarts independientes, uno por
cada dominio o fuente de información, y definición de una
Capa Usuario por cada uno de estos Datamarts.
2. Creación de un único Datawarehouse que englobe
todos los datos, del que se extraigan diferentes Datamarts,
uno por cada dominio o fuente de información y
definición de una Capa Usuario por cada Datamart.
3. Creación de un único Datawarehouse con definición de
una única Capa Usuario.
4. Creación de un único Datawarehouse con definición de
varias Capas Usuario.
Herramientas Utilizadas
- Herramientas para la inteligencia
empresarial.
- Herramientas
para
extraer,
transformar y cargar datos en el
almacén de datos.
- Herramientas para gestionar y
recuperar los metadatos.
Datamining (Minería de Datos)
Es el conjunto de técnicas y tecnologías que
permiten explorar grandes bases de datos, de
manera automática o semiautomática, con el
objetivo de encontrar patrones repetitivos,
tendencias o reglas que expliquen el
comportamiento de los datos en un determinado
contexto. Hace uso de prácticas estadísticas y, en
algunos casos, de algoritmos de búsqueda
próximos a la Inteligencia Artificial y a las redes
neuronales.
Base de Datos Multidimensionales
Se utilizan principalmente para crear aplicaciones OLAP y pueden
verse como bases de datos de una sola tabla, su peculiaridad es que
por cada dimensión tienen un campo (o columna), y otro campo por
cada métrica o hecho, es decir estas tablas almacenan registros cuyos
campos son de la forma:
(d1,d2,d3,...,f1,f2,f3,...)
Donde los campos 'di' hacen referencia a las dimensiones de la tabla, y
los campos 'fi' a las métricas o hechos que se quiere almacenar,
estudiar o analizar.
Metadatos
Uno de los componentes más importantes de la
arquitectura de un almacén de datos son
los metadatos. Se define comúnmente como
"datos acerca de los datos", en el sentido de
que se trata de datos que describen cuál es la
estructura de los datos que se van a almacenar y
cómo se relacionan.
El Metadato documenta, entre otras cosas, qué
tablas existen en una base de datos, qué
columnas posee cada una de las tablas y qué
tipo de datos se pueden almacenar.
Procesos de Construcción
ETL (Extracción, Transformación y Carga).
Extracción: Obtención de información de las
distintas fuentes tanto internas como externas.
Transformación: Filtrado, limpieza, depuración,
homogeneización y agrupación de la
información.
Carga: Organización y actualización de los datos
y los metadatos en la base de datos.
Técnicas de Explotación
La explotación del Data Warehouse mediante información de gestión,
se fundamenta básicamente en los niveles agrupados o calculados de
información.
Carga de Base de datos
Extracción, Depuración, Filtro, Elaboración
Glosario
• Data Warehouse: Es un repositorio estructurado, a nivel Empresa,
de datos orientados hacia áreas de negocio, que contiene datos
históricos y que está preparado para facilitar la toma de decisiones.
• Datamart: Es una base de datos orientada a un tema específico. En
otras palabras es un subconjunto del Data Warehouse Corporativo.
• Capa Usuario: Es una vista usuario de la base de datos que permite
su aislamiento respecto de la complejidad física de la misma. No
incluye ningún dato físico. Es una agrupación lógica de los datos
adaptada a los conocimientos y filosofía del Usuario
• OLAP: Tecnología que permite la explotación de datos en diferentes
niveles organizacionales y periodos de tiempo.
GRACIAS POR SU
ATENCION
Descargar

Diapositiva 1 - basededatos2010