Ciclo de Vida
Hugo M. Castro
Implementación de un
Data Warehouse




Un proyecto de Data Warehouse debe
basarse en satisfacer necesidades del negocio
Los datos se deben presentar de acuerdo con
las variables del negocio
Un Data Warehouse está en permanente
evolución
Cada proyecto de Data Warehouse debe
tener un principio y un fin
Ciclo de vida
Diseño
Productos
Arquitectónico
Requerimientos
Planificación
del
Negocio
Modelo
Diseño
Dimensional
Físico
Data
Staging
Especificación
Desarrollo
Aplicaciones
Aplicaciones
Administración del Proyecto
Implementa
ción
Mantenimiento
Crecimiento
Planificación
Diseño
Productos
Arquitectónico
Requerimientos
Planificación
del
Negocio
Modelo
Diseño
Dimensional
Físico
Data
Staging
Especificación
Desarrollo
Aplicaciones
Aplicaciones
Administración del Proyecto
Implementa
ción
Mantenimiento
Crecimiento
Planificación






Predisposición de la organización
Alcance
Justificación de negocio
Aspectos humanos
Plan del proyecto
Puntos clave
Predisposición de la organización





Apoyo de la Gerencia (Sponsor)
Motivación del negocio
Participación de gente del negocio y
Sistemas
Cultura actual de análisis de
información
Factibilidad
Apoyo de la Gerencia
(Sponsor)



Perteneciente al área de negocios de la
empresa
Con visión del impacto del Datawarehouse
Con convicción personal y alto compromiso
con el proyecto
Apoyo de la Gerencia
(Sponsor)




Con influencia en la empresa, respetado y con
buenas conexiones
Con conocimiento de la cultura, las personas, las
políticas y los procesos de la empresa
Con visión realista para comprender los conceptos
del datawarehouse y el ciclo de desarrollo
iterativo
Con capacidad para tomar decisiones
Motivación imperiosa del
negocio





Tener en cuenta que
El datawarehouse es un facilitador del acceso a los
datos
Va a armarse para resolver requerimientos críticos
específicos del negocio
Debe alinearse con las motivaciones del negocio
de tipo estratégico de la empresa
Ejemplo
Oportunidad para ganar lugar en el mercado
Mejorar la competitividad
Participación entre Sistemas y
Negocio

Un datawarehouse exitoso parte del trabajo
conjunto de gente de sistemas y gente del
negocio
NO se puede encarar prescindiendo de la
otra área
Cultura actual en el análisis de
información

Un datawarehouse se construye para brindar

mejor acceso
a mejor información
para dar soporte a la toma de decisiones


Cultura actual en el análisis de
información

si no hay uso actual de información,
probablemente la empresa no necesite
un Datawarehouse
(o hay que invertir un esfuerzo
considerable en cambiar la cultura)
Factibilidad




Se refiere a los datos que van a alimentar al
Datawarehouse
Los datos del datawarehouse son secundarios, es
decir, todos provienen de otras fuentes que los
reunieron.
Son importantes
Los sistemas transaccionales en funcionamiento
que tiene la empresa
La calidad de los datos
Predisposición de la organización
ESCENARIOS POSIBLES 1
 Empresa con algún área de gran visibilidad




Con necesidades claras de acceso a información
Con un ejecutivo del negocio que impulsa el
proyecto (sponsor)
Es la situación más favorable
Se da en el 50% de los casos
Predisposición de la organización
ESCENARIOS POSIBLES 2
 Empresa con múltiples áreas que
requieren información
 Es una situación más complicada
 Requiere establecer prioridades en los
requerimientos
Predisposición de la organización
ESCENARIOS POSIBLES 3
 Empresa sin una necesidad clara de acceso a
información sino difusa
 Es la situación más complicada
 Puede verse beneficiada por tener acceso a
información pero hace falta identificar
primero en forma clara


Los beneficios de una solución BI y
Las necesidades reales de acceso a información.
Predisposición de la organización






Controlar la disposición de la empresa hacia
una solución BI
Antes de comenzar un proyecto de Datawarehouse
o Data Mart
Entender si hay demanda de uso de información
Identificar de dónde proviene la demanda
Hay que
Buscar un sponsor de negocios fuerte
Identificar usuarios de negocios ávidos de
información
Predisposición de la organización


Si no
POSPONER EL PROYECTO...
Preguntas clave




Evalúan si la organización está en
condiciones de implementar una
solución de BI
Evalúan si vale la pena ofrecer una
solución de BI
Preguntas cruzadas
Aspectos de la implementación
Factores críticos de éxito






Compromiso de la Gerencia
Requerimientos del negocio
Madurez de la empresa
Calidad de información
Características del Data Warehouse
Grupo de desarrollo
Alcance del proyecto




Consenso Sistemas y Negocios
Valor para la organización
Manejable
Comienzo en pequeño




Un proceso de negocios
Prioridades
Plazos
Riesgos
Justificación para el negocio






Estimación de beneficios y costos
Costos de hardware y software
Crecimiento
Ampliación de requerimientos
Mayores ingresos
Mejores oportunidades
Aspectos humanos


Funciones provenientes del negocio
Funciones técnicas


Funciones de administración


Sistemas – Negocios
Sistemas – Consultores externos
Transferencia de conocimiento
Personajes 1
DEL LADO DEL NEGOCIO
 Propietario
 Patrocinante
 Conductor
 Líder de negocios
 Profesionales de negocios
Personajes 2
ASPECTOS TÉCNICOS
 Analista de sistemas de negocios
 Referente temático
 Desarrollador de aplicaciones
 Instructor
Personajes 3
ADMINISTRACIÓN Y SOPORTE
 Director del proyecto
 Arquitecto
 Especialista de soporte técnico
 Modelador de datos
 Administrador de base de datos
 Diseñador de ETL
 Soporte del Data Warehouse
Plan del proyecto



Identificación de las tareas necesarias
Participación de personas clave
Identificación de puntos de aceptación
por los usuarios


Etapas – Entregables
Plan de comunicaciones
Plan de comunicaciones
Interlocutor
Frecuencia
Mensaje
Patrocinante
Bi-mensual
Resolución de problemas
Manejo de expectativas
Usuarios de
negocios
Grupo del
proyecto
Sistemas
Mensual
Involucración
Manejo de expectativas
Fechas críticas
Semanal
Avance del proyecto
Identificación y resolución
de problemas
Bi-mensual
Manejo de expectativas
Necesidad de recursos
Puntos clave




Busque un patrocinante bien ubicado
Haga un balance entre valor para el
negocio y manejabilidad
Desarrolle cuidadosamente el plan del
proyecto
Sea un director de proyecto con
capacidad de motivar, administrar y
comunicar a todos los niveles
Requerimientos del negocio
Diseño
Productos
Arquitectónico
Requerimientos
Planificación
del
Negocio
Modelo
Diseño
Dimensional
Físico
Data
Staging
Especificación
Desarrollo
Aplicaciones
Aplicaciones
Administración del Proyecto
Implementa
ción
Mantenimiento
Crecimiento
Relevamiento de requerimientos
PREPARACIÓN
 Entreviste primero a los altos directivos





Visión más amplia del negocio
Determinación de prioridades
Apoyo para las entrevistas posteriores
Prepare el grupo de relevamiento
Planifique las entrevistas con gerentes
intermedios y profesionales de negocios
Relevamiento de requerimientos
UNA VEZ IDENTIFICADOS LOS
INTERLOCUTORES
 Elija los medios




Entrevistas
Sesiones con moderador
Prepare el temario
Agende las entrevistas y sesiones
Relevamiento de requerimientos
ENTREVISTAS
 Apertura


Desarrollo




Objetivos de la entrevista
Forma de trabajo
Métricas
Análisis
Cierre

Cuantificación del éxito
Relevamiento de requerimientos
Puntos importantes
 Escuche atentamente
 Tome notas
 No entre en detalles demasiado pronto
 Trate de captar la terminología de la
organización
 En las entrevistas use el vocabulario del
entrevistado
Funciones vs. Datos
INTERLOCUTORES: PROFESIONALES DE NEGOCIOS
Productos
¿Qué productos se venden
más?
¿Cómo se venden los
productos en las
sucursales?
Fecfa
Sucursales
X
Ventas
Cantidad de
tickets
X
X
X
X
¿En qué horas hay más
clientes?
¿Qué días de la semana
son más flojos?
Hora
X
X
X
X
X
X
Entrevistas sobre los datos

Interlocutores



Conocedores de las fuentes de datos
Conocedores del negocio
Objetivos


Asegurar que hay datos para cumplir con
los requerimientos
Fijar las expectativas en un nivel razonable
Datos vs. Fuentes
INTERLOCUTORES: ADMINISTRADORES DE BD
Inventario
Productos
Carpeta de
sucursales
X
Consolidado
de cajas
BD de
productos
X
X
Fecha
X
Hora
X
Sucursales
X
X
Ventas
X
Cantidad de Tickets
X
Actividades post-entrevista
Informe sobre la reunión
 Resumen ejecutivo
 Visión general
 Detalle de cada proceso de negocios





Para qué se requiere análisis de datos
Qué funciones se necesitan
Cuáles son las limitaciones actuales
Cuáles son los beneficios previstos
Factibilidad de conseguir los datos necesarios
Actividades post-entrevista
Presentación a la alta gerencia
 Identificación de procesos de negocios
 Entendimiento de la terminología
 Análisis de prioridades


Impacto en el negocio
Factibilidad
Actividades post-entrevista
CUADRANTES DE PRIORIDADES
Impacto
en el
negocio
Proceso A
Proceso B
Proceso C
Proceso D
Baja
Alta
Factibilidad
Desarrollo del proyecto
El desarrollo del proyecto se
realiza en tres líneas
Línea de Tecnología
Requerimientos
Línea de Datos
Línea de Aplicaciones
Línea de Tecnología
Diseño
Productos
Arquitectónico
Requerimientos
Planificación
del
Negocio
Modelo
Diseño
Dimensional
Físico
Data
Staging
Especificación
Desarrollo
Aplicaciones
Aplicaciones
Administración del Proyecto
Implementa
ción
Mantenimiento
Crecimiento
Línea de Tecnología

Arquitectura

Componentes






Fuentes de datos
Organización de datos (Data Staging)
Presentación de datos
Acceso a los datos
Influencia de los requerimientos
Selección de productos
Arquitectura
Sistemas
Transaccionales
Extracción
Área de
presentación de
datos
Data Staging Area
Área de acceso a
los datos
SERVICIOS
DATA MART 1
Limpieza
Dimensional
Consultas
especiales
Combinación
Un proceso de
negocios
Redacción de
informes
Estandarización
NO CONSULTAS
Carga
Datos atómicos y Acceso Aplicaciones
consolidados
analíticas
ARCHIVOS/TABLAS
PROCESOS
Ordenamiento
Procesamiento
secuencial
Modelos
Bus del DWh
- Pronósticos
- Scoring
DATA MART 2
Diseño similar
- Data Mining
Influencia de los requerimientos

Hardware



Software



Servidores
Discos
Sistema operativo
Motor de base de datos
Funcionalidades
Influencia de los requerimientos






Alta disponibilidad
Espejado de datos
Soporte unificado de metadatos
Potencia de cálculo para procesos
complejos de integración
Ubicación de los usuarios
Ventana de renovación
Selección de productos





Análogo a otras selecciones de
tecnología
Política de compras
Matriz de evaluación
Requerimientos técnicos y funcionales
Factores de ponderación
Línea de Datos
Diseño
Productos
Arquitectónico
Requerimientos
Planificación
del
Negocio
Modelo
Diseño
Dimensional
Físico
Data
Staging
Especificación
Desarrollo
Aplicaciones
Aplicaciones
Administración del Proyecto
Implementa
ción
Mantenimiento
Crecimiento
Línea de Datos

Modelado dimensional






Proceso de negocios
Granularidad
Tablas de hechos
Tablas de dimensión
Claves subrogadas
Dimensiones de cambio lento
Línea de Datos

Diseño físico de la base de datos





Nombres de columnas
Tipos de datos
Claves
Particiones
Estrategia de consolidación


Qué consolidaciones se incluyen
Estrategia de indexación
Línea de Datos

Diseño y desarrollo del ETL

Compra vs. Desarrollo





Curva de aprendizaje
Retorno de la inversión
Normalización vs. desnormalización
Organización de las tablas de dimensión
Organización de las tablas de hechos
ETL
Organización de las tablas de dimensión





Toma los datos dimensionales de los sistemas
transaccionales
Depura los valores de los atributos para
incorporarlos al modelo dimensional
Crea y asigna claves subrogadas
Mantiene la tabla de referencias cruzadas
Identifica el agregado omodificación de filas en la
tabla de dimensión
ETL
Organización de las tablas de hechos





Toma los datos de hechos de los sistemas
transaccionales
Recibe dimensiones actualizadas
Separa los datos de hechos por granularidad
Realiza las transformaciones requeridas en los
datos
Reemplaza claves de los sistemas fuente por
claves subrogadas
ETL
Organización de las tablas de hechos
 Agrega claves adicionales


Asegura la calidad de los datos




“Sin promoción”, “No aplicable”
Cuenta de filas, totales cruzados
Construye tablas de hechos sumadas
Incorpora los datos al Data Warehouse
Informa a los usuarios
Línea de Aplicaciones
Diseño
Productos
Arquitectónico
Requerimientos
Planificación
del
Negocio
Modelo
Diseño
Dimensional
Físico
Data
Staging
Especificación
Desarrollo
Aplicaciones
Aplicaciones
Administración del Proyecto
Implementa
ción
Mantenimiento
Crecimiento
Línea de Aplicaciones

Especificación y desarrollo de
aplicaciones


Diferentes niveles de necesidad de
información para diferentes usuarios
Documentación de relevamiento de
requerimientos
Línea de Aplicaciones

Especificación y desarrollo de
aplicaciones

Vías de acceso




Internet
Correo electrónico
Tableros de control
Personalización de herramientas
Implementación
Diseño
Productos
Arquitectónico
Requerimientos
Planificación
del
Negocio
Modelo
Diseño
Dimensional
Físico
Data
Staging
Especificación
Desarrollo
Aplicaciones
Aplicaciones
Administración del Proyecto
Implementa
ción
Mantenimiento
Crecimiento
Implementación





Convergencia de las tres líneas
La línea de datos es la más
impredecible
Fechas comprometidas
Asegurarse de que el Data Warehouse
esté en condiciones
Educación
Implementación






EDUCACION
Entender cuál es la audiencia
No empezar la educación demasiado
temprano
Datos viejos o no reales
Posponer la educación si hay problemas en la
puesta en marcha
Política “Si no hay educación, no hay acceso”
Mantenimiento y Crecimiento
Diseño
Productos
Arquitectónico
Requerimientos
Planificación
del
Negocio
Modelo
Diseño
Dimensional
Físico
Data
Staging
Especificación
Desarrollo
Aplicaciones
Aplicaciones
Administración del Proyecto
Implementa
ción
Mantenimiento
Crecimiento
Mantenimiento y Crecimiento

Soporte a los usuarios de negocios




Si no hay consultas, posiblemente no estén
usando el Data Warehouse
Detectar áreas de datos o de aplicaciones no
cubiertas
Calidad del Data Warehouse
Educación


Cursos de actualización
Usuarios calificados
Mantenimiento y Crecimiento

Soporte Técnico




Es parte del negocio
Rendimiento
Nivel de servicio
Monitoreo



Avance vs. criterios de éxito
Revisiones
Oportunidades de mejoras
Mantenimiento y Crecimiento

Demandas de crecimiento







Nuevos usuarios
Nuevos datos
Nuevas aplicaciones
Mejoras de las aplicaciones existentes
Revisión de las prioridades establecidas
Determinación de las necesidades de la nueva
etapa
Comienzo de la nueva etapa
Arquitecturas OLAP

OLAP Relacional (ROLAP)



OLAP Multidimensional (MOLAP)



Almacenamiento con técnicas multidimensionales
Acceso rápido a datos sumados previamente
OLAP Híbrido (HOLAP)


Usa un esquema relacional para manejar la navegación y
administrar los datos consolidados
Gran escalabilidad
Bajo nivel ROLAP, Alto nivel MOLAP
Motores de BD especializados

Manejan consultas con esquemas estrella o copo de nieve
Descargar

Ciclo de Vida - materia