U.N.C
Proyecto Pentaho
Del Giudice & Della Mea
Introducción
La Universidad Nacional de Córdoba (UNC) es la más antigua universidad pública argentina
y es, en la actualidad, la segunda universidad del país con mayor cantidad de alumnos
docentes y facultades.
El volumen de información que maneja es muy elevado, por lo que para apoyar
la toma de decisiones ha implementado el concepto de Business Intelligence y
datawarehouse
Utilizando los software BI
O3
Pentaho
Del Giudice & Della Mea
Proyecto Pentaho U.N.C
Pilaga
Soluciones otorgadas por
el SIU
Mapuche
Guaraní
Actualmente en la U.N.C el proyecto Pentaho está
implementado sobre la parte académica.
Del Giudice & Della Mea
Proyecto Pentaho U.N.C
Cubos de Guaraní implementados
05_AlumnosAraucano
02_RendimientoAcademico
03_Procedencia
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
Modificaciones necesarias para adaptar las soluciones
del SIU a la UNC
A nivel ETL
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
05 Alumnos Araucano
 Se realizan cambios para agrupar la dimensión Carreras por Unidad
Académica, modificándose las bases de datos dsa y dw.
Base DSA
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
Base DW
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
 Se realizan cambios a nivel etl a fin de agrupar la dimensión títulos por
Unidad Académica, modificándose las bases dsa y dw.
Base DSA
Base DW
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
 Para referenciar a valores erróneos o nulos relativos a la dimensión Títulos,
se crean los valores “Sin titulo asociado” por cada UA.
Los cambios se realizaron en la transformación dsa_guarani_cargar_nulos_en_dimensiones,
modificándose el insert correspondiente:
 En caso de tener valores erróneos o nulos en la dimensión carrera, se
deberán crear los valores “Sin carrera asociada” por UA.
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
 Se crea la medida Total Alumnos a nivel ETL, agregándose a la tabla
gua_dw_ft_alumnosarau, con la finalidad de no calcular su valor cada vez
que se efectúa una consulta.
Base DW
 Se ejecuta primero el trabajo “cargar_nulos_en_dimensiones” y despues la
transformacion “gua_dsa_ft_alumnosarau”
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
 En la transformacion gua_dsa_ft_alumnosarau se modifica el select que
carga la tabla de hechos.
• Donde:
• El join con la dimensión carrera se realiza mediante carrera_id_gua y
unidadacademica_id (pueden haber UA q compartan el mismo id de
carrera)
• El join con la dimensión titulo se realiza mediante tituloaraucano_id_gua y
unidadacademica_id (pueden haber UA q compartan el mismo id de
titulo)
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
03 Procedencia
 Se utiliza la dimensión carreras, según lo explicado anteriormente (Carreras
con el detalle de la Unidad Académica)
 En la transformación gua_dsa_ft_procedenciaaspirantes se modifica el
select que carga la tabla de hechos.
Donde:
• El join con la dimensión carrera se realiza mediante carrera_id_gua y
unidadacademica_id (pueden haber UA q compartan el mismo id de carrera).
• El join con la dimensión periodosinscripcion se realiza mediante periodoinscripcion y
anioacademico.
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
select ltu.unidadacademica_id,
ltp.periodoinscripcion_id,
ltc.carrera_id,
ltpro.procedencia_id,
ltsit.situacionaspirante_id,
lts.sexo_id,
ft.cantidad,
current_date as fechacarga
from guarani_tmp.gua_dsa_ft_procedenciaaspirantes ft
left outer join guarani.gua_dsa_ids_lt_unidadesacademicas ltu on
(ft.unidadacademica_id=ltu.unidadacademica_id_gua and ltu.vigente='Y')
left outer join guarani.gua_dsa_ids_lt_periodosinscripcion ltp on
(ft.periodoinscripcion=ltp.periodoinscripcion_desc and ft.anioacademico=ltp.anioacademico and ltp.vigente='Y')
left outer join guarani.gua_dsa_ids_lt_carreras ltc on
(ft.carrera_id=ltc.carrera_id_gua and ltu.unidadacademica_id = ltc.unidadacademica_id and ltc.vigente='Y')
left outer join guarani.gua_dsa_ids_lt_procedencia ltpro on
(ft.colegio_id=ltpro.colegio_id_gua and ltpro.vigente='Y')
left outer join guarani.gua_dsa_ids_lt_situacionesaspirantes ltsit on
(ft.situacionasp_id=ltsit.situacionasp_id_gua and ltsit.vigente='Y')
left outer join guarani.gua_dsa_ids_lt_sexos lts on
(ft.sexo_id=lts.sexo_id_gua and lts.vigente='Y')
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
02 Rendimiento Académico
 Se modifica la dimensión plan, a fin de que en la misma exista el detalle de la
UA, la carrera y el plan correspondiente.
Base DW
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
 Se realizan las modificaciones necesarias en la dimensión Materias a fin de
poder agruparlas por Unidad Académica a nivel de XML.
Base DW
 Se modifican las dimensiones cátedra y comisión a fin de que el join con
materia se realice por materia_id y unidadacademica_id para todos los casos.
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
 Se modifica la transformación gua_dsa_lt_periodosanioacad, obteniéndose los
periodos de años académicos correspondientes a las 3 tablas de hechos del
cubo 02 (ft_examen, ft_cursado y ft_equivalencia ).
 En las transformaciones ft_cursado, ft_equivalencia y ft_examen se considera
que:
 El join con carrera debe realizarse por carrera y unidad académica
 El join con materia debe realizarse por materia y unidad académica
Ejemplo:
join guarani.gua_dsa_ids_lt_materias ltm on (ft.materia_id=ltm.materia_id_gua and
ft.unidadacademica_id = ltm.unidadacademica_id_gua and ltm.vigente='Y')
join guarani.gua_dsa_ids_lt_carreras ltc on (ft.carrera_id=ltc.carrera_id_gua and
ltu.unidadacademica_id = ltc.unidadacademica_id and ltc.vigente='Y')
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
A nivel general en el ETL
 En la carga de cada FT, se realizan los group by correspondientes a fin de que
no hayan registros duplicados para las tuplas que conforman la Primary Key en
la base datawarehouse.
A nivel de bases de datos
 Se crean Primary Key en las FT y en las dimensiones de la base de datos
Datawarehouse
 También se crean índices en las FT a fin de agilizar las consultas realizadas por
distintas dimensiones.
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
Modificaciones necesarias para adaptar las soluciones del SIU a la UNC
XML
05 Alumnos Araucano
Se agrupa la dimensión carreras
por Unidad Académica, creando el
primer nivel con las unidades
académicas y dejando en un segundo
nivel las carreras.
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
Se agrupa la dimensión títulos
por Unidad Académica, creando
el primer nivel con las unidades
académicas y dejando en un
segundo nivel los títulos.
Se cambia el miembro calculado
Alumnos(NI+RI) por una medida y se
establece que será igual a la suma de
los valores del campo “totalalumnos”
de la base de datos (creado
previamente durante el ETL).
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
03 Procedencia
 Se agrupa la dimensión carreras por Unidad Académica, creando el primer
nivel con las unidades académicas y dejando en un segundo nivel las carreras.
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
02 Rendimiento Académico
Se agrupa la dimensión carreras por
Unidad Académica, creando el primer
nivel con las unidades académicas,
dejando en un segundo y tercer nivel las
carreras y el plan.
Del Giudice & Della Mea
Adaptación de las soluciones del SIU
 Se agrupa la dimensión materias por Unidad Académica, creando el primer
nivel con las unidades académicas y dejando en un segundo nivel las materias.
Del Giudice & Della Mea
Roles de Mondrian
Se decidió mantener solo un esquema contenedor de los cubos de
guaraní, alimentándose de una base de datos consolidada (con los
datos de todas las dependencias)
Utilizando roles de Mondrian para dar permiso de acceso a cada
facultad en particular
Donde a cada rol se le asigno diferentes niveles de permisos a la
información por cubo, según la unidad académica a la que se
pertenece (creando así “vistas” de los cubos consolidados).
Del Giudice & Della Mea
Roles de Mondrian
 Los roles se mostraran, utilizando como ejemplo la “Facultad de Ciencias Químicas”
Pasos realizados:
 Se creó cada rol y se definió la opción “access all”, a fin de darle permiso total
al esquema.
 Se agregaron, a cada rol, los cubos de guaraní:
 Alumnos
 Procedencia
 Cursado
 Examen
 Equivalencia
 Rendimiento Académico
Del Giudice & Della Mea
Roles de Mondrian
 Se creó, en cada cubo, una jerarquía por dimensión a la cual se le restringió el
acceso (estableciendo la propiedad access custom) y se determino que las
jerarquías tendrán un solo miembro, con acceso total (all), indicándolo
mediante la estructura [Dimension].[Nivel]
Del Giudice & Della Mea
Roles de Mondrian
Del Giudice & Della Mea
Roles de Mondrian
 Para los cubos Cursado, Examen y Equivalencia, solo se limito a prohibir el
acceso (Access none). Esto se hace ya que inicialmente se desea mostrarles a
los usuarios las soluciones lo más similar al software O3, actualmente en uso.
Del Giudice & Della Mea
Roles de Mondrian
Cubos 03 (Procedencia)
 Jerarquía Unidad Acad y Depto  [Unidad Acad y Depto].[ Facultad de Ciencias Químicas]
 Jerarquía Carrera  [Carrera].[ Facultad de Ciencias Químicas]
Cubo 02 (Rendimiento Académico)
 Jerarquía Unidad Académica  [Unidad Academica].[ Facultad de Ciencias Químicas]
 Jerarquía Carreras  [Carreras].[ Facultad de Ciencias Químicas]
 Jerarquía Materias  [Materias].[ Facultad de Ciencias Químicas]
Del Giudice & Della Mea
Correspondencia Roles de Mondrian (XML) con Roles de Usuarios
(Consola administrativa)
Finalmente para lograr la relación entre los roles de mondrian (XML)
y los roles de usuarios, se crean la misma cantidad de roles en la
consola administrativa que los existentes en el xml.
Estos se hacen corresponder, estableciéndoles el mismo nombre en
la consola que en el XML y asignándoles luego dichos roles a los
usuarios.
De esta forma cada uno verá solo la información perteneciente a su
facultad, de acuerdo a lo los permisos determinados en el esquema.
Del Giudice & Della Mea
Paquete de soluciones – SIU
 Las vistas, reportes y tableros del SIU fueron respetados en su mayoría, solo
en pocos casos fue necesario modificar la forma de visualizar el indicador,
debido a la cantidad de datos.
 Al implementar roles de Mondrian, las vistas se filtran automáticamente,
de acuerdo al usuario logueado.
 Los tableros y reportes (al utilizar consultas sql y no mdx), deben ser
filtradas desde la configuración interna, mediante parámetros.
Este tema se mostrara con más detalle, durante la exploración de las
soluciones, desde el servidor de Pentaho en producción.
Del Giudice & Della Mea
Acceso y Navegación de los cubos
 Las soluciones desarrolladas en Pentaho pueden ser
accedidas y navegadas por los usuarios mediante cualquier
web browser de internet.
 La URL correspondiente al servidor de Pentaho es:
http://pentaho.unc.edu.ar/pentaho
Del Giudice & Della Mea
Conclusión
 Pentaho es una gran herramienta para la obtención y
análisis de datos, siendo una solución completa y flexible
que permite cubrir ampliamente las necesidades de
información de forma rápida y eficientemente, para apoyar
el proceso de toma de decisiones.
Del Giudice & Della Mea
Preguntas
¿…?
Del Giudice & Della Mea
¡Muchas
gracias por su
atención!
Del Giudice & Della Mea
U.N.C
Proyecto Pentaho
Del Giudice & Della Mea
Descargar

Metal Silver - Proyectos SIU