SERGEN: Servidor General para
la Biblioteca Digital de la
Universidad de las Américas Puebla
Héctor Cocoletzi Moreno
Asesor: Dr. Alfredo Sánchez
Índice
• Introducción
– Esquema de la Biblioteca Digital
• Problema
• Objetivos Generales
• Servicios
– Búsqueda y Recuperación de Información
– Navegación Taxonómica
– Otros Servicios
Introducción
• Construcción de un acervo digital por parte de
la Biblioteca de la UDLA-P
• Desarrollo de aplicaciones y/o ambientes que
dependen del acervo digital
–
–
–
–
Sistemas de Recomendación
Reserva Digital
Ambientes Personalizados
Agentes Móviles
Esquema de la Biblioteca Digital
Problema
• Existen diversas aplicaciones a desarrollar
cuya operación depende del acervo digital
• Cada aplicación requiere de protocolos de
comunicación con el acervo
• Las aplicaciones tienen en común algunas
funcionalidades
– Mecanismos de Búsqueda y Recuperación de
información
• Espacios Vectoriales
• Búsqueda Booleana Extendida
Objetivos Generales
• Establecer un protocolo de intercomunicación
entre aplicaciones (KQML, JINI o CORBA)
• Diseñar e implementar un servidor general que
provea servicios comunes, robustos y
confiables a aplicaciones y/o ambientes que
hagan uso de la Biblioteca Digital de la
UDLA-P
Objetivos Específicos
• Diseñar e implementar el protocolo de
comunicación interagentes en una
Biblioteca Digital (MICK) [Barceinas,
1998]
• Implementar técnicas de búsqueda y
recuperación de información como Espacios
Vectoriales y Búsqueda Booleana Extendida
[Pérez, 1998].
Búsquedas y Recuperación de
Información
• Espacios Vectoriales
– Documentos representados en una matriz
bidimensional
• Renglones -> documentos
• columnas -> términos contenidos en documentos
– Entrada: vector de términos de consulta
– Salida: términos de la base de datos más pegados
a los de consulta
– Criterio: ángulo de diferencia entre términos de
consulta y términos de las base de datos
Búsquedas y Recuperación de
Información...
• Búsqueda Boolena Extendida
– Técnica aplicada a consultas con conectivos
lógicos “and” y/o “or”
– Les asigna peso a los operaciones lógicas
realizadas
– Hace uso de criterios matemáticos para
determinar el grado de similitud entre términos
Navegación Taxonómica
• Problema:
– existen diversas taxonomías o clasificaciones en la
Biblioteca Digital: Biblioteca del Congreso
(UDLA), Dewey, personales, etc.
• Las clasificaciones son jerárquicas y están
representadas como tuplas en la Base de
Datos.
• Objetivo:
– encontrar una forma de recorrer las diversas
taxonomías sin problemas
Otros Servicios
• Visualización aplicada a recuperación de
documentos de texto
• Indización Semántica aplicada a documentos
• Otras técnicas de Búsqueda y Recuperación de
información
– Búsqueda Booleana
– Método Probabilístico
• Reconocimento de Caracteres en Paralelo
• Mecanismos de Consulta a Imágenes
• Traducción automática de descripciones de libros
Calendario de Actividades
Para más información
• Página personal
– http://ict.udlap.mx/people/hector
Bibliografía
• Barceinas, A. 1998. MICK: Un Marco de Comunicación Interagentes en
una Biblioteca Digital. Laboratorio de Tecnologías Interactivas y
Cooperativas, Universidad de las Américas – Puebla. Cholula, Pue. 72820,
México
• Cabrera, J. 1997. Integración de Servicios y Agentes de Usuario en la
Recuperación de Información en una Biblioteca Digital. Tech. Rep. No.
ICT-97-2. Laboratorio de Tecnologías Interactivas y Cooperativas,
Universidad de las Américas-Puebla, Cholula, Pue. 72820, Mexico
• Emmerich, W. 1997. An Introduction to OMG / CORBA Proceedings of
the 1997 international conference on Software engineering. 641–642
• Pérez, C. V. 1998. Agentes móviles en bibliotecas digitales. Tech. Rep. No.
ICT-98-8. Laboratorio de Tecnologías Interactivas y Cooperativas,
Universidad de las Américas-Puebla, Cholula, Pue. 72820, Mexico.
(Disponible en http://ict.udlap.mx/pubs).
• Waldo, J. 1999. The Jini architecture for network-centric computing.
Communications of the ACM. Vol. 42 No. 7, 76-82, julio
Conceptos Básicos
• Definición de Biblioteca Digital
– Grandes depósitos de grandes colecciones
hetereogéneas (multimedios, diferentes
formatos y tamaños de datos) [Sánchez, 1999]
– “Es un ensamblaje de cómputo digital,
mecanismos de comunicación y software
necesario para reproducir, emular y extender los
servicios provistos por bibliotecas
convencionales como son la colección,
catalogación, búsqueda y diseminación de la
información”. Gladney citado en [Pérez, 1998]
Conceptos Básicos...
• KQML (Knowledge Query Manipulation
Language)
– lenguaje de comunicaciónbasado en la teoría
de actos del habla, usada en sistemas
multiagentes para construir una capa
lingüística y formalizar las acciones
lingüísticas de los agentes
– sus mensajes además de comunicar oraciones,
comunican una actitud acerca del contenido
(por ejemplo, afirmación, solicitud, pregunta)
– se divide en tres capas: contenido, mensaje y
comunicación
Conceptos Básicos...
• CORBA (Common Object Request Broker
Architecture)
– se crea con el objetivo de simplificar el
desarrollo de aplicaciones distribuidas y de
proveer bases flexibles para servicios de más
alto nivel.
– es una especificación para una arquitectura
estándar orientada a objetos para aplicaciones
– utliza a los objetos como una metáfora de
unificación para lograr poner todas las
aplicaciones existentes dentro de un mismo
canal y así permitir una interoperatividad
Conceptos Básicos...
• JINI
– arquitectura que provee una infraestructura para
definir, propagar y encontrar servicios en una
red
– diseñada para soportar actualizaciones
incrementales de componentes de red
(hardware y software)
– reemplaza la noción de periféricos y
aplicaciones con la de servicios en red y
clientes que usan esos servicios
– definida en términos del lenguaje Java
JINI y CORBA: algunas
características
• JINI
– facilitala integración de
aplicaciones de tipo
distribuido
– requiere que el cliente
y el servidor estén
implementados en Java
– conserva las
características de Java
• CORBA
– facilita la integración de
aplicaciones de tipo
heterogéneo y
distribuido
– permite la independencia
de plataforma, sistema
operativo y lenguaje de
programación entre el
cliente y el servidor
JINI y CORBA: algunas
características...
• JINI
– fomenta el “plug and
play” para los servicios
en red
– sus componentes
pueden verse como una
extensión de Java
– promueve una
arquitectura basada en
servicios
• CORBA
– facilita la reusabilidad
y portabilidad de
componentes de las
aplicaciones
– soporta diversos
lenguajes de
programación
orientada a objetos con
sus características
Descargar

Presentación Formal Tesis I - ICT