Modelando los Hábitos de
Consumo Televisivo
usando Tecnología Semántica
Mauricio Espinoza-Mejía, Víctor Saquicela
Departamento de Ciencias de la Computación
Grupo de Investigación en Gestión del Conocimiento
Universidad de Cuenca, Ecuador
IX Congreso de Ciencia y Tecnología ESPE 2014,
28 -30 Mayo, 2014
Contenido
•
•
•
•
•
•
•
Motivación
Contribución de nuestra propuesta
Qué es una ontología?
Retos modelación semántica
Especificación de Requerimientos
Modelamiento del Perfil de Usuario
Conclusiones y trabajo futuro
2
Motivación
• Migración de la TV analógica a digital
• Más canales en el mismo ancho de
banda.
• Aplicaciones mezcladas con contenido
audiovisual.
Sobrecarga de información
“exceso de información sobre un tema
genera dificultades para comprenderlo”
Ejemplo: Web
3
Motivación
• Meta: Sistemas de recomendación
• facilite la selección de contenidos
• provea interfaces fáciles de usar
• Sistemas de recomendación para TV
•
•
•
•
técnicas de minería de datos
basados en contenidos
filtrado colaborativo
técnicas de la Web semántica, etc.
4
Motivación
• Dificultades de las propuestas
• recomendaciones limitadas
• requiere información histórica
• recomendaciones se basan en las
elecciones pasadas
• dependen exclusivamente de los recursos
disponibles a priori
5
Contenido
•
•
•
•
•
•
•
Motivación
Contribución de nuestra propuesta
Qué es una ontología?
Retos modelación semántica
Especificación de Requerimientos
Modelamiento del Perfil de Usuario
Conclusiones y trabajo futuro
6
Contribución de nuestra propuesta
• Uso de tecnología semántica para
razonar:
• Programación TV
• Preferencias Usuarios
• Ontologías dominio creadas a propósito o
descubiertas en línea
• Recursos externos
•
•
•
•
redes sociales
bases de datos de películas
repositorios de guías de programación
SPARQL endpoints
7
Contribución de nuestra propuesta
Víctor Saquicela, Mauricio Espinoza-Mejía, Jezreel Mejía,Boris Villazón-Terrazas, Reduciendo la Sobrecarga de
Información en Usuarios de Televisión Digital, ENC 2013, Workshop on Semantic Web and Linked Open Data,
México, octubre 2013
8
Contenido
•
•
•
•
•
•
•
Motivación
Contribución de nuestra propuesta
Qué es una ontología?
Retos modelación semántica
Especificación de Requerimientos
Modelamiento del Perfil de Usuario
Conclusiones y trabajo futuro
9
Qué es una ontología?
conceptual model
of a domain
(ontological theory)
unambiguous
terminology definitions
Formal, explicit specification of a shared conceptualization
[Gruber93]
machine-readability
with computational
semantics
commonly accepted
understanding
10
[Gruber93]
Estructura de una Ontología
Conceptos
Entidad conceptual del dominio
Atributos
name
Propiedad de un concepto
Relaciones
Person
student
nr.
Relaciones entre conceptos o
propiedades
email
research
field
isA – hierarchy (taxonomy)
Student
Axiomas
Professor
attends
descripción coherente entre
Conceptos / Propiedades /
Relaciones través de
expresiones lógicas
holds
Lecture
lecture
nr.
topic
holds(Professor, Lecture)  Lecture.topic  Professor.researchField
11
Contenido
•
•
•
•
•
•
•
Motivación
Contribución de nuestra propuesta
Qué es una ontología?
Retos modelación semántica
Especificación de Requerimientos
Modelamiento del Perfil de Usuario
Conclusiones y trabajo futuro
12
Retos de la Modelación Semántica: Preferencias Usuarios
Tres aspectos:
• la identificación de los datos a ser modelados y su
formato de representación,
• la determinación de las fuentes de información más
apropiadas para la extracción de las preferencias
• el uso adecuado de este conocimiento para filtrar la
información más relevante para el usuario.
13
Modelación del Perfil del Usuario
Dos desafíos principales
• la necesidad de conocimiento predefinido del dominio
Cuáles con sus intereses?
Qué edad tiene?
Cuáles son su habilidades?
…..
• correspondencias entre la descripción del contenido y la
información semántica en la ontología
Qué peliculas ha visto?
Qué observa los fines de semana?
Qué edad tiene?
Cuáles son su habilidades?
…..
14
Contenido
•
•
•
•
•
•
•
Motivación
Contribución de nuestra propuesta
Qué es una ontología?
Retos modelación semántica
Especificación de Requerimientos
Modelamiento del Perfil de Usuario
Conclusiones y trabajo futuro
15
Especificación de Requisitos: IS
• Uno de los procesos clave en el desarrollo de software es
la especificación del software
• Entender y definir las funcionalidades de un producto de software
• Documento de especificación de requisitos
• acuerdo entre los clientes y proveedores sobre lo que el
software va a hacer
• reducción del esfuerzo de desarrollo
• base para estimación de costos y cronogramas
• línea de base para la validación y verificación.
16
Especificación de Requisitos: Estado del Arte
• Estado del arte en ingeniería ontológica
• Mayoría metodologías proponen una fase de especificación de
requisitos.
• METHONTOLOGY
• On-To-Knowledge
• Grüninger and Fox’s methodology
» No proveen guías detalladas sobre qué realizar en
cada paso
» Qué es necesario para un buen documento de
espeficicacion de requisitos
• Neon Methodology
• Filling card: definición, meta, entrada, salida, cuándo y quién
• Workflow: entradas, salidas, actores
• ORSD
17
Especificación de Requisitos: NeOn Methdology
18
Especificación de Requisitos: Secciones 1-3 del ORSD
• Posibles usuarios y expertos del dominio
• Lluvia de ideas  miembros del equipo de trabajo.
19
Especificación de Requisitos: Secciones 4-5 del ORSD
• Entrevistas con los posibles usuarios y expertos del
dominio.
• Los casos de uso identificados para el desarrollo del
sistema de recomendación.
20
Especificación de Requisitos: Sección 6 del ORSD
• futuros usuarios del
sistema de
recomendación y no
expertos del
dominio
• técnica de
preguntas de
competencia
• preguntas en
lenguaje natural que
la ontología debe ser
capaz de responder
21
Especificación de Requisitos: Sección 7 del ORSD
Pre-glosario de términos
• términos extraídos de las preguntas de competencia
• términos de las respuestas a las preguntas
• términos identificados como nombres de entidades (objetos)
• Técnicas heurísticas de extracción de terminología
• nombres, adjetivos y verbos
• conceptos, atributos, relaciones o instancias (en el caso de
nombres de entidades).
22
Especificación de Requisitos: Sección 7 del ORSD
Metodología
•
•
usar los términos con la frecuencia
más alta
dirigir la búsqueda de recursos
existentes
Categorías
•
Información del Televidente
•
•
•
•
•
Tópicos de Preferencias
•
•
rock, videojuegos
Actividades
•
•
diferentes dominios
Intereses
•
•
información básica del usuario
información profesional
características propias del usuario
habilidades
Interacción televidente
Tiempo y Lugares
•
contexto espacio-temporal
23
Contenido
•
•
•
•
•
•
•
Motivación
Contribución de nuestra propuesta
Qué es una ontología?
Retos modelación semántica
Especificación de Requerimientos
Modelamiento del Perfil de Usuario
Conclusiones y trabajo futuro
24
Modelamiento del Perfil de Usuario
No se puede hablar de una ontología estándar
Las ontologías son específicas a la aplicación
Proceso de Construcción de la Ontología
• Top-Down
• independientes del dominio (usando ontologías de alto nivel)
• ser reutilizables en múltiples sistemas
• Neon Methodology: escenario seis - reusando, fusionando
y ejecutando reingeniería de recursos ontológicos
• Premisa: desarrolladores tienen recursos ontológicos a reusar
• Los recursos son fusionados para crear un nuevo modelo
• La fusión no es suficiente, proceso de reingenería es requerido
25
Modelamiento del Perfil de Usuario: Escenario Seis
• Búsqueda de Ontologías
• Comparación de las Ontologías
• Selección de las Ontologías
• Personalización e Integración de las Ontologías
Seleccionadas
• Evaluación de la Ontología Resultante
26
Búsqueda de Ontologías
• Búsqueda de Ontologías
• ontologías que reunan los requisitos del ORSD
• Watson (http://watson.kmi.open.ac.uk/)
• Swoogle (http://swoogle.umbc.edu/)
• Sindice (http://sindice.com/)
• librerías de ontologías
• Protégé Ontology Library
(http://protegewiki.stanford.edu/wiki/Protege Ontology Library)
• estándares que definan tipos de competencia e intereses de un
usuario en sitios Web de alta fiabilidad.
27
Búsqueda de Ontologías
28
Comparación de las ontologías
• Ontologías no apropiadas a ser reutilizadas
• Comprobar el alcance y propósito establecido en el ORSD
• Los requisitos no funcionales estén cubiertos
• Los requisitos funcionales en forma de preguntas de competencia
incluidos en ORSD son cubiertas (total o parcialmente)
• Heurísitica
• Si el desarrollador contestó No a los criterios
• “Alcance similar” y/o “Propósito similar” y/o “Requerimientos
Funcionales cubiertos”
• Ontología considerada no útil
29
Selección de las ontologías
Analizaron cuatro dimensiones
•
•
•
•
Costo de Reutilización.
Esfuerzo de Comprensión.
Esfuerzo de Integración.
Confiabilidad.
cada una de las dimensiones tiene un conjunto de criterios
que permiten obtener un puntaje para cada ontología
candidata
30
Selección de las ontologías
Los pesos
• definidos por el equipo de
trabajo
• símbolos (+) y (-) criterio se
cuenta de manera positiva o
negativa
31
Personalización e Integración de las Ontologías
• Algunas actividades fueron ejecutadas en los
recursos ontológicos seleccionados
• Podar las ontologías de acuerdo a las necesidades
• GUMO  personality
• Enriquecer la ontología a ser reusada
• Agregar conceptos
• Adaptar las ontologías seleccionadas
• convenciones de nombrado de términos
• Incluir conexiones a través de relaciones entre clases
• ontología sobre la información básica de la persona con
la ontología que describe la localidad de residencia del
usuario se usó la propiedad viveEn (liveIn).
32
Evaluación de la Ontología
• Comprobar la calidad técnica de la ontología construída.
• Únicamente se ha comprobado que la ontología no
contenga errores de sintaxis.
• Trabajo en ejecución la evaluación de posibles errores de
•
•
•
•
diseño,
estructura y
calidad semántica.
localización de la ontología
• LabelTranslator Neon Toolkit
33
Retos de la Modelación Semántica: Preferencias Usuarios
Tres aspectos:
• la identificación de los datos a ser modelados y su
formato de representación,
• la determinación de las fuentes de información más
apropiadas para la extracción de las preferencias
• el uso adecuado de este conocimiento para filtrar la
información más relevante para el usuario.
34
Captura del Perfil
• la determinación de las fuentes de información más
apropiadas para la extracción de las preferencias
• implícitos
• seguimiento del comportamiento del usuario -interacción
con el televisor
• captura de las anotaciones efectuadas en redes sociales
• explícitos
• aplicación Web
35
Uso del Perfil
• el uso adecuado de este conocimiento para filtrar la
información más relevante para el usuario.
Base de Conocimiento
• Mauricio; gusta; Adam Sandler
• Mauricio; ha_visto; ‘Una esposa de mentira‘
• ‘Una esposa de mentira‘; dirigida_por; Dennis Dugan
Recomendador
• Mauricio se_recomienda_ver “Jack y Jill” dirigida_por
Dennis Dugan y protagonizada_por Adam Sandler.
Resultado
• presentado al usuario mediante una aplicación
interactiva que haga uso del canal de retorno
36
Conclusiones y Trabajos Futuros
• Tecnologías Web Semántica pueden ser usados en el
contexto de TV.
• Ontologías son útiles para compartir y reutilizar conocimiento.
• Disminuir el arranque en frío del sistema de recomendación
• mediante inferencia
• Enriquecer la experiencia del usuario
• ofreciendo información adicional del tema tratado
• Localizar Ontología  Labeltranslator  NeOnToolkit
• Medir la usabilidad y la calidad de la modelación
• Usar la Web social como fuente de información para
capturar el perfil de un usuario
37
Gracias por su atención
Mauricio Espinoza Mejía
[email protected]
Universidad de Cuenca
Cuenca, Ecuador
38
Descargar

Multilingual and Localization Support for Ontologies