Recuperación de
Información
MC Beatriz Beltrán Martínez
Primavera 2015
Primavera 2015
FCC - BUAP
• Los sistemas pueden almacenar los datos tanto
interna (en la memoria) como externamente (en
los dispositivos de almacenamiento).
• Internamente, las instrucciones o datos pueden
almacenarse por un tiempo en los chips de silicio
de la RAM (memoria de acceso aleatorio).
• Externamente,
los
dispositivos
de
almacenamiento secundarios o auxiliares, los
cuales son capaces de conservar la información
de manera permanente.
MC Beatriz Bletrán Martínez
Almacenamiento de
Información
2
Primavera 2015
FCC - BUAP
• Los sistemas de almacenamiento se han
convertido en un aspecto singular y complejo.
• La tecnología de almacenamiento actual engloba
todo tipo de soportes.
• Se tiene, por ejemplo, sistemas WORM,
bibliotecas de cintas y bibliotecas virtuales.
• En los últimos años, los sistemas SAN y NAS han
demostrado su excelente fiabilidad.
MC Beatriz Bletrán Martínez
Tecnologías de
almacenamiento
3
Primavera 2015
FCC - BUAP
• Las unidades SAN (Storage Area Network)
pueden ser armarios enormes; algunos pueden
tener 240 discos duros. Estos grandes sistemas
con más de 50 terabytes de capacidad hacen
más que sólo activar cientos de discos duros.
• Las unidades NAS (Network Attached Storage)
son unidades independientes que cuentan con
sistemas operativos y de archivos propios y
gestionan los discos duros que llevan
conectados.
MC Beatriz Bletrán Martínez
Tecnologías de
almacenamiento
4
Primavera 2015
FCC - BUAP
• Desde hace bastante tiempo, el almacenamiento
a gran escala no ha estado al alcance de la
pequeña empresa. Los sistemas de discos duros
SAN Serial ATA (SATA) se están convirtiendo en
una manera rentable de disfrutar de gran
capacidad de almacenamiento.
• Otras tecnologías de almacenamiento, como
iSCSI, DAS (Direct Attached Storage), Near-Line
Storage (datos adjuntos en soportes extraíbles) y
CAS (Content Attached Storage), también
proporcionan disponibilidad.
MC Beatriz Bletrán Martínez
Tecnologías de
almacenamiento
5
• Se han generado varias herramientas en
tecnología para la recopilación, estructuración,
administración, almacenamiento y explotación
de estos datos.
Primavera 2015
FCC - BUAP
• A través de los años las organizaciones privadas
como públicas, generan miles de datos en sus
actividades diarias.
MC Beatriz Bletrán Martínez
Sistemas de almacenamiento
de Información
6
Primavera 2015
FCC - BUAP
• Los sistemas que manejan datos, como Bases de
datos, Data-Warehouse, Meta-Dato, DataMining, Cloud entre otros, son utilizados para
registrar datos, con una estructura lógica,
organizada y almacenada para su explotación, la
cual puedan usar personas con un perfil
predefinido para explotar cierta información y
puedan buscar, recuperar y actualizar esta
información.
MC Beatriz Bletrán Martínez
Sistemas de almacenamiento
de Información
7
Primavera 2015
FCC - BUAP
• Es un conjunto de datos relacionados
coherentemente que generan información.
• La información esta organizada y almacenada,
para su explotación.
• Los usuarios puedan buscar, recuperar y
actualizar los datos que necesitan, debe
responder a consultas formuladas, con una
expresión lógica sobre la información.
• La identificación de un subconjunto lógico de la
base de datos, es decir, una selección de
registros que cumplen la condición lógica.
MC Beatriz Bletrán Martínez
Bases de Datos
8
• Debe entregar la información correcta a la gente
indicada en el momento adecuado en el formato
correcto.
Primavera 2015
FCC - BUAP
• Funciona con grandes cantidades de información
que se subdividen a veces en unidades lógicas
más pequeñas, llamadas los centros comerciales
(DataMarts), dependientes de los datos.
MC Beatriz Bletrán Martínez
Data Warehouse
9
Primavera 2015
FCC - BUAP
• El Almacén de Datos da respuesta a las
necesidades de usuarios conocedores, utilizando
Sistemas de ayuda en la decisión (DSS), Sistemas
de información ejecutiva (EIS) o herramientas
para hacer consulta o informes.
• Los usuarios finales fácilmente pueden hacer
consultas sobre sus Almacenes de Datos sin
tocar o afectar la operación del sistema.
MC Beatriz Bletrán Martínez
Data Warehouse
10
• Metadatos administrativos: Su función es
gestionar y administrar los recursos digitales.
• Metadatos descriptivos: Su función es
representar e identificar los recursos digitales.
Primavera 2015
FCC - BUAP
• Sus funciones principales son la localización,
identificación y descripción de recursos, legibles
e interpretables a través de una computadora,
algunos metadatos utilizados son:
MC Beatriz Bletrán Martínez
Meta Datos
11
Primavera 2015
FCC - BUAP
• Metadatos para la conservación: para
preservar los recursos de información.
• Metadatos técnicos: Su función es informar
sobre los requerimientos técnicos del
hardware o software
• Metadatos de uso: su función es informar
sobre el nivel de utilización, tipo de usuarios,
etc.
MC Beatriz Bletrán Martínez
Meta Datos
12
Primavera 2015
FCC - BUAP
• Su función principal permite transformar la
información disponible en conocimiento útil de
negocio.
• Establece por lo tanto vía clave de explotación
del Data Warehouse, dado que es este su
entorno natural de trabajo.
• Data-Mining es un proceso para extraer
información útil a partir de grandes cantidades
de datos.
• Permite transformar la información disponible
en conocimiento útil de negocio.
MC Beatriz Bletrán Martínez
Data Mining
13
Primavera 2015
FCC - BUAP
• Análisis de la Varianza: Diferencias significativas.
• Regresión: Define la relación entre variables.
• Cuadrado: Reduce el número de variables.
• Análisis cluster: Para clasificar una población.
• Análisis discriminante: método de clasificación.
• Métodos en árboles de decisión, Algoritmos
genéticos, Redes neuronales, Lógica difusa,
Series temporales.
MC Beatriz Bletrán Martínez
Data Mining
14
Primavera 2015
FCC - BUAP
• La nube es un avance en el suministro de
tecnología de la información y los servicios,
proporciona acceso bajo demanda a un conjunto
compartido de recursos informáticos, de forma
dinámica a escala, ofrece interesantes ventajas
en costes, rapidez y eficiencia.
• Función principal es almacenar datos base de
datos como servicio (DBaaS), específicamente en
torno a la información confidencial que se
almacena en la nube y sus alrededores.
MC Beatriz Bletrán Martínez
Cloud
15
Primavera 2015
FCC - BUAP
• El término recuperación de información, fue
utilizado por primera vez en el año de 1950, por
Calvin N. Moores.
• Se definió como: “La búsqueda de información
en un stock de documentos, efectuada a partir
de la especificación de un tema”.
• Salton en 1983, define: “La recuperación de la
información tiene que ver con la representación,
almacenamiento, organización y acceso a los
ítem de información”.
MC Beatriz Bletrán Martínez
Sistemas de Recuperación de
Información
16
Primavera 2015
FCC - BUAP
• Salton indica que, en principio, no deben existir
limitaciones a la naturaleza del objeto
informativo y Baeza-Yates incorpora la reflexión
siguiente: “La representación y organización
debería proveer al usuario un fácil acceso a la
información en la que se encuentre interesado.
Desafortunadamente, la caracterización de la
necesidad informativa de un usuario no es un
problema sencillo de resolver”.
MC Beatriz Bletrán Martínez
Sistemas de Recuperación de
Información
17
Primavera 2015
Recuperación de
información
Parcial, el mejor
Inductiva
Posibilístico
Estructurado
o
Natural
FCC - BUAP
Recuperación de
datos
Acierto
Exacto
Inferencia
Algebraica
Modelo
Determinístico
Lenguaje
de Fuertemente
consulta
Estructurado
Especificación
Precisa
consulta
Error en la
Sensible
respuesta
MC Beatriz Bletrán Martínez
Sistemas de Recuperación de
Información
Imprecisa
Insensible
18
Documentos
Relevantes
Recuperación
Documentos
Primavera 2015
FCC - BUAP
Base de Datos
Necesidad de
Información
MC Beatriz Bletrán Martínez
Sistemas de Recuperación de
Información
Documentos
no Relevantes
19
Primavera 2015
Descripción
Incluye los tres más comúnmente citados:
Modelos clásicos
booleano, espacio vectorial y probabilístico.
Modelos
Están basados en la Lógica Fuzzy.
alternativos
Basados en la Lógica Formal. La
Modelos lógicos recuperación de información es un proceso
inferencial.
Incluyen posibilidades de expansión del
Modelos basados
alcance de la búsqueda y hacen uso de
en
la
retroalimentación por la relevancia de los
interactividad
documentos recuperados.
Modelos basados Bases de conocimiento, redes neuronales,
en la Inteligencia algoritmos genéticos y procesamiento del
Artificial
lenguaje natural.
FCC - BUAP
Modelo
MC Beatriz Bletrán Martínez
Modelos de un SRI
20
Primavera 2015
FCC - BUAP
• Desarrollos iniciales: En papiros, en libros, etc.
• Recuperación de información en las bibliotecas:
Fueron las primeras instituciones en adoptar
estos sistemas.
• La World Wide Web: La evolución lógica de los
SRI ha sido hacia la web, donde han encontrado
una alta aplicación práctica y un aumento del
número de usuarios, especialmente en el campo
de los directorios y motores de búsqueda.
MC Beatriz Bletrán Martínez
Evolución
21
Descargar

Recuperación de Información