Information Science
2005
Tefko Saracevic, PhD
School of Communication, información and
Library Studies
Rutgers University
New Brunswick, New Jersey USA
http://www.scils.rutgers.edu/~tefko
1
Organización de la presentación
1. El paisaje – problemas, soluciones, lugar social
2. Estructura – áreas principales de investigación y
práctica
3. Tecnología – Recuperación de la información – la mayor
parte
4. Información – representación; bibliometría
5. Gente – usuarios, uso, búsqueda, contexto
6. Ruptura paradigmática – distanciamiento de las áreas
de investigación
7. Bibliotecas digitales – ¿de quiénes son?
8. Conclusiones – grandes cuestiones para el futuro
2
Parte 1. El gran paisaje
Problemas abordados
Un poco de historia: Vannevar Bush
(1945):
Definió el problema como “... La tarea
masiva de hacer más accesible el enorme
repositorio del conocimiento.”
Un problema que sigue con nosotros y
sigue creciendo.
Tabla de contenidos
3
… solución
Bush sugirió una máquina:
“Memex ... Asociación de ideas … que
duplique los procesos mentales
artificialmente.”
Una solución tecnológica al
problema
Todavía con nosotros:
determinante tecnológico
4
En la base de la Ciencia de la
Información: un problema
Intentar controlar el contenido en:
 La explosión de la información
 El crecimiento exponencial de los artefactos
informativos, si no de la propia información
Y hoy ADEMÁS
 La explosión de la comunicación
 El crecimiento exponencial de los medios y modos de
comunicación, transmisión, acceso y uso de la
información
5
solución tecnológica, PERO …
Aplicar la tecnología
para solucionar los
problemas en el uso
efectivo de la
información
PERO:
Desde una perspectiva
HUMANA & SOCIAL
Y no solo
TECNOLOGICA
6
o un modelo simbólico
Gente
Información
Tecnología
7
Problemas & soluciones:
CONTEXTO SOCIAL
 Práctica profesional E investigación
científica relacionada con:
Comunicación efectiva de los registros del
conocimiento - ‘literatura’ - entre humanos
en el contexto de las necesidades y usos
sociales, organizaciones e individuales
 Con la ventaja de las nuevas tecnologías
de la información
8
Características generales
 Interdisciplinariedad - relaciones con un
conjunto de campos, algunos más o menos
predominantes
 Imperativo tecnológico - fuerza impulsora
como en muchos campos modernos
 Sociedad de la información - contexto social
y papel social en su evolución - compartido
con muchos otros campos
Tabla de contenidos
9
Parte 2. Estructura
Composición del campo
 Como muchos campos, la ciencia de la
información tiene muchas áreas
diferentes de concentración y
especialización
 Que cambian y evolucionan a lo largo de
tiempo
se acercan y se separan
se ignoran, más o menos, entre sí
10
más importante aún, las diferentes
áreas…
 reciben más o menos financiación & énfasis
 produciendo grandes desequilibrios en el trabajo y
el progreso
 atrayendo diferentes audiencias y campos
 esto incluye
 vastas diferencias en los niveles de soporte para la
investigación e
 inversiones y aplicaciones enormes en el campo
comercial
11
¿Cómo encontrar una estructura?
descomponiendo áreas y esfuerzos en la
investigación y práctica, enfatizando
Tecnología
o
Gente
Información
o
Tabla de contenido
12
Parte 3.
Tecnología
 Identificada con la recuperación de
información (RI)
con mucho se lleva los mayores esfuerzos e
inversiones
es internacional y global
los intereses comerciales subyacentes son
grandes y crecientes
13
Recuperación de información –
definición & objetivo
“ RI: ... aspectos intelectuales de la
descripción de información, ... búsqueda,
... & sistemas, máquinas...”
Calvin Mooers, 1951
 ¿Cómo proporcionar a los usuarios
información relevante de forma efectiva?
Para ese fin:
1. ¿Cómo organizar la información
intelectualmente?
2. ¿Cómo especificar la búsqueda & la
interacción intellectualmente?
3. ¿Qué técnicas & sistemas usar
efectivamente?
14
Investigación contemporánea en
RI
 Ahora principalmente dentro de la Informática
 e.g Special Interest Group on RI, Association for
Computing Machinery (SIGIR,ACM)
 Extendida globalmente
 v.g. grandes comunidades de investigación han emergido
en China, Corea y Singapur
 Sacada fuera de la Ciencia de la Información “todo el mundo hace recuperación de información”
 minería de datos, aprendizaje automático, procesamiento
del lenguaje natural, inteligencia articial, gráficos
por ordenador …
15
Text REtrieval Conference (TREC)
 Principal esfuerzo de investigación
experimental
 Comenzó en 1992, ahora probablemente
terminando
 “para soportar la investigación de la comunidad RI
proporcionando la infraestructura necesaria para la
evaluación en gran escala”
 Métodos
 proporciona grandes bases de documentos, consultas,
juicios de relevancia y análisis comparativos
 usando esencialmente la metodología que uso Cranfield en
los sesenta
 organizada en varios temas que han ido evolucionando
16
El impacto de TREC
 Internacional – gran impacto en crear
comunidades de investigación
 Conferencias anuales
 informes, intercambio de resultados, cooperación
 Resultados
 principalmente en informes, disponibles en
http://trec.nist.gov/pubs.html
 estados de la cuestión
 pero solo una parte publicada en revistas y libros
17
Líneas TREC 2004
103 grupos de 21 países
 Genómica con 4 sub
 HARD (High Accuracy
from Documents)
líneas
 Líneas anteriores:
Retrieval
 Novelty
(nueva información no
redundante)
 Respuestas a consultas
 Robust (mejorando temas en
que la recuperación es
deficiente)
 Terabyte
grandes)
 Web
(colecciones muy
los











ad-hoc (1992-1999)
routing (92–97)
interactive (94-02)
filtering (95-02)
cross language (97-02)
speech (97-00)
Spanish (94-96)
video (00-01)
Chinese (96-97)
query (98-00)
y unas pocas más que solo
tuvieron dos años de
duración
18
Ampliación del RI –
siempre cambiando y con nuevas áreas añadidas












RI a través de diferentes idiomas (CLIR)
Procesamiento del lenguaje natural (NLP RI)
RI de música (MIR)
Imagen, vídeo y multimedia
Lenguaje oral
RI en Bioinformática y Genómica
Resumen; extracción de texto
Respuesta de consultas
Interacción hombre/máquina
XML RI
RI en la Web; buscadores web
RI en contexto – gran área para los grandes
buscadores e investigación más reciente
19
RI comercial
 Buscadores basados en la RI
 Pero añadiendo muchas elaboraciones e
innovaciones significativas
 gestionando enormes cantidades de páginas rápidamente
 interesantes juegos de algoritmos de spamming & page
rank –IR competitivo- combate de algoritmos
 incluyendo el contexto en la búsqueda
 Extensión e impacto mundial
 unos 2000 buscadores en más de 160 países
 El inglés fue dominante, pero ya no
20
RI comercial : “un mundo feliz”
 Grandes inversiones & sector económico
 Esperanzas de grandes beneficios, aunque todavía
cuestionables
 Conduce a RI propietaria y secreta
 Con un fichaje agresivo de los mejores talentos
 Nuevos centros comerciales de investigación en
diferentes países (v.g. MS en China)
 La financiación de la investigación académica
está cambiando
 Fuga de cerebros de la academia
 Los motores de búsqueda comerciales tienen que
hacer frente a grandes retos
 Perspectiva de: Amit Singhal
21
La RI puso en marcha con éxito
 La emergencia y desarrollo de la INDUSTRIA
de la información
 La evolución de la CI como PROFESIÓN y
CIENCIA
 Muchas APLICACIONES en muchos campos
 Incluyendo la Web – motores de búsqueda
 Mejoras en la INTERACCIÓN PERSONAS COMPUTADORAS
 La evolución de la INTEDISCIPLINARIEDAD
La RI tiene una larga y orgullosa historia
Tabla de contenidos
22
Parte 4.
Información
 Varias áreas de investigación
Como un fenómeno básico – no demasiado
progreso
• Medidas como las de Shannon no han tenido éxito
• Concentrada en sus manifestaciones y efectos
• No hay progreso reciente en este tema de
investigación básica
Representación de la información
• Gran área conectada con RI, biblioteconomía
• Metadatos
Bibliometría
• Estructuras de la literatura
23
¿Qué es la información?
Bien comprendida intuitivamente, pero mal
formulada formalmente
 Han emergido varios puntos de vista y modelos
 Shannon: fuente - canal -destino
 señales no son contenido – no es realmente aplicable,
a pesar de muchos intentos
 Cognitivo: cambios en las estructuras
cognitivas
 Procesamiento y efectos del contenido
 Social: contexto, situación
 Búsqueda de información, tareas
24
La información en la Ciencia de la Información
Tres sentidos
(del más estrecho al más amplio)
1. información en términos de la decisión, sin
tener en cuenta prácticamente los procesos
cognitivos

señales, bits, datos simples - v.g.. Teoría de la
Información (Shanon), Economía,
2. información incluyendo el procesamiento
cognitivo y la comprensión

comprensión, emparejamiento de textos, Brookes
3. información también en relación al contexto,
la situación, el problema a resolver
β
USUARIOS, USO, TAREA
Para la Ciencia de la Información
(incluyendo la recuperación de información):
la tercera interpretación, la más amplia, es necesaria
25
Parte 5.
Gente
 Servicios profesionales
 en la organización – moviéndose hacia la gestión del
conocimiento y la inteligencia competitiva
 en la industria – vendedores, agregadores, Internet,
 Investigación
 Usuarios & estudios de usuario
 Estudios de interacción
 Ampliando el campo a los estudios de búsqueda de la
información, contexto social, colaboración
 Estudios de relevancia
 Social informatics
26
Uso y estudios de usuarios
 El área más antigua
cubre muchos temas, métodos y orientaciones
muchos estudios están relacionados con la
RI
• v.g. búsqueda, multitarea, visualización,
navegación
 Introduciéndose en los estudios de
usuarios de la web
Estudios cuantitativos y cualitativos
Emergencia de la webmetría
27
Interacción
 El modelo tradicional de la RI se
concentra en el emparejamiento, pero
no en el lado del usuario y la
interacción
 Diversos modelos de interacción han
sido sugeridos
• Ingwersen’s cognitive, Belkin’s episode,
Saracevic’s stratified model
Difícil de realizar experimentos y de
confirmarlos
 Se consideran clave para proporcionar
• las bases de un diseño mejor
• la comprensión sobre el uso de los sistemas
 Las interacciones en la Web: una nueva
28
Búsqueda de información
 Se
RI
la
 Ha
concentra en el contexto más amplio, no solo en la
o la interacción: en la gente según se comporta en
vida y el trabajo
proporcionado varios modelos
 v.g. Las etapas de Kuhlthau’s stages, o el modelo basado
en tareas de Järvelin
 Incluye estudios sobre la vida real, construcción del
sentido, localización de la información, vida laboral,
descubrimiento de información
 Basado en el concepto de la construcción social de la
información
Tabla de contenidos
29
Ruptura del paradigma
entre sistemas y gente
Parte 6.
 Desde principios de los años ochenta se ha producido
una ruptura entre dos enfoques:
centrado en los sistemas
 algoritmos, TREC, motores de búsqueda
 continua el modelo tradicional de RI
centrado en los humanos (usuarios)
 cognitivo, situacional, estudios de usuarios
 modelos de interacción, algunos comenzados en
TREC
30
Lado humano vs. sistema
 Lado humano (usuario) :
 a menudo crítico, incluso unilateral
 propone un mantra de implicaciones para el diseño
 pero no proporciona resultados en la práctica
 Lado del sistema:
 ignora los estudios H
 ‘dinos que hacer y lo haremos’
 El tema NO es
H o
S
 ni siquiera menos H vs. S
 sino como pueden H y S trabajar juntos
 uno de los principales retos para el futuro
31
Llamadas vs soporte
 Muchas llamadas a un diseño, enfoque y
evaluación centrados en el usuario/humano
 Conjunto de obras que lo discuten, pero pocas
proponen soluciones concretas
 Sin embargo, la mayor parte del soporte se va
al trabajo de sistemas
 en la era digital el soporte es para lo digital
 Un intento reciente de combinar ambas
perspectivas:
Book: Ingerwersen, P. and Järvelin, K. (2005). The turn:
Integration of información seeking and retrieval in context.
Springer.
Tabla de contenidos
32
Parte 7.
Bibliotecas digitales
 Área ENORME & creciente
 Área “caliente” in I&D
con un número importante de becas y
proyectos en los EE. UU., Europa y otros
países
pero en ellos lo “DIGITAL” es grande &
“bibliotecas“ pequeño
 Área “caliente” en la práctica
Se están construyendo colecciones digitales
y bibliotecas híbridas
Existen muchos proyectos por todo el mundo
33
Problemas técnicos
 Sustanciales - mayores y más complejos que
lo anticipado:
 representación, almacenamiento y recuperación de
los objetos bibliotecarios digitales
• particularmente si fueron originalmente diseñados
para ser impresos y luego se digitalizaron
 gestionar operacionalmente grandes colecciones temas de escala
 tratar con colecciones diversas y distribuidas
• interoperabilidad
 asegurar la preservación y la persistencia
 incorporar la gestión de derechos
34
EEUU: Digital Library Initiatives
 Consorcios dependientes de la financiación de la
National Science Foundation
 DLI 1: 1994-98, 3 agencias, $24M, 6 grandes proyectos
 DLI 2: 1999-2006, 8 agencias, $60+M, 77 proyectos
grandes y pequeños en varias categorías
 proyectos internacionales conjuntos
 National Science, Mathematics, Engineering, and Technology
Education Digital Library
• cerca de 200 proyectos de demostración & desarrollo
 La financiación terminada en 2005
 ahora desviada a áreas relacionadas
35
Unión europea: DELOS
 DELOS Network of Excellence on Digital
Libraries
muchos proyectos a lo largo de la Unión
Europea
• de carácter muy tecnológico
muchas reuniones y talleres
hasta cierto punto recuerda a las DLIs de
los EE. UU:
bien financiados, a largo plazo
a diferencia de lo que ocurre en los EE.
UU. el soporte continúa
36
Temas de investigación
 comprender los objetos en las BD
 representados en muchos formatos







metadatos, catalogación, indización
conversión, digitalización
organización de grandes colecciones
gestión de colecciones, escalamiento
preservacion, archivo
interoperabilidad, estandarización
acceso, uso, búsqueda
 búsqueda federada en colecciones distribuidas
 evaluación de bibliotecas digitales
37
Proyectos de BD en la práctica
 Muy orientados a las instituciones y
sus misiones
en bibliotecas, pero también en otras
• museos, sociedades, gobiernos, empresas
• en muchas variantes
 Extendidos globalmente
incluyendo la digitalización
 U California, Berkeley’s Libweb
“lista
más de 7300 páginas de bibliotecas de más de 125
países”
 Extendiéndose a gran velocidad
a menudo a costa de otros recursos
38
¿En conexión?
 La investigación y la
práctica actual en BD son
desarrolladas actualmente
 mayormente de forma
independiente una de otra
 informando mínimamente a la
otra parte
 y con una conexión mútua ligera
o inexistente
 Son en el momento actual
universos paralelos con
escasas conexiones e
interación
 no es bueno ni para la
investigación ni para la
práctica
Tabla de contenido
39
Parte 8. Conclusiones
Las contribuciones de la
CI
 Puso en marcha la gestión de la información
en la sociedad
 Desarolló un cuerpo organizado de
conocimiento y de competencias
profesionales
 Aplicó la interdisciplinariedad
 Alcanzó un estado de madurez
 penetró muchos campos y actividades humanas
 Acentuó el factor HUMANO en la interacción
hombre-máquina
40
Retos
 Ajustarse al papel organizacional y social
creciente y cambiante de la información y de la
infraestructura informacional relacionada
 Jugar un papel positivo en la globalización de
la información
 Responder al imperativo tecnológico en términos
humanos
 Responder a los cambios que se han producido
desde la explosión de la información a la de la
comunicación
 convirtiendo las propias experiencias en soluciones,
especialmente en el campo de la web
 Unir competitividad y calidad
 Reunir lo DIGITAL con las BIBLIOTECAS
41
Momento crítico
 La CI está en un momento crítico de su
evolución
 Muchos grupos y campos… se están desplazando
al campo de la información
 fuerte competencia
 entrada de jugadores poderosos
 lucha por el control
 Para ser un jugador de primera, la CI necesita
progresar en:
 investigación & desarrollo
 competencias profesionales
 esfuerzos educacionales
 relaciones interdisciplinares
 Es necesaria una re-examinación
42
Gracias Miró!
43
44
Bibliografía
Bates, M. J. (1999). Invisible Substrate of información Science. Journal of
the American Society for información Science,50, 1043-1050.
Bush, V. (1945). As We May Think. Atlantic Monthly, 176, (11), 101-108.
Available: http://www.theatlantic.com/unbound/flashbks/computer/bushf.htm
Hjørland, B. (2000). Library and información Science: Practice, Theory, and
Philosophical Basis. información Processing & Management, 36 (3), 501-531.
Pettigrew, K.E. & McKechnie, L.E.F. (2000). The use of theory in información
science research. Journal of the American Society for información Science
and Technology, 52 (1), 62 - 73.
Saracevic, T. (1999). información Science. Journal of the American Society
for información Science, 50 (9) 1051-1063. Available:
http://www.scils.rutgers.edu/~tefko/JASIS1999.pdf
Saracevic, T. (2005). How were digital libraries evaluated? Presentation at
the course and conference Libraries in the Digital Age (LIDA)30 May-3 June
2005, Dubrovnik, Croatia. Available:
http://www.scils.rutgers.edu/~tefko/DL_evaluation_LIDA.pdf
Webber, S. (2003) información Science in 2003: A Critique. Journal of
información Science, 29, (4), 311-330.
White, H. and Mc Cain, K. (1998). Visualizing a Discipline: An Author Cocitation Analysis of información Science 1972-1995. Journal of the
American Society for información Science, 49 (4), 327-355.
45
Descargar

Information Science