Sistemas para la gestión de
conocimiento en Chile
LOS INDICADORES DE CTI: ESTADO
DEL ARTE Y DESAFIOS FUTUROS
Santiago, 21 y 22 de Septiembre
Jorge Walters Gastelu
[email protected]
Motivación (i)
• Hoy es posible unir dinámicamente los datos
provenientes de las bases de datos de gestión de la
actividad científica, con la producción científica
propiamente tal.
– La capacidad de almacenamiento permite disponer de
textos completos en formato digital
• Proyectos, publicaciones científicas, patentes
– Las fuentes de información disponibles en Internet y en
redes especializadas dejan disponible contenidos que están
disponibles antes que los datos necesarios para la
generación de indicadores tradicionales.
– El desarrollo de tecnologías para el procesamiento de
información basada en conceptos.
________________________
Septiembre 2004
Trabajos relacionados
• Using curriculum vitae to compare some
impacts of NSF research grants with research
Center Funding (Monica Gaughan & Barry
Mozeman, Research Value Mapping
Program, GATech)
• OPS : Indicadores de recursos humanos CyT
en Salud, Un nuevo enfoque (Reunión
RICYT)
________________________
Septiembre 2004
Instrumentos
• STANALYST, CNRS
• Vec-Mining, Grupo STELA
• Collexis
________________________
Septiembre 2004
Motivación (ii)
DB
Metadatos
Documento
original
Análisis
automático
________________________
Septiembre 2004
La tecnología
________________________
Septiembre 2004
Testing Collexis technology
The Abstraction Process
Illustration from Collexis® http://www.collexis.com/
________________________
Septiembre 2004
Testing Collexis technology
Abstraction Process Simplified
Language
________________________
Septiembre 2004
Language
DeCS, Language
Un documento, un vector en el
espacio definido por el tesauro
B
d1
d2
d3
A
________________________
Septiembre 2004
El experimento
________________________
Septiembre 2004
El modelo (i)
• Resúmenes de Medline (un segmento) para generar
una collexion. Para cada resumen se genera un
vector de conceptos (fingerprint)
• El espacio está definido por MESH (2002)
• La definición de SIDA, según NLM, define lo que
entendemos por este concepto y nos sirve para
restringir el espacio de análisis (¡sólo un ejemplo!).
• A partir de una búsqueda filtrada para un país
específico, obtenemos el conjunto de fingerprints
(vectores) de documentos relevantes al tema.
________________________
Septiembre 2004
El modelo (ii)
FingerPrintpaís = Compi(fpdoci)
Ángulo entre 2
países
Ángulo de un
país y el
patrón
B
País 1
País 2
AIDS
País 3
Comparación
de los ángulos
con el patrón
A
________________________
Septiembre 2004
Un texto que define...
The most severe manifestation of infection with the Human
Immunodeficiency Virus (HIV). The Centers for Disease Control and
Prevention (CDC) lists numerous opportunistic infections and cancers
that, in the presence of HIV infection, constitute an AIDS diagnosis. In
1993, CDC expanded the criteria for an AIDS diagnosis in adults and
adolescents to include CD4+ T-cell count at or below 200 cells per
microliter in the presence of HIV infection. In persons (age 5 and older)
with normally functioning immune systems, CD4+ T-cell counts usually
range from 500 - 1,500 cells per microliter. Persons living with AIDS often
have infections of the lungs, brain, eyes, and other organs, and frequently
suffer debilitating weight loss, diarrhea, and a type of cancer called
Kaposi's Sarcoma. See HIV Disease; Opportunistic Infection; AIDS
Wasting Syndrome
________________________
Septiembre 2004
El fingerprint de AIDS
Concepts
________________________
Septiembre 2004
Disease
Diarrhea
Eye
Lung
Immune
Aging
Adult
Persons
Diagnosis
Centers for
Acquired
1.2
1
0.8
0.6
0.4
0.2
0
Infection
Rank
AIDS Representation
________________________
Septiembre 2004
1.2
1
0.8
0.6
0.4
0.2
0
Concepts
T-Lymphocyte
Purified Protein
Fibrin Tissue
Testis
Transaminases
Nested
Prevalence
Hospitals
Risk Behavior
Epidemiology,
Survival
Infection
HIV-1
Acquired
HIV
Rank
AIDS in Brazil
AIDS in BRASIL
Comparaciones dinámicas
Concepts
________________________
Septiembre 2004
Disease
Diarrhea
Eye
Lung
Immune
Aging
Adult
Persons
Diagnosis
Centers for
Acquired
1.2
1
0.8
0.6
0.4
0.2
0
Infection
Rank
AIDS Representation
Posibles
aplicaciones
________________________
Septiembre 2004
mapas conceptuales
________________________
Septiembre 2004
Mesh 2002 v/s Medline 1999
________________________
Septiembre 2004
Thanks to
Martin Schmidt and Mario Diwersy
(http://www.syynx.de/)
MESH 2002 v/s MEDLINE 2001
________________________
Septiembre 2004
Thanks to
Martin Schmidt and Mario Diwersy
(http://www.syynx.de/)
Vista geográfica
+ intesidad = + cercanía al tema
• La producción del
país.
• Un tema específico.
• Intensidades de
color para
representar mayor o
menor cercanía al
tema en estudio.
________________________
Septiembre 2004
Vista geográfica (ii)
________________________
Septiembre 2004
Distribución Geográfica
________________________
Septiembre 2004
A modo de conclusión y próximos
pasos
• Seguir probando el modelo
– La tecnología es estable
– Los contenidos existen
– Se define un espacio que independiza del tipo de
documento y del idioma
– Es crucial la construcción/adopción de un vocabulario.
Superado en el área de la salud.
• Aplicar el modelo a contenidos válidos y con un
volumen adecuado.
• Estudiar la relación con indicadores tradicionales.
• Aplicar el modelo a nivel institucional y en otras
áreas.
________________________
Septiembre 2004
¡Muchas
gracias!
________________________
Septiembre 2004
Descargar

Nuevos indicadores basados en el procesamiento de …