Desarrollos de servicios de valor añadido
José Manuel Barrueco Cruz
Universitat de València
La ecología de los repositorios institucionales
Gijón, 12 a 14 de Diciembre de 2007
Proveedores de servicios
¿Qué son?:
Sistemas que utilizan los metadatos recolectados a través del
protocolo OAI-PMH para construir servicios de valor añadido para
los usuarios.
Algunos ejemplos:
• Agregadores de contenidos:
Myoai, arc, perseus, oaister, scirus, carl abrc, base, dl-harvest,
meind, Sheet Music Consortium, Electronic Library, America
South, UIUC Digital Gateway to Cultural Heritage Materials,
roai, Moissoneur oai-sist, Recolector Comunidad de Madrid,
Metalis, oasic, oai repository explorer
• Servicios avanzados:
CiteBase
03/10/2015
Desarrollo de servicios de valor añadido
Proveedores de servicios
Agregadores de contenidos:
• Experimentales vs institucionales
• Generales vs especializados
• Funcionalidades:
•
•
•
•
•
•
Búsqueda sencilla y avanzada en los metadatos
Diferentes criterios de ordenación de resultados
Navegación por documentos
Selección de depósitos donde buscar
Personalización del portal
RSS
03/10/2015
Desarrollo de servicios de valor añadido
Proveedores de servicios
Citebase:
• Indice de citas autónomo y experimental
• Cobertura: Física, Matemáticas, Documentación y
Biomedicina
• Rankings:
• Citas a documentos, impacto de autores,
• Hits a documentos y autores
• Cocitas
• Limitaciones:
• Heterogéneo
• Falta de integración
• http//:citebase.org
03/10/2015
Desarrollo de servicios de valor añadido
En conclusión:
• Imagen y vehículo para demostrar utilidad OA
• Valores añadidos muy limitados
• Audiencia difusa
• Fácil crear un servicio / Difícil crear una
audiencia
• Competencia dura
• Necesidad de mejorar para cumplir el objetivo:
Maximizar el impacto al maximizar la
difusión
03/10/2015
Desarrollo de servicios de valor añadido
En conclusión:
Nuevos valores para cumplir objetivos:
1. Selección y categorización:
• Importancia creciente
• Criterios geográficos o temáticos
2. Enlace de referencias:
• Recuperación información
• Extracción automática
3. Estadísticas
03/10/2015
Desarrollo de servicios de valor añadido
Selección y categorización:
1. A posteriori, por los proveedores de servicios
• Servicios temáticos
• Categorización:
• North Carolina State University’s Library Catalog
• http://www.lib.ncsu.edu/catalog/
2. A priori, por los proveedores de datos
• Utilización de la opción sets de OAI-PMH
• Permite agrupar los items en un depósito para llevar a cabo
una recolección selectiva en función del tipo de documento,
materia, etc.
• Estudio de sets en 94 archivos: 80 respuestas válidas, 59
implementan sets
03/10/2015
Desarrollo de servicios de valor añadido
Selección y categorización:
Agrupaciones de documentos usadas:
Autores; 1; 1%
Editor; 5; 6%
Estado
Clasificación
Tipo
Cronológico; 6;
7%
Estado; 17;
19%
Colección; 7;
8%
Colección
Cronológico
Editor
Autores
03/10/2015
Tipo; 29; 32%
Clasificación;
24; 27%
Desarrollo de servicios de valor añadido
Selección y categorización:
Clasificaciones Utilizadas:
JITA; 2; 8%
DEWEY; 2; 8%
LCC; 4; 17%
Propia; 16; 67%
Propia
03/10/2015
LCC
DEWEY
JITA
Desarrollo de servicios de valor añadido
Selección y categorización:
• Es necesario enriquecer los metadatos:
• Utilizando formatos adicionales al requerido DC
• Utilizando vocabularios controlados
• Implementando control de autoridades: iralis
03/10/2015
Desarrollo de servicios de valor añadido
Estadísticas:
• Fundamentales para demostrar el impacto de
la literatura en abierto
• Objetivo: ¡¡Demostrar!! que los documentos
en abierto se citan más que el resto
• Diferentes niveles de evaluación:
• Uso (accesos a abstract + descargas)
• Citas
• Orientación a disciplinas
• Integración
03/10/2015
Desarrollo de servicios de valor añadido
Estadísticas:
• Medidas de uso: los fichero de logs
03/10/2015
Desarrollo de servicios de valor añadido
Estadísticas:
• Medidas de uso: los fichero de logs
• Necesario limpiarlos para identificar los
accesos desde máquinas:
• Robots:
• Si han accedido /robots.txt
• Han accedido más de x items (ejem 10.000)
• Su red ha accedido a más del x% de nuestro sitio (ejem
75%)
• Si pertenecen a un dominio como: googlebot.com,
inktomisearch.com, etc.
• Doble clicks
• Un único acceso por cada IP a un recurso determinado
en un tiempo t
• Reducción hasta de un 75% de los accesos
03/10/2015
Desarrollo de servicios de valor añadido
Estadísticas:
• Estadísticas para repositorios institucionales:
• IRStats:
•
•
•
•
•
Software para analizar el uso de eprints en RI
Desarrollado en Universidad de Southampton
Procesa logs de EPrints y Dspace
Filtrado de robots
Analiza uso de documentos o grupos de
documentos: autores, temas, etc.
• Ejemplos en:
• http://irstats.eprints.org/irstats-soton
03/10/2015
Desarrollo de servicios de valor añadido
Estadísticas:
• Estadísticas para repositorios institucionales:
• Distribución a través del modelo de Bollen:
• A framework for assessing the impact of units of
scholarly communication based on OAI-PMH
harvesting of usage information. Johan Bollen
and Herbert van de Sompel
• Proveedores de datos y proveedores de
servicios ofrecen datos de acceso (logs) vía OAIPMH
• Metadatos ofrecidos: ¿Quién? ¿Qué? ¿Cuándo?
¿Cómo?
• Expresados en XML como ContextObjects de
OpenURL
• Recolectados por agregadores específicos
03/10/2015
Desarrollo de servicios de valor añadido
Estadísticas:
Service 1
Log
repository
OpenURL
ContextObjects
Service 2
Service
provider
Log
repository
Log
harvester
Service 3
Log
repository
03/10/2015
Aggregated
logs
Data
mining
Item
relations
Metrics
Services
•Recommender
•Services
•Analysis services
•Collection management
•Trend analysis
Desarrollo de servicios de valor añadido
Estadísticas:
• Estadísticas para repositorios temáticos:
• El caso de RePEc (Research Papers in Economics)
• Biblioteca digital creada en 1997:
• +543.000 documentos a texto completo
• procedentes de +850 departamentos (PD) y accesibles a
través de 5 servicios (PS)
• LogEc: Servicio de estadísticas de uso
•
•
•
•
•
•
•
03/10/2015
Datos de uso (logs) desde 01-Enero-1998
Elimina accesos de robots, spiders y duplicados
Sistema centralizado con intercambio de logs vía scp o ftp.
+26 millones de ficheros descargados
+120 millones de accesos a resúmenes
Rankings de autores, documentos, series, etc. (los top 10)
Ejemplos: http://logec.repec.org
Desarrollo de servicios de valor añadido
Análisis de citas:
• Recuperación de la información: enlace de
referencias
• Medición del impacto de una publicación
• Índices de citas autónomos:
• Citeseer
• Citebase
• CitEc
03/10/2015
Desarrollo de servicios de valor añadido
Citas: Proceso de extracción
READING
Metadata
Full Text (PDF)
Knowledge
PARSING
ASCII
PDF
References
Base
LINKING
Reference
Linking
CitationTemplate
03/10/2015
Desarrollo de servicios de valor añadido
Citas: Proceso de comunicación
• Necesidad de formatos para exportar referencias
• Dublin Core
• AMF: Academic Metadata Format
• Basado en XML
• Permite describir: documentos, personas e
instituciones
• Permite establecer las relaciones:
• cita: <references>
• es citado: <isreferencedby>
03/10/2015
Desarrollo de servicios de valor añadido
Citas: Proceso de comunicación
03/10/2015
Desarrollo de servicios de valor añadido
Conclusiones:
• Es necesario crear PS con nuevos valores añadidos
• Proveedores de servicios que:
• puedan competir con actores ya establecidos
• estén centrados en una comunidad de usuarios
• partan de un estudio de necesidades específicas
• Necesario trabajar en:
• Selección y categorización
• Análisis de uso y citas
• Los proveedores de datos pueden facilitar el trabajo
proporcionando más y mejores metadatos
• Formatos alternativos
• Metadatos completos
• Nuevos datos: logs y referencias
03/10/2015
Desarrollo de servicios de valor añadido
¡ GRACIAS POR SU ATENCION !
José Manuel Barrueco
[email protected]
03/10/2015
Desarrollo de servicios de valor añadido
Descargar

Principios del movimiento de acceso abierto a la