COSTES DE UN REPOSITORIO DE DATOS
Enrique Wulff [email protected]*
Mercedes Rodríguez del Castillo Martín [email protected]··
* Consejo Superior de Investigaciones Científicas. Cádiz
** Hospital Universitario Virgen de las Nieves. Granada
Introducción
Son bibliotecas digitales de datos que tienen asegurada su preservación. El intercambio de
datos entre médicos clínicos e investigadores requiere mecanismos para desarrollar
fuentes de datos, describir hallazgos y acceder a los datos importantes ya descubiertos.
Estudiamos aquí los costes de los repositorios de datos médicos, incluyendo planificación y
mantenimiento.
NCAD: Non-Coded Amino
Acids Database
DRI/Mammogrid
medicalimaging repository
Repositorios de datos útiles en
Medicina pueden, por ejemplo,
incluir secuencias de
nucleótidos, codificadoras de
proteínas, coordenadas
atómicas macromoleculares, y
datos epidemiológicos
CETA-CIEMAT y MAAT
International han
desarrollado DRI/Mammogrid
la aplicación de
infraestructura de
repositorios digitales que
ofrece un sistema de apoyo
al diagnóstico (DSS) y la
federación de los datos para
la investigación sobre cáncer
de mama.
el coste de almacenar y
gestionar datos ha
descendido. El acceso
online a los datos de
investigación en formato
digital debe ser gratuíto.
Presupuesto estimado para crear
plataforma de producción en acceso
abierto en Internet. Estimación de Costes
de Puesta en Marcha (año 1) .
•Hardware / red Servidor, cpu Dual,
memoria 4GB, 156 GB disco interno: 12003400 €
•Cartucho de registro para backup: 15-130 €
•Software Linux Red Hat (SO) 34 €
•Tivoli (servidor backup) 34 €
•Tripwire (seguridad) 200€
•Personal Desarrollo y puesta en marcha
(320 horas): 3270 €
•Costes totales 4750 – 7060 €
Estimación de Costes en Curso
Anuales (empiezan a partir del 2º año)
•Hardware / red
•Mantenimiento del servidor 340 €
•Coste de red 58 €
•Software Linux Red Hat 34 €
•Tivoli (servidor backup) 34 €
•Tripwire (seguridad) 113 €
•Personal (Mantenimiento en curso y
apoyo (20 horas / mes) 2450 €
•Costes totales 3029
La flexibilidad y autonomía permite a los
investigadores controlar cada fase del ciclo
de vida de los conjuntosde datos individuales que manejan. Si se proponen interconec
tarlos estratégicamente para mejorar sus
resultados, Las partes implicadas tendrían
que negociar acuerdos para compartir
datos de investigación,
La nueva generación de
Infraestructuras de datos
científicos se enfrenta a
dos desafíos principales
Adquisición y
Asimilación 1,4
Almacenamiento
y Preservación de los datos 2,4
Acceso 3,4
c. 42%
. 23%
c. 35%
Notas
incluyendo la preparación de
los metadatos para la
detección de los
recursos.
incluyendo la planificación de
la preservación y de la
gestión de los datos.
incluyendo el apoyo al usuario
tanto a la búsqueda
como al uso de los
datos.
los costes de las funciones de
administración y gestión
se incluyen (de forma
desigual) en las tres
rúbricas sobre la base
de una estimación de
los salarios requeridos.
ciencia intensamente basada
en datos
ciencia multi/interdisciplinar
Descargar

Diapositiva 1 - E