5ta. Jornada sobre Bibliotecas Digitales Universitarias
“El ciclo del conocimiento en el entorno académico”
8 y 9 de Noviembre de 2007
Una experiencia con el estándar XMP de Adobe y
el software de Biblioteca Digital Greenstone
Daniel H. Biset, Alejandra T. Chávez Flores
Centro de Información – Centro Atómico Constituyentes
Comisión Nacional de Energía Atómica
Antecedentes
•1999-2002: Primeras experiencias en digitalización para envío
de documentos al INIS
•2001: Escaneo de Tesis del Instituto Sábato. Participación en :
“Long Term Archiving of Digital Documents in Physics”. Lyon,
Francia.
•2002: Bases para el proyecto de preservación a largo plazo
•2003: Inicio del Proyecto Piloto de Preservación a Largo Plazo
Colecciones seleccionadas:
Boletín Informativo
Informes CNEA
Memorias CNEA
Flujo de trabajo
Selección
Captura
(Salida de
TIFF)
Descripción
(Incorporación
de Metadatos)
Conversión
a PDF/A
PDF JB2
y OCR
Normalización
(XENA)
NLNZ
Metadata
Extractor
Procesamiento con
software de BibDig
(incorporación
automática de
metadatos)
Control de
calidad
Almacenamiento
(Back-Up)
Provisión de
acceso
Consulta
Visualización
Impresión
INIS
BD Hist.
CNEA
Catálogo
CNEA
Consignas para la preservación



Incorporar metadatos en el propio
documento TIFF (política de preservación)
Procesar con un software de biblioteca
digital PDF’s con metadatos incorporados
Que el software extraiga automáticamente
los metadatos
Los metadatos residen en un archivo XMP
XMP





eXtensible Metadata Platform
Codificado como XML, usando estándar RDF
(Resource Description Framework)
Estandariza la definición, creación y
procesamiento de metadatos
Tecnología open-source
Provee:
un modelo de datos,
un modelo de almacenamiento,
dentro de un marco de trabajo extensible que puede ser usado
para representar cualquier número de esquemas
RDF





Una estructura para describir recursos de la
web
Provee un modelo de datos y una sintaxis
Está escrito en XML
Es parte de la actividad del W3C por la Web
Semántica
Es una recomendación del W3C
Modelo de metadatos XMP
XMP define propiedades básicas para registrar la
historia y descripción de un recurso; permite la
integración de esquemas de metadatos tanto
existentes como personalizados
XMP soporta tres clases de datos:
 Propiedades de los metadatos
 Esquemas y Espacio de Nombres (namespace)
 Valores de las propiedades
Propiedades de Metadatos




Siempre asociadas a un recurso: las propiedades son sobre
(“about”) el recurso
Recurso: un archivo o porción significativa de él.
Una propiedad tiene un nombre y un valor
Forma:
‘El nombre_de_la_propiedad del recurso es
valor_de_la_propiedad’
Ejemplo:
El autor de Moby Dick es Herman Melville
Esquemas y Espacio de Nombres
Esquema: conjunto de nombres de propiedades de alto nivel
acompañados por tipos de datos e información descriptiva.
Define la estructura donde registrar la información.
Un esquema en XMP es identificado por su Espacio de Nombres
XML (xmlns), un URI
El uso de Espacios de Nombres evita conflictos entre propiedades
de diferentes esquemas que tienen el mismo nombre pero
diferentes significados.
Por ejemplo: la propiedad Subject en el esquema PDF se refiere al asunto o
descripción, mientras que en DC se refiere a palabras claves.
Valores de las propiedades
tres categorías básicas
Tipos simples: es un valor literal simple: cadena de caracteres, booleanos,
números reales y enteros.
Estructuras: una propiedad estructurada consiste de uno o más campos. Por
ejemplo, una propiedad MaxPageSize cuyo tipo es Dimensions,
con tres campos: alto, ancho, unidad
Arrays: consiste en un conjunto de valores. XMP soporta tres tipos de arrays:
1) Array sin ordenar: una lista de valores cuyo orden no es
significativo (dc:subject). Es referido como un bag
2) Array ordenado: una lista cuyo orden es significativo (dc:creator).
Es referido como un seq
3) Array alternativo: conjunto de uno o más valores, uno de los
cuales debe ser seleccionado (dc:title). Es referido como un alt
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?><?adobe-xap-filters esc="CR"?>
<x:xmpmeta xmlns:x='adobe:ns:meta/' x:xmptk='XMP toolkit 2.9.1-13, framework 1.6'>
<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:iX='http://ns.adobe.com/iX/1.0/'>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:pdf='http://ns.adobe.com/pdf/1.3/'>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xap='http://ns.adobe.com/xap/1.0/'>
<xap:ModifyDate>2006-10-24T16:47:28-04:00</xap:ModifyDate>
<xap:CreateDate>2006-10-24T16:47:27-04:00</xap:CreateDate>
<xap:MetadataDate>2006-10-24T16:47:28-04:00</xap:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'>
<xapMM:DocumentID>uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8</xapMM:DocumentID>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:dc='http://purl.org/dc/elements/1.1/'>
<dc:format>application/pdf</dc:format>
<dc:creator>
<rdf:Seq>
<rdf:li>Matthew Beacom</rdf:li>
<rdf:li>Reed Beaman</rdf:li>
</rdf:Seq>
</dc:creator>
<dc:subject>
<rdf:Bag>
Instrucciones de procesamiento
<rdf:li>Preservación digital</rdf:li>
<rdf:li>Archivos digitales</rdf:li>
XML comprendidas en el
<rdf:li>Metadatos</rdf:li>
envoltorio del paquete XMP
</rdf:Bag>
</dc:subject>
</rdf:Description>
</rdf:RDF>
</x:xmpmeta>
<?xpacket end='r'?>
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?><?adobe-xap-filters esc="CR"?>
<x:xmpmeta xmlns:x='adobe:ns:meta/' x:xmptk='XMP toolkit 2.9.1-13, framework 1.6'>
<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:iX='http://ns.adobe.com/iX/1.0/'>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:pdf='http://ns.adobe.com/pdf/1.3/'>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xap='http://ns.adobe.com/xap/1.0/'>
<xap:ModifyDate>2006-10-24T16:47:28-04:00</xap:ModifyDate>
<xap:CreateDate>2006-10-24T16:47:27-04:00</xap:CreateDate>
<xap:MetadataDate>2006-10-24T16:47:28-04:00</xap:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'>
<xapMM:DocumentID>uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8</xapMM:DocumentID>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:dc='http://purl.org/dc/elements/1.1/'>
<dc:format>application/pdf</dc:format>
<dc:creator>
<rdf:Seq>
<rdf:li>Matthew Beacom</rdf:li>
<rdf:li>Reed Beaman</rdf:li>
</rdf:Seq>
El elemento más extremo contiene
</dc:creator>
un elemento x:xmpmeta, el cual
<dc:subject>
contiene un elemento simple
<rdf:Bag>
<rdf:li>Preservación digital</rdf:li>
rdf:RDF
<rdf:li>Archivos digitales</rdf:li>
<rdf:li>Metadatos</rdf:li>
</rdf:Bag>
</dc:subject>
</rdf:Description>
</rdf:RDF>
</x:xmpmeta>
<?xpacket end='r'?>
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?><?adobe-xap-filters esc="CR"?>
<x:xmpmeta xmlns:x='adobe:ns:meta/' x:xmptk='XMP toolkit 2.9.1-13, framework 1.6'>
<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:iX='http://ns.adobe.com/iX/1.0/'>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:pdf='http://ns.adobe.com/pdf/1.3/'>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xap='http://ns.adobe.com/xap/1.0/'>
<xap:ModifyDate>2006-10-24T16:47:28-04:00</xap:ModifyDate>
<xap:CreateDate>2006-10-24T16:47:27-04:00</xap:CreateDate>
<xap:MetadataDate>2006-10-24T16:47:28-04:00</xap:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'>
<xapMM:DocumentID>uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8</xapMM:DocumentID>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:dc='http://purl.org/dc/elements/1.1/'>
<dc:format>application/pdf</dc:format>
<dc:creator>
<rdf:Seq>
<rdf:li>Matthew Beacom</rdf:li>
<rdf:li>Reed Beaman</rdf:li>
</rdf:Seq>
</dc:creator>
<dc:subject>
<rdf:Bag>
<rdf:li>Preservación digital</rdf:li>
<rdf:li>Archivos digitales</rdf:li>
<rdf:li>Metadatos</rdf:li>
</rdf:Bag>
</dc:subject>
</rdf:Description>
</rdf:RDF>
</x:xmpmeta>
<?xpacket end='r'?>
El elemento rdf:RDF contiene uno o
más elementos rdf:Description
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?><?adobe-xap-filters esc="CR"?>
<x:xmpmeta xmlns:x='adobe:ns:meta/' x:xmptk='XMP toolkit 2.9.1-13, framework 1.6'>
<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:iX='http://ns.adobe.com/iX/1.0/'>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:pdf='http://ns.adobe.com/pdf/1.3/'>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xap='http://ns.adobe.com/xap/1.0/'>
<xap:ModifyDate>2006-10-24T16:47:28-04:00</xap:ModifyDate>
<xap:CreateDate>2006-10-24T16:47:27-04:00</xap:CreateDate>
<xap:MetadataDate>2006-10-24T16:47:28-04:00</xap:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'>
<xapMM:DocumentID>uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8</xapMM:DocumentID>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:dc='http://purl.org/dc/elements/1.1/'>
<dc:format>application/pdf</dc:format>
<dc:creator>
<rdf:Seq>
<rdf:li>Matthew Beacom</rdf:li>
<rdf:li>Reed Beaman</rdf:li>
</rdf:Seq>
</dc:creator>
<dc:subject>
<rdf:Bag>
<rdf:li>Preservación digital</rdf:li>
<rdf:li>Archivos digitales</rdf:li>
<rdf:li>Metadatos</rdf:li>
</rdf:Bag>
</dc:subject>
</rdf:Description>
ESQUEMAS
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?><?adobe-xap-filters esc="CR"?>
<x:xmpmeta xmlns:x='adobe:ns:meta/' x:xmptk='XMP toolkit 2.9.1-13, framework 1.6'>
<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:iX='http://ns.adobe.com/iX/1.0/'>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:pdf='http://ns.adobe.com/pdf/1.3/'>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xap='http://ns.adobe.com/xap/1.0/'>
<xap:ModifyDate>2006-10-24T16:47:28-04:00</xap:ModifyDate>
<xap:CreateDate>2006-10-24T16:47:27-04:00</xap:CreateDate>
<xap:MetadataDate>2006-10-24T16:47:28-04:00</xap:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'>
<xapMM:DocumentID>uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8</xapMM:DocumentID>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:dc='http://purl.org/dc/elements/1.1/'>
<dc:format>application/pdf</dc:format>
<dc:creator>
<rdf:Seq>
<rdf:li>Matthew Beacom</rdf:li>
<rdf:li>Reed Beaman</rdf:li>
</rdf:Seq>
</dc:creator>
<dc:subject>
<rdf:Bag>
<rdf:li>Preservación digital</rdf:li>
<rdf:li>Archivos digitales</rdf:li>
<rdf:li>Metadatos</rdf:li>
</rdf:Bag>
</dc:subject>
</rdf:Description>
</rdf:RDF>
</x:xmpmeta>
<?xpacket end='r'?>
Espacio de Nombres
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?><?adobe-xap-filters esc="CR"?>
<x:xmpmeta xmlns:x='adobe:ns:meta/' x:xmptk='XMP toolkit 2.9.1-13, framework 1.6'>
<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:iX='http://ns.adobe.com/iX/1.0/'>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:pdf='http://ns.adobe.com/pdf/1.3/'>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xap='http://ns.adobe.com/xap/1.0/'>
<xap:ModifyDate>2006-10-24T16:47:28-04:00</xap:ModifyDate>
<xap:CreateDate>2006-10-24T16:47:27-04:00</xap:CreateDate>
<xap:MetadataDate>2006-10-24T16:47:28-04:00</xap:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about ='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'>
<xapMM:DocumentID>uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8</xapMM:DocumentID>
</rdf:Description>
<rdf:Description rdf:about ='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:dc='http://purl.org/dc/elements/1.1/'>
<dc:format>application/pdf</dc:format>
<dc:creator>
El elemento rdf:Description
<rdf:Seq>
<rdf:li>Matthew Beacom</rdf:li>
requiere un atributo rdf:about que
<rdf:li>Reed Beaman</rdf:li>
puede ser usado para identificar el
</rdf:Seq>
</dc:creator>
recurso que el XMP describe. Puede
<dc:subject>
estar vacío o ser una URI basada en
<rdf:Bag>
una UUID abstracta
<rdf:li>Preservación digital</rdf:li>
<rdf:li>Archivos digitales</rdf:li>
<rdf:li>Metadatos</rdf:li>
UUID (Universal Unique IDentifier): número aleatorio,
</rdf:Bag>
</dc:subject>
se crea por la combinación de tiempo y dirección de
</rdf:Description>
la tarjeta de red Ethernet.
</rdf:RDF>
</x:xmpmeta>
<?xpacket end='r'?>
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?><?adobe-xap-filters esc="CR"?>
<x:xmpmeta xmlns:x='adobe:ns:meta/' x:xmptk='XMP toolkit 2.9.1-13, framework 1.6'>
<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:iX='http://ns.adobe.com/iX/1.0/'>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:pdf='http://ns.adobe.com/pdf/1.3/'>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xap='http://ns.adobe.com/xap/1.0/'>
<xap:ModifyDate>2006-10-24T16:47:28-04:00</xap:ModifyDate>
<xap:CreateDate>2006-10-24T16:47:27-04:00</xap:CreateDate>
<xap:MetadataDate>2006-10-24T16:47:28-04:00</xap:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'>
<xapMM:DocumentID>uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8</xapMM:DocumentID>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:dc='http://purl.org/dc/elements/1.1/'>
<dc:format>application/pdf</dc:format>
<dc:creator>
<rdf:Seq>
<rdf:li>Matthew Beacom</rdf:li>
<rdf:li>Reed Beaman</rdf:li>
</rdf:Seq>
</dc:creator>
<dc:subject>
<rdf:Bag>
<rdf:li>Preservación digital</rdf:li>
<rdf:li>Archivos digitales</rdf:li>
<rdf:li>Metadatos</rdf:li>
</rdf:Bag>
</dc:subject>
</rdf:Description>
</rdf:RDF>
</x:xmpmeta>
<?xpacket end='r'?>
Propiedades XMP de tipo
simple
XAP(eXtensible Authoring and
Publishing): metadatos internos
que se usaban en versiones
anteriores de Adobe,
mantenidos por razones de
compatibilidad
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?><?adobe-xap-filters esc="CR"?>
<x:xmpmeta xmlns:x='adobe:ns:meta/' x:xmptk='XMP toolkit 2.9.1-13, framework 1.6'>
<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:iX='http://ns.adobe.com/iX/1.0/'>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:pdf='http://ns.adobe.com/pdf/1.3/'>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xap='http://ns.adobe.com/xap/1.0/'>
<xap:ModifyDate>2006-10-24T16:47:28-04:00</xap:ModifyDate>
<xap:CreateDate>2006-10-24T16:47:27-04:00</xap:CreateDate>
<xap:MetadataDate>2006-10-24T16:47:28-04:00</xap:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'>
<xapMM:DocumentID>uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8</xapMM:DocumentID>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:dc='http://purl.org/dc/elements/1.1/'>
<dc:format>application/pdf</dc:format>
<dc:creator>
<rdf:Seq>
<rdf:li>Matthew Beacom</rdf:li>
<rdf:li>Reed Beaman</rdf:li>
</rdf:Seq>
</dc:creator>
<dc:subject>
<rdf:Bag>
<rdf:li>Preservación digital</rdf:li>
<rdf:li>Archivos digitales</rdf:li>
<rdf:li>Metadatos</rdf:li>
</rdf:Bag>
</dc:subject>
</rdf:Description>
</rdf:RDF>
</x:xmpmeta>
<?xpacket end='r'?>
Propiedades XMP de
tipo array sin ordenar:
una lista de valores en la
cual el orden no es
significativo
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?><?adobe-xap-filters esc="CR"?>
<x:xmpmeta xmlns:x='adobe:ns:meta/' x:xmptk='XMP toolkit 2.9.1-13, framework 1.6'>
<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:iX='http://ns.adobe.com/iX/1.0/'>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:pdf='http://ns.adobe.com/pdf/1.3/'>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xap='http://ns.adobe.com/xap/1.0/'>
<xap:ModifyDate>2006-10-24T16:47:28-04:00</xap:ModifyDate>
<xap:CreateDate>2006-10-24T16:47:27-04:00</xap:CreateDate>
<xap:MetadataDate>2006-10-24T16:47:28-04:00</xap:MetadataDate>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'>
<xapMM:DocumentID>uuid:1aa82404-7080-4651-bfef-1dd39b9b9ed8</xapMM:DocumentID>
</rdf:Description>
<rdf:Description rdf:about='uuid:1d862a03-e87a-414c-a3bc-438844b8b643'
xmlns:dc='http://purl.org/dc/elements/1.1/'>
<dc:format>application/pdf</dc:format>
<dc:creator>
<rdf:Seq>
<rdf:li>Matthew Beacom</rdf:li>
<rdf:li>Reed Beaman</rdf:li>
</rdf:Seq>
</dc:creator>
<dc:subject>
<rdf:Bag>
<rdf:li>Preservación digital</rdf:li>
<rdf:li>Archivos digitales</rdf:li>
<rdf:li>Metadatos</rdf:li>
</rdf:Bag>
</dc:subject>
</rdf:Description>
</rdf:RDF>
</x:xmpmeta>
<?xpacket end='r'?>
Propiedades XMP de
tipo array ordenada:
una lista en la cual el
orden es importante
•
•
•
<?xpacket begin='' id='W5M0MpCehiHzreSzNTczkc9d'?><?adobe-xap-filters esc="CR"?>
<x:xmpmeta xmlns:x='adobe:ns:meta/' x:xmptk='XMP toolkit 2.9.1-13, framework 1.6'>
<rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#' xmlns:iX='http://ns.adobe.com/iX/1.0/'>
•
•
•
•
<rdf:Description rdf:about='uuid:4cde4cb6-4e5e-4131-92b4-52cddc17dede'
xmlns:pdf='http://ns.adobe.com/pdf/1.3/'>
<pdf:Producer>Acrobat Web Capture 6.0</pdf:Producer>
</rdf:Description>
•
•
•
•
•
•
<rdf:Description rdf:about='uuid:4cde4cb6-4e5e-4131-92b4-52cddc17dede'
xmlns:xap='http://ns.adobe.com/xap/1.0/'>
<xap:ModifyDate>2007-05-30T13:51:02-03:00</xap:ModifyDate>
<xap:CreateDate>2007-05-30T13:51:02Z</xap:CreateDate>
<xap:MetadataDate>2007-05-30T13:51:02-03:00</xap:MetadataDate>
</rdf:Description>
•
•
•
•
<rdf:Description rdf:about='uuid:4cde4cb6-4e5e-4131-92b4-52cddc17dede'
xmlns:xapMM='http://ns.adobe.com/xap/1.0/mm/'>
<xapMM:DocumentID>uuid:26df1155-421a-48cf-884b-1880c8b6e6be</xapMM:DocumentID>
</rdf:Description>
•
•
•
•
<rdf:Description rdf:about='uuid:4cde4cb6-4e5e-4131-92b4-52cddc17dede'
xmlns:dc='http://purl.org/dc/elements/1.1/'>
<dc:format>application/pdf</dc:format>
•
•
•
•
<dc:title>
<rdf:Alt>
<rdf:li xml:lang='x-default'>Preservation metadata [IYLIM 2003-2003]</rdf:li>
</rdf:Alt>
</dc:title>
•
</rdf:Description>
•
•
•
</rdf:RDF>
</x:xmpmeta>
<?xpacket end='r'?>
Propiedad XMP de tipo array
alternativa: conjunto de uno o más
valores, uno de los cuales debe ser
seleccionado.
No hay una regla específica para la selección
de alternativas. En algunos casos la
aplicación puede hacer la elección, en otros
casos puede hacerla el usuario. El primer
ítem del array es considerado el valor por
defecto por el RDF
Paneles de ingreso de metadatos
(Adobe Acrobat 6.0 Professional )
Esquema
PDF
Esquema
DC
Keyword
Subject
Ubicación y denominación de la caja
Palabras clave
(Archivo  Propiedades de documento)
Subject
Palabras clave (Avanzadas  Metadatos de documento)
Description
Asunto
(Archivo  Propiedades de documento)
Descripción (Avanzadas  Metadatos de documento)
Author
Creator
Autor*
(Archivo  Propiedades de documento)
Autor**
(Avanzadas  Metadatos de documento)
* Si hay más de uno, se cargan como una sola ocurrencia tanto en el esquema PDF como en el DC
** Si hay más de uno, se carga solo el primero en el esquema PDF y se abren las ocurrencias
necesarias en el DC
Procesando con Greenstone

Archivo de colección collect.cfg
–
–
–
–
–
–
–
–
–
–
creator Dirección electrónica del creador de la colección
maintainer Dirección electrónica del actualizador de la colección
public Determina si la colección va a ponerse a disposición del público o no
indexes Lista de índices por crear
languages Lista de lenguas en las que hay que crear los índices
collectionmeta Define los metadatos al nivel de la colección
plugin Especifica un conector que habrá de utilizarse durante la creación
format Cadena de formato
classify Especifica un clasificador que habrá de utilizarse durante la creación
..:
Configuración de PDFPlug

Configuración de PDFPlug
. . .
Plugin GAPlug
Plugin HTMLPlug -smart_block
Plugin PDFPlug -metadata_fields Title<dc.Title>,Author<dc.Creator>,
Subject<dc.Description>,Keywords<dc.Subject>
Plugin MetadataXMLPlug
Plugin ArcPlug
Plugin RecPlug
. . .
No recupera los esquemas xap
y dc. Etiquetas con más de dos
datos en una sola ocurrencia
(dc. Creator, dc. Subject)
Creación de un nuevo plugin



Consulta a la lista
[email protected]
John Thompson (DL Consulting): “…el
veredicto es que el PDFPlug no soporta los
metadatos de XMP…”, y por ello …
… escribió un nuevo Plugin para extraer esos
metadatos: el MetadataXMPPlug
Nuevo Plugin: MetadataXMPPlug
plugin
plugin
plugin
plugin
plugin
plugin
plugin
GAPlug
HTMLPlug -smart_block
MetadataXMPPlug
PDFPlug
MetadataXMLPlug
ArcPlug
RecPlug
Recuperación de los esquemas xap y dc.
Una ocurrencia para cada dato de un determinada etiqueta
Bibliografía





Adobe Systems Incorporated. A manager’s introduction to Adobe
eXtensible Metadata Platform : the Adobe XML metadata framework.
Disponible en:
http://www.adobe.com/products/xmp/pdfs/whitepaper.pdf [Consultado:
12 Jun. 2007].
Adobe Systems Incorporated. Extensible Metadata Platform (XMP).
Disponible en: http://www.adobe.com/products/xmp/index.html
[Consultado: 12 Jun. 2007].
Adobe Systems Incorporated. PDF Reference : Adobe portable
document format : version 1.6. Disponible en:
http://www.adobe.com/devnet/pdf/pdfs/PDFReference16.pdf
[Consultado: 12 Jun. 2007].
Adobe Systems Incorporated. XMP Specification. Disponible en:
http://www.adobe.com/devnet/xmp/pdfs/xmp_specification.pdf
[Consultado: 12 Jun. 2007]
Bainbridge, David ; McKay, Dana; H. Witten, Ian. Guía del
programador : Biblioteca Digital Greenstone. Disponible en:
http://www.greenstone.org/manuals/gsdl2/es/html/Develop_es_index.h
tml [Consultado: 12 Jun. 2007].





Bray, Tim. What is RDF?. Disponible en:
http://www.xml.com/pub/a/2001/01/24/rdf1.html [Consultado: 12 Jun.
2007].
Myers, Chuck. Adding intelligence to media : metadata Strategy Adobe
XMP – PRIMEX. Disponible en:
http://www.idealliance.org/primex/presentations/04/slides/myers.pdf
[Consultado: 12 Jun. 2007]
Roszkiewycz, Ron. Metadata in context. Disponible en:
http://www.adobe.com/products/xmp/pdfs/seybold_metadata.pdf
[Consultado: 12 Jun. 2007]
World Wide Web Consortium. RDF Primer : W3C Recommendation 10
February 2004. Disponible en: http://www.w3.org/TR/2004/REC-rdfprimer-20040210/ [Consultado: 12 Jun. 2007].
World Wide Web Consortium. RDF Semantics : W3C Recommendation
10 February 2004. Disponible en: http://www.w3.org/TR/2004/REC-rdfmt-20040210/ [Consultado: 12 Jun. 2007].
¡Muchas Gracias
por su atención!
Descargar

Diapositiva 1