Gestión de recursos en Internet y
estrategias para combatir la
sobrecarga de información
Javier Iglesia Aparicio
Coordinador de tecnología del CITA
A Coruña, 5-8 de mayo de 2014
INTRODUCCIÓN
Índice
La información en la web actual
Búsqueda eficaz de información
Interoperabilidad e intercambio de información en la Web
Almacenar y recuperar información
Organización de fuentes de información y servicios con mash-up
El futuro de la web: la web semántica
INTRODUCCIÓN
Objetivos
Conocer cómo es y se organiza la información en la Web
Buscar información
Conocer la utilidad de RSS
Aprender a usar los marcadores sociales
Aprender a usar los mash-up
Iniciarse en la web semántica
Ser más eficientes en el almacenamiento, la consulta
y la recuperación de información en la web 2.0
INTRODUCCIÓN
Toda la información está disponible en
http://tallersg2.wikispaces.com
La Información en la Web
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
La evolución de la web 1991-2014
Desde el punto de vista del navegante:
• Web 1.0 = Lectura
Individual
• Web 2.0 = Lectura + Escritura
Social
Desde el punto de vista del creador de contenidos:
• Web 1.0 = muchos conocimientos técnicos + alojamiento
• Web 2.0 = pocos conocimientos técnicos + almacenamiento en
la nube
Desde 2012: la Web de los datos
Tecnología de web semántica + Big Data + Visualización +
Ubicuidad + Concepto Open
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
Web 2.0 o Social : donde reside la Inteligencia Colectiva
Forma de inteligencia resultado de la colaboración de muchos individuos.
Se mantiene en permanente actualización
Crecimiento constante
Información distribuida y replicada: resistente a desastres
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
El principal cambio
De mero consumidor a prosumidor (prosumer)
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
Factores que han provocado una nueva forma de
organización de la información
• Aparición de la web 2.0: popularización y simplificación
• Popularización de dispositivos electrónicos portátiles
• Mejora y expansión de la banda ancha
• Programación como competencia básica
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
Características de la información en la web 2.0
• Volumen ingente y creciendo
• Dispersión de fuentes
• Multiformato: no sólo texto
• Comportamiento casi orgánico
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
Algunos datos enormes
A fines de 2010
• 1.996 millones de usuarios conectados (360 en el año 2000)
• 1,2 ZB de información (10 filas de libros entre la Tierra y Plutón)
• 230 millones de servidores
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
¿Encuentras fácilmente lo que buscas en Internet?
¿Qué cuesta más encontrar?
¿En ocasiones te sobrepasa?
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
Sobrecarga de información o Infoxicación
Se dispone de más información de la que realmente
se puede procesar
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
Causas de la sobrecarga de información
•Volumen ingente disponible y en crecimiento
•Mayor número de canales de información y de
fuentes dentro de cada canal
•Facilidad de duplicación y transmisión de la
información digital
•Contradicciones e inexactitudes de la información
disponible
•Falta de conexión entre fragmentos de información
que pueden estar relacionados
•Falta o desconocimiento de herramientas
adecuadas.
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
¿Cómo nos afecta la sobrecarga de información?
•Pérdida de la atención
•Disminuye la concentración
•Falta de seguridad en la toma de decisiones
•Gestión del tiempo no adecuada
•Sensación de ansiedad
•Falta o desconocimiento de herramientas adecuadas.
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
Soluciones
• Utilización adecuada de las funciones avanzadas de los
buscadores y buscadores personalizados
•Utilización de buscadores específicos
•Uso de herramientas de almacenamiento personalizadas
•Selección y organización de fuentes
•Creación de puntos de acceso a la información a medida:
cuadros de mando, escritorios personalizados, alertas
Aprender a gestionar la información que existe
en la web en nuestro propio beneficio
Búsqueda eficaz de información en la Web
TEMA 1
¿POR QUÉ UNA BÚSQUEDA EFICAZ?
Los buscadores actuales …
1.
2.
3.
Una serie de robots o arañas web rastrean las webs
Las palabras extraídas se indexan y se asigna una relevancia a los sitios de donde
son extraídas
Una interfaz gráfica permite la consulta de estos datos y se presentan resultados
Aunque tienen en cuenta cientos de factores, los resultados se basan principalmente
en:
Frecuencia de aparición de una o varias palabras en un texto
Posición dentro de documento
Los enlaces que el documento tiene con otros web
Los enlaces que llevan a la web
TEMA 1
¿POR QUÉ UNA BÚSQUEDA EFICAZ?
… dan búsquedas:
Poco precisas
Muy dependientes del vocabulario utilizado empleado en la búsqueda
No saben atender a las peculiaridades del lenguaje humano: sinonimia, homonimia,
polisemia… (aunque van mejorando)
Obvian todos aquellos documentos que no tienen texto rastreable: audio, texto dentro de un
vídeo o de un flash… aunque existen esfuerzos para mejorar como Goggles
TEMA 1
¿POR QUÉ UNA BÚSQUEDA EFICAZ?
Buscar en Internet es …
… una destreza básica en la sociedad actual
… el servicio más utilizado de los que se ofrecen
en Internet
Por lo tanto si sabemos buscar bien, si somos
eficaces
en
nuestras
búsquedas,
ahorraremos mucho tiempo y obtendremos
mejores resultados
TEMA 1
¿POR QUÉ UNA BÚSQUEDA EFICAZ?
¿Es fácil buscar en Internet?
¿Por qué las personas tardan tiempos
diferentes en obtener los resultados
usando el mismo enunciado?
TEMA 2
EL PLAN DE BÚSQUEDA PARA EL ALUMNO
El plan de búsqueda
Definir la búsqueda
Seleccionar la herramienta adecuada
y los elementos de búsqueda
Analizar y evaluar los resultados obtenidos
TEMA 3
DEFINIR LA BÚSQUEDA
Los componentes de una búsqueda
Tenemos que pensar cómo iniciar la búsqueda:
• Los términos de la búsqueda
• Los operadores lógicos
• El tipo de documento que queremos obtener
• Otras restricciones: cuándo, dónde…
TEMA 3
DEFINIR LA BÚSQUEDA
Los términos de la búsqueda
• Son las palabras que determinan lo que queremos obtener
• Cuantas más palabras más se define la búsqueda
• Las frases filtran aún más (“”)
• El idioma es también muy importante
Herramienta para visualizar la importancia
de la elección de los términos:
http://www.gleancomparisonsearch.org/index.php
TEMA 3
DEFINIR LA BÚSQUEDA
Los operadores lógicos
• Por defecto los buscadores realizan un AND (Y lógico)
• OR, que aparezca o un término u otro.
• NOT, que no aparezca un término de búsqueda.
Herramienta para experimentar búsqueda
con operadores lógicos:
http://www.boolify.org
TEMA 3
DEFINIR LA BÚSQUEDA
Otras restricciones
• Tipo de documento
• Sitio web
• Lenguaje
• País
• Fecha de publicación
Suelen ser opciones de la búsqueda avanzada.
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Herramientas para la búsqueda
Motores de búsqueda o buscadores
Integración de motores de búsqueda en nuestro navegador y otras aplicaciones
Multibuscadores
Buscadores privados
Buscadores específicos y verticales
Metabuscadores
Marcadores sociales
Buscadores semánticos
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
¿Cómo elegir la adecuada?
Buscadores para consultas generales
Buscadores específicos si el tema está acotado
Buscadores semánticos para encontrar relaciones: aún poco
desarrollados
http://www.noodletools.com/noodlequest/
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Motores de búsqueda o buscadores
Ranking en octubre de 2014:
Google
Baidu
Yahoo! Search
Bing
AOL
Ask
(1)
(2)
Global (1)
69,56 %
17,01 %
6,31 %
5,86 %
0,23 %
0,13 %
Datos de NetMarketShare
Datos de StatCounter
España (2)
94,54%
-2,65 %
2,09 %
---
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Ayudas de los buscadores
Cada buscador tienen sus peculiaridades.
¿Por qué no dedicar un poco de tiempo al manual de instrucciones?
Google
http://support.google.com/websearch/?hl=es#topic=1221265
Yahoo! Search
http://help.yahoo.com/l/es/yahoo/search/basics/;_ylt=AhtJGVcrEeWwOvcqnKDeL4HtvCN4
Bing
http://onlinehelp.microsoft.com/es-ES/bing/ff808535.aspx
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Los consejos mínimos al usar un buscador
•
•
•
•
Enriquecer la búsqueda con palabras adicionales, es decir,
introducir varias palabras para que muestren sólo las páginas en
las que aparecen todas ellas. AND
Utilizar comillas. De esta forma los motores de búsqueda
buscarán frases completas y refinaremos más la búsqueda.
Utilizar el signo menos (-) para excluir palabras. NOT
Usar el operador OR.
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Otros operadores
•
define:
Para obtener resultados de definiciones
define:protón
•
site:
Para obtener resultados exclusivamente de cierto sitio web
“peñaranda de bracamonte” site:www.lagacetadesalamanca.es
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Otros operadores
En Google:
•
•
•
•
filetype: tipo de fichero
related: sitios relacionados
link:
enlaces a otras webs
El comodín *
•
Operadores + (incluir término) y ~ (término similar o
leopardo filetype:pdf
related:fundaciongsr.es
link:fundaciongsr.es
sinónimo)
•
Intervalo numérico ...
•
En el título: intitle o allintitle (varias palabras)
Todos los operadores en este enlace
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Trucos de Google
Calculadora
Clima
Conversor de unidades de medida
Cartelera de cine
Conversor de monedas
Más en http://www.google.es/intl/es/help/features.html
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Búsquedas avanzadas
Google
Yahoo! Search
Bing
http://www.google.es/advanced_search
http://es.search.yahoo.com/web/advanced
Aparece una vez realizada una búsqueda
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
PRÁCTICA 1 – Operadores de búsqueda en Google
Acceder a
http://tallersg2.wikispaces.com/
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Crear un buscador personalizado
Google Búsqueda Personalizada: http://www.google.es/cse/
Nos permite crear uno o varios buscadores definiendo en qué sitios webs
queremos buscar.
Se pueden exportar a un blog u otro website.
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
PRÁCTICA 2 – Crear un buscador personalizado
Acceder a
http://tallersg2.wikispaces.com
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Integración de buscadores en el navegador
Se pueden instalar nuevos proveedores de búsqueda en:
- Mozilla Firefox
- Internet Explorer 8+
Y en otros navegadores:
- Chrome: como aplicaciones
- Safari: como extensiones
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Multibuscadores
Realizar búsquedas simultáneas en varios motores de búsqueda y otras fuentes
No almacenan datos propios. Se basan en servicios de motores de búsqueda.
Googleyahoo
WebCrawler
Zoo.com
SearchCredible
Fefoo
Zuula
Yabigo
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Multibuscadores privados
Los servicios de búsqueda en la Web almacenan nuestros datos para darnos resultados más
adecuados, pero también para tratar de vendernos más.
¿Opciones para buscar seguro?
Ixquick https://ixquick.com/esp/
DuckDuckGo http://duckduckgo.com/
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Buscadores y multibuscadores para niños
Hacen uso de los motores de búsqueda tradicionales pero integran filtrado de contenido y
adaptan algo el interfaz visual
Aol Kids o KOL Search: http://kids.aol.com/
Basados en SafeSearch de Google:
–
–
–
–
GoGooligans: http://www.gogooligans.com/
KidRex: http://www.kidrex.org/
Bebeeee: http://www.bebeeee.com/ (español)
KidTopia: http://www.kidtopia.info/
Infotopia: http://www.infotopia.info/
Instagrok: http://www.instagrok.com/
(buscador visual de conceptos)
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Buscadores específicos: por tipo de archivo
Imágenes
Google Imágenes (http://www.google.es/imghp), GoGraph (http://www.gograph.com/)
Picsearch (http://www.picsearch.com/) y Yahoo! Picture Gallery (http://images.search.yahoo.com)
Además de las herramientas Flickr y Picasa.
PDF
PDFSearchEngine (http://www.pdfsearchengine.org/) y SearchPDF (http://www.searchpdf.com/ )
Presentaciones
Scribd (http://www.scribd.com/), SlideShare (http://www.slideshare.net/)
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Buscadores específicos: por tipo de archivo
Audio:
Generalistas: BeeMP3 (http://beemp3.com/) y AudioRaider (http://www.audioraider.com/)
Podcasts: iVoox (http://www.ivoox.com/)
Efectos sonoros: Soungle (http://www.soungle.com/) y FreeSFX (http://www.freesfx.co.uk/).
Vídeo:
Aparte de los conocidos sitios de visión de vídeo como YouTube, Vimeo, Blip.tv… existen buscadores
que rastrean todos estos lugares y nos proporcionan resultados de archivos de vídeo:
Google Videos, Bing Videos y FilesTube (http://video.filestube.com/).
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Buscadores específicos: por ámbito de conocimiento
Innumerables. Cada ámbito tienen buscadores específicos que siempre dará resultados
mejores que con los buscadores generalistas.
Algunos ejemplos:
- Enciclopedias: Wikipedia
- Objetos Digitales Educativos:
Biblioteca Escolar Digital y Agrega
- Libros: Google Libros
- Artículos y otros documentos científicos:
Google Académico, World Wide Science, Microsoft Academic Search
- Arte: Románico digital
- Setas: Setas de Salamanca
…
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Internet Invisible
Los buscadores que proporcionan muchas instituciones que dan
acceso a bases de datos cuyos datos no son rastreables. Son la única
vía de acceso al Internet Invisible.
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Metabuscadores
Worldcat (http://www.worldcat.org/?lang=es) es actualmente el
metabuscador con mayor número de fuentes federadas. Contiene
OAIster (http://oaister.worldcat.org/), que fue el primer
metabuscador que hizo uso del protocolo OAI-PMH.
Hispana (http://hispana.mcu.es/) es una iniciativa del Ministerio de
Cultura español que, en octubre de 2014, cuenta con 207
repositorios digitales españoles y más de 5 millones de recursos.
Europeana (http://www.europeana.eu/ )
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Sitios de preguntas y respuestas
Yahoo! Answers
Quora
Spring.me
Todoexpertos
WikiAnswers
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
Una máquina del tiempo: archive.org
www.archive.org
Realiza copias periódicas de la gran mayoría de los sitios de Internet
Nos permite ver sitios web ya desaparecidos
O ver antiguas versiones de los mismos
Ejemplo:
https://web.archive.org/web/*/http://www.coruna.es/bibliotecas
TEMA 4
HERRAMIENTAS DE BÚSQUEDA
El extraño caso de Wolfram Alpha
Buscador basado en computación del conocimiento. Trabaja muy bien con
bases de datos numéricas y con lenguaje simbólico
-
Resolver ecuaciones: x³ - 2x +1 = 0
Hacer gráficas: circunferencia
Obtener datos estadísticos de ciudades: comparar Salamanca y Burgos
Y mucho más
TEMA 5
PEQUEÑA GUÍA PARA EVALUAR CONTENIDOS DE LA WEB
PRÁCTICA 3 – Probar Wolfram Alpha
Acceder a
http://tallersg2.wikispaces.com/
TEMA 5
PEQUEÑA GUÍA PARA EVALUAR LOS RESULTADOS
Pasos para evaluar
•
•
•
•
•
¿Dónde has encontrado la información?
¿Quién la ha escrito? ¿Quién edita el sitio web?
¿Cuándo ha sido escrito?
¿Cómo está escrito el texto? ¿Es sesgado? ¿A quién está dirigido?
¿Cita o hace referencia a otras fuentes? ¿Son fuentes fiables?
TEMA 5
PEQUEÑA GUÍA PARA EVALUAR CONTENIDOS DE LA WEB
PRÁCTICA 4 – Evaluar un contenido
Acceder a
http://tallersg2.wikispaces.com
Sindicación de contenidos
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
He escrito información en un sitio web
¿Qué puedo hacer para duplicarla en otros sitios?
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Un problema de base …
• Las páginas web no están pensadas para que su contenido sea entendido
por las máquinas.
• Las páginas dinámicas actuales usan cada una su base de datos.
• Estándares de seguridad informática.
… y algunas soluciones
• Sindicación de contenidos
• Widgets
• Estándares de intercambio Open Archive Interface (worldcat.org)
• La web semántica
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Sindicación de contenidos
Fuente o feed que
almacena las últimas
novedades
Vídeo en Youtube
Otro vídeo
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
¿Por qué usar la sindicación de contenidos?
Para quien consulta información
• Ahorra tiempo de consulta
• Nos permite ordenarlas a nuestro gusto
• Disminución del uso del correo electrónico
Para quien provee de información
• Forma sencilla de difundir nuestros contenidos
• Puede sustituir a las listas de distribución
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Estándares de sindicación de contenidos
• RSS (Really Simple Syndication): varias versiones
• Atom
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Un feed RSS por dentro
• Definición de un canal <channel> con al menos un <title>, un <link> y una
<description>
• Uno o más <item>, con al menos un <title>
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Búsqueda de fuentes RSS
• Identificar el canal RSS en el sitio web que visitamos
• Buscar en un agregador RSS
• Portales de Open Data: Galicia
• Usar un buscador de fuentes RSS
– RSSsearchhub (http://www.rsssearchhub.com/ )
– Instant RSS Search (http://ctrlq.org/rss/)
– FeedPlex (http://www.feedplex.com/ )
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Tipos de fuentes RSS
Depende del creador de contenidos
• Una única fuente con los últimos cambios
• Diversas fuentes organizadas por secciones, temáticas,…
– Suele ser típico de periódicos en línea o sitios webs con abundante información
– Muchos blogs y sitios de foros también diferencian entre fuentes de entradas y de
comentarios
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Suscripción a fuentes RSS: con un navegador
Las últimas versiones ya permiten su manejo
Se tratan como los favoritos o los marcadores y también se pueden
organizar en carpetas
Cada vez que se accede se actualiza con las novedades
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Suscripción a fuentes RSS: con un agregador de RSS
Para evitar problemas cuando trabajamos con varios ordenadores también
existen aplicaciones web y para dispositivos móviles: los agregadores RSS
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Agregadores RSS
- Suscripción
- Lectura
- Organización de fuentes en categorías
- Organización de noticias: etiquetas, importancia…
- Compartir información con otras aplicaciones y en redes sociales
- Desuscripción
- Importación / Exportación desde otras herramientas
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Importación / Exportación de fuentes RSS: OPML
OPML (Outline Processor Markup Language) permite realizar agrupaciones de
feeds RSS para exportar o importar.
Disponible en algunos navegadores y agregadores de RSS
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Feedly
El agregador RSS más utilizado actualmente tras el cierre de Google Reader
Dispone de versión para tabletas y móviles
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
PRÁCTICA 5 – Creación de una recopilación de fuentes
RSS con Feedly
Acceder a
http://tallersg2.wikispaces.com/
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Google News: agregador de actualidad
Agregador de noticias de actualidad procedentes de los medios de comunicación
más importantes.
- Posibilidad de filtrar por categoría de noticias y por países
- Permite crear nuevas categorías: por palabras clave, sección local
- Permite crear RSS categorizados
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
PRÁCTICA 6 – Configurar y probar Google News
Acceder a
http://tallersg2.wikispaces.com/
http://tallersg2.wikispaces.com
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Yahoo! Pipes
Herramienta visual para tratamiento, transformación y creación de fuentes de
información
Disponible con una cuenta Yahoo!
Nos permite crear pipes: tuberías de información
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Yahoo! Pipes
• Combinar varias fuentes en
una, ordenarlas, filtrarlas etc.
• Geolocalizar las fuentes y
consultarlas en un mapa
interactivo.
• Crear widgets para
incorporarlos en blogs, webs,
etc.
• Exportar el pipe a RSS,
JSON, KML y otros muchos
formatos.
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
PRÁCTICA 7 – Manejo de Yahoo! Pipes
Acceder a
http://tallersg2.wikispaces.com/
http://tallersg2.wikispaces.com
Servicios de información automática
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Creación de alertas automáticas
Sirven para crear alertas sobre nuevos contenidos que aparecen en la
web
Se pueden recibir por correo electrónico o se puede crear una fuente
RSS
www.google.es/alerts/
http://www.talkwalker.com/es/alerts
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Google Alerts
El servicio de alertas gratuito de Google
www.google.es/alerts/
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
PRÁCTICA 8 – Manejo de Google Alerts
Acceder a
http://tallersg2.wikispaces.com/
http://tallersg2.wikispaces.com
IFTTT
Servicio de automatización de tareas entre aplicaciones web
If This Then That
Permite crear recetas (recipes) de intercomunicación entre decenas de
servicios webs, redes sociales, RSS y correo electrónico.
También disponible para Android e iOS
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
PRÁCTICA 9 – Manejo de IFTTT
Acceder a
http://tallersg2.wikispaces.com/
http://tallersg2.wikispaces.com
Organización de la información: marcadores
sociales y portales personalizados
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
¿Cómo almacenamos la información en Internet que
obtenemos de la Web?
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Los marcadores sociales
Los marcadores sociales (social bookmarking) permiten organizar,
almacenar, gestionar y buscar marcadores de recursos en línea.
Cada registro suele ir acompañado de información adicional como
descripciones, anotaciones y etiquetas.
Además se puede seleccionar si un registro se hace público- con lo que
se pueden hacer listas públicas de enlaces- o permanece privado.
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Los marcadores sociales: ventajas
•Mantener organizado un conjunto de marcadores independientemente
del ordenador que se esté usando.
•Clasificación social basada en el conocimiento humano. Los usuarios
leen el enlace y deciden las etiquetas de clasificación, lo cual es un
grado superior a la simple indexación de las arañas web o robots
rastreadores.
Se obtiene una clasificación de la utilidad de los enlaces basada en
la experiencia humana y no en variables más técnicas como el
número de enlaces.
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Los marcadores sociales: usos
• Organizar las fuentes consultadas en la Web y agilizar su búsqueda
• Crear selecciones de fuentes individual/colectiva públicas/privadas
• Crear referencias de forma colaborativa
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Los marcadores sociales: herramientas
•De carácter general
Delicious (delicious.com)
Folkd (www.folkd.com)
Mister Wong (www.mister-wong.es)
Diigo (https://www.diigo.com )
•Para investigadores
CiteULike (www.citeulike.org)
Bibsonomy (www.bibsonomy.org)
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
El almacén de marcadores en línea más simple: Google Bookmarks
www.google.com/bookmarks/
- Almacena nuestra historial de búsquedas en el buscador Google
- Nos muestra tendencias y datos estadísticos de nuestras
búsquedas
- Nos permite añadir marcadores, comentarlos y organizarlos por
etiquetas
- Realmente no es social
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
PRÁCTICA 10 – Google Bookmarks
Acceder a
http://tallersg2.wikispaces.com/
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
Problemas en el uso de folcsonomías
Lingüísticos
Idiomas
Género y número
Tildes y otros
símbolos
ortográficos
Homonimias
Sinonimias
Polisemias
De los usuarios
Etiquetas muy
personales
Etiquetas
equivocadas
TEMA 1
LA INFORMACIÓN EN LA WEB ACTUAL
Nuevas formas de organización y representación de la información
Consejos para un buen etiquetado
• Antes de etiquetar hay que elaborar una mínima planificación
• Utiliza un número reducido de etiquetas
• Usa un lenguaje natural
• Crea etiquetas compuestas, por ejemplo usando el guión bajo (_)
• Crea siempre una etiqueta comodín o neutra
• Etiqueta con criterio
• Revisa el etiquetado de forma periódica
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Etiquetado de una página
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Delicious
Delicious es la aplicación de marcado social más antigua
Fue lanzado en el año 2003; en 2005 fue adquirido por Yahoo y se
ha desprendido de ella en 2011.
Potencia el listado público
http://delicious.com/usuario
http://delicious.com/tag/tag1
http://delicious.com/tag/tag1+tag2
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Los marcadores sociales: un ejemplo público
Biblioteca Universitaria de Sabadell (http://delicious.com/busuab)
Centro Oceonográfico de Vigo (
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
PRÁCTICA 11 – Etiquetado colaborativo con Delicious
Acceder a
http://tallersg2.wikispaces.com/
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
CiteULike
CiteULike fue el primer servicio de marcado social diseñado para
investigadores y científicos.
Posibilidad de importar/exportar a varios formatos de referencia
(RIS, BibTex)
Es capaz de obtener los datos directamente de numerosos sitios
Enfocado sobre todo al marcado social de artículos científicos
Recomendaciones automáticas sobre el mismo tema
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Pocket
Sencilla herramienta para web y dispositivos móviles que sirve
simplemente para almacenar de forma rápida enlaces pendientes
de leer
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Social news
Son un tipo especial de aplicaciones de marcado social enfocado en el
almacenamiento de enlaces a noticias
Las noticias almacenadas reciben votos positivos o negativos por parte
de los usuarios.
Las más votadas aparecen en portada
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Social news - Menéame
Lanzado en 2005 y enfocado al mundo hispanohablante
Calcula un valor llamado karma para cada usuario según las noticias que
introduzca y los votos que éstas reciban
Las noticias pueden ser comentadas, etiquetas y votadas (meneadas)
http://www.meneame.net
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Web Notetaking
Evolución de los marcadores sociales que permite almacenar otros tipos
de datos como por ejemplo:
- Anotaciones sobre una web
- Archivos multimedia
Suelen tener también versión para dispositivos móviles
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Web Notetaking simple: Google Keep
Creación rápida de:
- Notas
- Listas
- Recordatorios
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
PRÁCTICA 12 – Probar Google Keep
Acceder a
http://tallersg2.wikispaces.com/
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Web Notetaking - Diigo
Es una potente herramienta de trabajo que permite
- Guardar y organizar marcadores
- Guardar imágenes y otros formatos
- Anotar páginas web
- Resaltar párrafos o contenidos de una web
- Comentar o dejar post-it sobre una web
- Realizar capturas de pantalla totales o parciales
Permite instalar una barra de herramientas en la mayoría de los
navegadores.
También existe una aplicación para dispositivos móviles
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Web Notetaking - Diigo
También permite crear listados públicos del tipo:
www.diigo.com/user/nombreusuario
www.diigo.com/user/nombreusuario/tag
O listas específicas según las preferencias del usuario.
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
PRÁCTICA 13 – Experimentar con Diigo
Acceder a
http://tallersg2.wikispaces.com/
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Web Notetaking - Diigo
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
PRÁCTICA 14 – Webnotetaking con Diigo
Acceder a
http://tallersg2.wikispaces.com/
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Evernote
Permite almacenar notas con cualquier tipo de archivo
Tres vías de trabajo:
-Web
- Aplicación para Windows
- App para dispositivos móviles
La versión gratuita permite almacenar 60 MB mensuales (texto,
imágenes, audio, PDF).
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Ecosistema Evernote
- Skitch. Editar capturas de pantalla y hacer anotaciones; dibujar en
fotografías recien tomadas
- Penultimate. Notas manuscritas. Sólo móviles.
- Web Clipper. Captura de fragmentos de páginas web
- Evernote Hello. Introducción rápida de datos de personas. Móviles.
- Evernote Food. Fotografía de platos para compartir, valorar, etc.
- Evernote Clearly. Permite guardar páginas web en formato texto.
- Evernote Peek. Genera materiales de estudios a partir de las notas.
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Libros y marcado social
- Google Libros. www.google.es/libros
Búsqueda de libros por palabras clave que aparecen en su texto
Permite almacenar, catalogar y reseñar libros que se busquen en la
herramienta.
Organización en estanterías
-Redes en torno a los libros y su catalogación social
-LibraryThing
-QueLibroLeo
-GoodReads
-Shelfari
Catalogación social, valoraciones, comentarios y creación de grupos y
foros
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
Library Thing
1.8 millones de miembros
90 millones de libros catalogados
2,5 millones de reseñas
Más estadísticas
-Puedo crear mi Biblioteca y aportar nueva información en cada libro:
portadas, reseñas, valoraciones) e incluso añadir un libro inexistente
- Crear grupos de discusión y buscar otros a los que unirse
- Buscar información de bibliotecas, librerías cercanas
TEMA 3
MARCADORES SOCIALES: CÓMO ALMACENAR Y RECUPERAR INFORMACIÓN DE FORMA EFICIENTE
PRÁCTICA 15 – Library Thing
Acceder a
http://tallersg2.wikispaces.com/
Mashups: portales de inicio personalizados
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
¿En cuántas herramientas web tenemos una cuenta?
¿Cuántas páginas visitamos para estar al día?
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
¿Qué es un mash-up?
Un mash-up es un sitio web que nos permite acceder a datos y a
servicios de terceros y los combina para crear nuevas aplicaciones.
Aprovechemos lo que ya está hecho e inventemos nuevos servicios
TEMA 2
MECANISMOS DE INTEROPERABILIDAD E INTERCAMBIO DE INFORMACIÓN EN LA WEB 2.0
Widgets
Un widget es una pequeña aplicación que puede ser embebida en otros
sitios web por cualquier usuario que tenga los permisos adecuados de
forma que se puedan consultar o acceder a distintos servicios sin tener
que ir directamente a la página web que los proporciona.
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
La importancia del widget
El widget se convierte en la aplicación que tiende puentes entre páginas webs
• Consulta mediante un API
• Lee un RSS
Aumento incesante de widget disponibles
Fáciles de programar
Muchos sitios proporcionan ya sus propios widgets
Directorios de widgets:
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
La potencia de los mash-up
Son uno de los pilares de la Web actual
Dos puntos fundamentales:
- Facilidad de usar los recursos de las fuentes
originales haciendo uso de RSS y widgets
- La imaginación de los desarrolladores puede ser
llevada a límites insospechados
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Fundamentos de un mash-up
API, Interfaz de programación de aplicaciones
Los proveedores de servicios web proporcionan una
serie de métodos para que los programadores puedan
crear aplicaciones que accedan, con seguridad, a los
datos que almacenan
Web Widget
Pequeño programa que usa el API para acceder al
servicio y que puede ser colocado en cualquier sitio
web
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Arquitectura de los mash-up
1.
2.
3.
El usuario accede al mash-up
El sitio web que aloja el mashup se conecta con distintos
proveedores de datos y
servicios
El usuario accede a todos los
proveedores por medio del
navegador web
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Ejemplo de aplicación mash-up
• Wikiloc: catálogo de rutas andando y en bicicleta
• Utiliza mapas de Google Maps y fotografías de Panoramio
http://es.wikiloc.com
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
¿Cuántos tenéis una página de inicio en el navegador?
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Un caso especial de mash-up: los portales personalizados
• En la web 2.0 el usuario es lo importante
• Decrece la importancia del portal generalista
• Surge la posibilidad de que el usuario se cree su
propia página de entrada a la Web
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Herramientas que nos permiten crear portales personalizados
Existen sitios web que permiten a los usuarios crear páginas (start pages) usando los
principios del mash-up
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Ventajas de los portales personalizados
Para una institución:
• Desarrollo rápido de páginas informativas
Desde el punto de vista personal:
• Organización personal del acceso a la información
• Simplicidad de gestión
• Todo lo importante de un vistazo
• Ahorro de tiempo
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Symbaloo
Sencilla herramientas para crear selecciones visuales de enlaces a páginas
web y fuentes RSS. Cada pestaña se llama webmix.
· Por defecto se crean varios webmixes: escritorio, noticias y feeds
- Podemos crear nuevos webmixes públicos bien desde cero o bien reutilizando
los creados por otros usuarios
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
PRÁCTICA 16 – Crear un webmix con Symbaloo
Acceder a
http://tallersg2.wikispaces.com/
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Netvibes
Dos modos de uso:
· Página de inicio personal
· Dashboard público, página pública que permite
mostrar diferentes fuentes y servicios relacionados
con la actividad de una institución, artista…
Más de 190.000 widgets disponibles
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
PRÁCTICA 17 – Crear un dash-board privado con Netvibes
Acceder a
http://tallersg2.wikispaces.com/
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Ejemplos de uso de Universos de Netvibes
Una profesora de inglés
http://www.netvibes.com/monicatstocker
Una institución
http://www.netvibes.com/citafgsr
Una biblioteca
http://www.netvibes.com/bibmunburgos
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
PRÁCTICA 18– Crear un dashboard público con Netvibes
Acceder a
http://tallersg2.wikispaces.com/
Curación de contenidos
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
¿Qué es?
Selección de contenidos por parte de especialistas en una materia acompaña de algo de opinión y que luego
es compartida por medio tecnológicos.
Existen multitud de herramientas que en la actualidad permiten extraer contenido de la red, reeditarlo y
compartirlo de forma más o menos automatizada.
Un content curator debe de tener bien organizado los accesos a la información primaria (redes sociales,
RSS, alertas, emails), disponer de herramientas que le permitan organizar dicha información y utilizar
servicios de publicación sencillos, rápidos y atractivos.
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Una revista digital
Herramienta de mash-up que no permiten crear periódicos basados en la información actual de RSS, Twitter y
Facebook, fotos y vídeos
Ejemplos
Un ejemplo gallego
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Scoop.it
Permite crear temas definidos por varias palabras clave.
El sistema automáticamente va proponiendo contenidos que aparecen en la Web
Podemos decidir qué contenidos incorporamos a nuestro tema y editarlos
Cada contenidos se puede votar y compartir
Ejemplo:
Lecturas Bibliotecas LIJ
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Buffer
Crear mensajes para ser enviados a las redes sociales
Crear una planificación para que sea publicados de forma automática
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Storify
Recopilar contenidos de redes sociales filtrando por palabras clave
Generar una narración basada en informaciones en tiempo real
Enfocada al seguimiento de acontecimientos, conferencias, eventos y actividades
Ejemplos:
-Seguimiento de
un hashtag: https://storify.com/RecBib/biblioenamora-a-la-biblioteca
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
PRÁCTICA 19– Crear un Storify
Acceder a
http://tallersg2.wikispaces.com/
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
Pearltrees
Herramienta de content curator visual
Permite crear y compartir colecciones de URL en forma de perlas
Ejemplo
La web semántica
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Problemas de la web actual
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Problemas de la web actual
No tiene mecanismos de procesado automático de la información
No hay mecanismos de interoperabilidad completa de los sistemas de información:
-
Interoperabilidad sintáctica: los datos no están estructurados de acuerdo a un formato de
entiendan todas las máquinas
-
Interoperabilidad semántica: no es posible trabajar con el significado de los textos. Las máquinas
no entienden de sinónimos, homónimos, polisemias…
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Los buscadores actuales …
1.
2.
3.
Una serie de robots o arañas web rastrean las webs
Las palabras extraídas se indexan y se asigna una relevancia a los sitios de donde
son extraídas
Una interfaz gráfica permite la consulta de estos datos y se presentan resultados
Los resultados se basan el frecuencia de aparición de una o varias palabras en un
texto así como en los enlaces que el documento tienen con otros web
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
… dan búsquedas:
Poco precisas
Muy dependientes del vocabulario utilizado empleado en la búsqueda
Obvian todos aquellos documentos que no tienen texto rastreable: audio, texto dentro de un
vídeo o de un flash… aunque existen esfuerzos para mejorar como Goggles
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Queremos resultados como este:
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Solución
Cambiar el modo de presentación de los datos en las
páginas web.
Hay que proporcionar más datos que ayuden a las máquinas (a los buscadores) a procesar
la información para que nos den mejoren respuestas
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Solución
El canguro cuida del niño
El Niño afecta a los canguros
HTML
<p>El canguro cuida del niño</p>
Web estructurada
<p>El <profesion>canguro</profesion>
cuida del <persona>niño</persona></p>
<p>El Niño afecta a los canguros</p>
<p>El <clima clase=“fenomeno”> Niño
</clima> afecta a los <animal class=
“marsupial”> canguros</animal></p>
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Un primer intento: microformatos
Un microformato es una forma simple de agregar significado semántico a un contenido
legible por el humano y que para la máquina es sólo texto plano.
hCard
<div class="vcard">
<div class="fn">Juan Pérez</div>
<div class="org">El Ejemplo S. A.</div>
<div class="tel">604-555-1234</div>
</div>
Mantenidos y creados por la comunidad de
http://microformats.org/
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Algo más avanzado: metadatos
Datos sobre los datos basados en estándares
Suelen ser muy específicos
Mucha diversidad y sin compatibilidad entre sí
Se pueden combinar con tesauros o vocabularios controlados
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Vocabularios estructurados: tesauros
Catalogar o enlazar datos con un vocabulario cerrado
Se sabe exactamente el ámbito de conocimiento al que se refiere un dato
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
El intento de verdad: la web semántica
Se basa en añadir metadatos semánticos y de ontologías a las páginas web para describir
el contenido, el significado y la relación de los datos
Es la web de los datos. Más concretamente, la web de los datos relacionados
El objetivo es crear un medio universal que permita el
intercambio de datos y brindar un mayor significado a
la misma para que puedan ser interpretadas por las
máquinas.
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
El intento de verdad: la web semántica
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Estándares
•
•
•
•
Una formato para describir recursos: RDF, RDFa
Un formato para describir ámbitos de conocimiento (ontologías): SKOS, OWL
Lenguajes para preguntar por los datos: SPARQL
Lógica para que las máquinas puedan hacer inferencias
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Ontología
Representación formal de un ámbito de conocimiento, proporcionando un vocabulario junto con
sus restricciones
Capturan el conocimiento consensuado de un modo genérico
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Datos enlazados
Linked Data. Se trata de enlazar datos entre sí que previamente no lo estaban, creando
relaciones estructuradas con URL y RDF.
Los documentos accesibles por la web deben de estar anotados o descritos en
RDF relacionando su contenido con otros documentos descriptivos.
Para saber más: Guía breve de Linked Data del W3C
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Datos abiertos
Open Data.
La gran mayoría de las administraciones poseen datos de interés públicos que debe
de estructurar y de poner al servicio del conocimiento en la Web sin restricciones de
copyright u otros mecanismos de control
Numerosas iniciativas sobre todo en países anglosajones
data.gov en Estados Unidos
data.gov.uk en Reino unido
data.gov.au en Australia
Data.gc.ca en Canadá
En España iniciativas autonómicas (Asturias , País Vasco,etc.) y estatal (http://datos.gob.es)
Buscador de datos abiertos: Open Data Search
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Datos enlazados y abiertos
Linked Open Data. Datos fiables abiertos y estructurados para ir construyendo la Web
semántica
Los documentos accesibles por la web deben de estar anotados o descritos en
RDF relacionando su contenido con otros documentos descriptivos
http://linkeddata.org/
Mapa de Linked Open Data
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
¿Qué permitirá la web semántica?
•
Buscar de una forma que ahora es imposible
–
Resultados muy precisos
–
Contemplarán sinónimos y otro tipo de relaciones
Busca todos los electricistas que estén en 5 km. a la redonda de mi posición y muéstrame primero a
los más baratos
•
Uso de agentes personales inteligentes. Aprenderán de nuestras búsquedas y
nos guiarán hacia los mejores resultados.
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Unas reflexiones
•
•
•
•
No será un paso inmediato
Crear ontologías es muy costoso: grupos interdisciplinares y amplios grados de
consenso
Las herramientas de gestión de contenidos aún no están preparadas
Existen muchas iniciativas de estructuración de datos:
Dbpedia: extraer datos estructurados de Wikipedia
Freebase: base de datos social que elabora grafos de entidades
Pero el mayor paso ha sido el consorcio schema.org impulsado por Google, Yahoo!, Bing y
Yandex
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Schema.org
•
•
Modelo de marcado semántico para identificar el tipo y la semántica de una página
web o de secciones de ella.
Esquemas definidos: Trabajo creativo (libro, película, receta…), Organización,
Persona, Lugar, Evento, etc. http://schema.org/docs/schemas.html
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Buscadores semánticos
Un buscador semántico es aquel que realiza el rastreo atendiendo al
significado del grupo de palabras que se escriben y no en las simples etiquetas.
Usan tanto tecnologías de web semántica como de procesado natural del lenguaje.
TEMA 4
ORGANIZAR HERRAMIENTAS E INFORMACIÓN EN LA WEB 2.0
PRÁCTICA 20 – Probar los buscadores semánticos
Acceder a
http://tallersg2.wikispaces.com/
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Catalogaciones semánticas
-
Museos: mismuseos.net, Fundación Lázaro Galdiano
Bibliotecas: Biblioteca Digital Hispánica (Para saber más)
Educación: bibliotecaescolardigital.es, didactalia.net
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Otros ejemplos
Buscador y comparador de opiniones de
artículos de compra
Herramienta de creación de comunidades
de conocimiento
Buscador de eventos y actividades cercanos
en ciudades de USA (http://scout.me)
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Google también se semantiza
KnowledgeGraph. Utiliza:
Datos bien estructurados como los infobox de Wikipedia
Marcado semántico: schema.org
TEMA 5
EL FUTURO DE LA WEB: LA WEB SEMÁNTICA Y MÁS
Y más allá
GRACIAS
Gracias por su atención
Javier Iglesia
[email protected]
@jiglapa
Descargar

Titulo principal