Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Motores de búsqueda para usos
académicos 2009
(v1)
Rafael Pedraza y Lluís Codina
[email protected] | [email protected]
Área de Ciencias de la Documentación. Departamento de
Comunicación
Universidad Pompeu Fabra
Valencia, Octubre 2009
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Contenidos del curso
• Parte 1: Fundamentos en buscadores
• Parte 2: Buscadores para usos académicos
• Parte 3: La Ciencia 2.0
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Parte 1: Fundamentos en buscadores
1.
¿Qué es la Web?
2.
¿Qué es un buscador?
3.
Historia de los buscadores
4.
Buscadores vs. Directorios
5.
Funciones de un motor de búsqueda
6.
Componentes de un motor de búsqueda:
1. El Spider de un buscador
2. Formularios de búsqueda
3. Software de relevancia
4. Página de resultados
7.
Principales buscadores generalistas
8.
Los Metabuscadores
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
¿Qué es la Web? (I)
• La Web es un sistema hipertextual que funciona
sobre Internet, permitiendo la consulta de documentos
o páginas web y la navegación a través de las mismas.
• Web invisible: constituyen esta web todas aquellas
páginas que escapan a los índice de los motores de
búsqueda generalistas. Forman parte de esta web
algunas páginas generadas dinámicamente (p.e. como
respuesta a una consulta) o aquellas páginas que
forman parte de intranets o de sitios web que requieren
acceso mediante contraseñas
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
¿Qué es la Web? (II)
• Web 2.0: es el término acuñado para referirse a la
nueva web que se caracteriza por la dimensión social
y comunicativa aparecida en la web, y de la que son
buen ejemplo los blogs, redes sociales, foros, wikis,
etc.
• ¿Existe una Web 3.0?:
• Web Semántica: evolución tecnológica de la web actual
hacia una nueva web que persigue la comprensión de
sus contenidos por las máquinas.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
¿Qué es un buscador?
• Los buscadores, o motores de búsqueda, son
sistemas de información documental que permiten
realizar consultas y recuperar información contenida en
la Web.
• Hoy día estas aplicaciones se han convertido en la
principal herramienta para acceder a los contenidos
de la Web.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Historia de los buscadores
• < 1990: Sistemas de búsqueda de archivo no Web:
Archie
• 1990: Nace la Web
• 1994: Web Crawler
• 1995: Altavista, Excite, Infoseek
• 2001: Llegada de Google (PageRank)
• 2004: Yahoo! Buscador, Clusty, MSN Search
• 2005: Windows Live
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Buscadores vs. Directorios
• Existen dos formas básicas de obtener información en la
web:
– La Navegación  Directorios
– La Interrogación  Motores de búsqueda
• Creación:
– Directorios: creados y mantenidos mediante esfuerzo
intelectual.
– Buscadores: búsqueda de forma automática mediante
programas informáticos
• Resultados:
– Sitios web (Directorios) vs. Páginas web y documentos
(Buscadores)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Funciones de un motor de búsqueda
1.
Acceder a sitios web, localizar y descargar documentos.
2.
Extraer el contenido textual (y multimedia) de los
documentos descargados.
3.
Analizar e indexar el contenido de los documentos para
construir los índices del motor.
4.
Realizar el análisis de enlaces de cada página y otorgar
alguna medida de popularidad.
5.
Permitir la formulación de consultas mediante palabras
clave.
6.
Facilitar el acceso a los resultados de una consulta
ordenándolos conforme a unos criterios de relevancia.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Componentes de un motor de búsqueda
•
Un motor de búsqueda consta de un conjunto de
programas que trabajan cooperativamente. Son:
1. Rastreador del motor de búsqueda o Spider.
2. Sistema de recuperación de información:
•
Índices directos
•
Índices invertidos
3. Interfaz:
•
Formulario de consulta
•
Página de resultados
4. Software de relevancia.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Componente 1: Rastreador o Spider
•
Un spider (araña) o un crawler (rastreador) es un
programa que explora la Web de forma sistemática con
dos objetivos principales:
1. Interactuar con los servidores de sitios web para
descargar páginas web u otros documentos y
2. Obtener nuevas direcciones (URL) para añadir a
su lista de enlaces pendientes de revisar.
•
Las expresiones crawler , spider y robot (en este
contexto) son equivalentes.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Componente 2: Formularios de búsqueda
•
Los motores de búsqueda se interrogan utilizando
palabras clave. Normalmente presentan dos opciones
de búsqueda:
–
Búsqueda simple.
–
Búsqueda avanzada:
1. Búsqueda booleana.
2. Búsqueda por campos.
3. Filtros.
4. Minería de datos.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Componente 3: Software de relevancia
–
Su función es la ordenación de los resultados, es
decir, la construcción del ranking de resultados en
función de unos criterios de relevancia. Algunos
de ellos son:
1. Enlaces: enlaces de entrada y URL.
2. Contenido/Propiedades de la página: frecuencia
/ ubicación / formato de las palabras clave, etc.
3. Resultados pagados y Resultados no pagados.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Componente 4: Página de resultados (I)
• Presenta la lista de documentos organizados en un
ranking. Ofrece las siguientes informaciones:
– Título de la página (o del documento).
– El tipo del documento (cuando no es HTML).
– Unas líneas de descripción del contenido del
documento.
– URL de la página.
– Tamaño de la página web.
y opciones:
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Componente 4: Página de resultados (II)
• Opciones:
– Obtener una versión traducida de la página con
traducción automática (en general muy deficiente).
– Ver la página en la caché de Google.
– Buscar páginas con contenidos similares.
– Navegación secuencial entre los resultados o
yendo a una página de resultados concreta (hasta
la página 90 más o menos).
– Restringir la siguiente búsqueda a los resultados
obtenidos.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Principales buscadores generalistas
• Existen cientos de buscadores que compiten entre sí
para atraer a los usuarios. No obstante, sólo cuatro
concentran la mayoría de las búsquedas. Estos son:
– Google ( http://www.google.es/ )
– Yahoo! ( http://es.yahoo.com/ )
– bing ( http://www.bing.com/ )
– Ask.com ( http://es.ask.com/ )
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Google
•
Fue creado por Larry Page y Sergey Brin en 1998, a
raíz de una idea nacida tres años antes cuando eran
estudiantes de doctorado en la Universidad de
Stanford.
•
Hoy Google está considerado el mayor y más
eficiente motor de búsqueda del mercado.
•
Las claves su éxito son:
1. Su facilidad de uso
2. La eficacia y eficiencia de su tecnología para
indexar la web
3. Su software de relevancia (PageRank)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Actividad 1
• Compare los buscadores generalistas mencionados.
Para ello defina tres consultas y compare los resultados
obtenidos en cada uno de ellos:
– ¿Qué buscador le devuelve los resultados más
apropiados para su necesidad de información?
– ¿Qué interfaz de búsqueda avanzada le parece más
“usable”? ¿y cuál más útil?
– ¿Qué página de resultados le ofrece mejores
opciones?
– Estudie las opciones de configuración de estos
buscadores.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Metabuscadores
• Son herramientas para la búsqueda de recursos web
que utilizan los índices de varios buscadores para
satisfacer las consultas de sus usuarios
• Idea principal: recoger los mejores resultados que
ofrecen diferentes buscadores para una consulta
• Justificación: constatación de que la coincidencia en
los primeros resultados de los principales buscadores
está por debajo del 1%
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Comparación de resultados: Google vs. Yahoo!
http://www.langreiter.com/exec/yahoo-vs-google.html
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Ventajas e inconvenientes de los
metabuscadores
• Ventajas:
– Evitar que los usuarios realicen su consulta en varios
buscadores
– Obtener los mejores resultados de diversos
buscadores
• Inconvenientes:
– ¿Son de calidad los buscadores que utiliza el
metabuscador?
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Principales Metabuscadores
Tradicionales:
• Metacrawler (http://www.metacrawler.com/)
• dogpile (http://www.dogpile.com/)
De agrupamiento:
• Clusty (http://clusty.com/)
Visuales:
• KartOO (http://www.kartoo.com/)
• Grokker (http://www.grokker.com/)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Actividad 2
• Formule las consultas definidas en la actividad anterior
para interrogar los metabuscadores que se han
mencionado:
– ¿Qué aspectos de estos metabuscadores le han
parecido más interesantes y por qué?
– ¿Qué metabuscador le ofrece mejores resultados?
– En su opinión ¿es más apropiado utilizar un buscador
generalista o un metabuscador?
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Bibliografía
Todo acerca de Google:
http://www.google.es/intl/es/about.html
Información sobre Yahoo! España:
http://es.docs.yahoo.com/companysite/
Descubre Windows Live:
http://www.vivelive.com/descubre/
Acerca de Ask.com España:
http://about.es.ask.com/es/docs/about/sitefeatures.shtml
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Parte 2: Buscadores para usos académicos
1.
2.
3.
4.
5.
6.
7.
8.
Los buscadores especializados
Buscadores académicos
Buscadores de libros
Buscadores de imágenes
Buscadores de informes
Buscadores de noticias
Buscadores de blogs
Otros buscadores de interés
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Buscadores especializados
• Los buscadores generalistas constituyen hoy la mejor
opción ante búsquedas sencillas y fácilmente
formulables. No obstante, estas herramientas ofrecen
resultados poco satisfactorios cuando tratamos de
encontrar información muy especializada.
• Un buscador especializado (BE) es aquel que limita su
ámbito de búsqueda a un dominio concreto, con el
objetivo de proporcionar a sus usuarios acceso a los
contenidos de calidad que sobre su área de
especialización hay en la web.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Ventajas e inconvenientes de los BE (I)
•
Ventajas:
1.
Su capacidad para buscar en páginas que no están
indexadas por los buscadores generalistas: los motores de
búsqueda especializados son capaces de indexar los
contenidos de su especialización incluso cuando estos están
ubicados en la denominada web invisible.
2.
Mayor funcionalidad y potencial de búsqueda: por ejemplo
mediante el uso de interfaces adaptados al dominio específico
que cubren.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Ventajas e inconvenientes de los BE (II)
•
Inconvenientes:
1.
Una gran desventaja de estos sistemas es la necesidad de
acudir a un buscador u otro en función de la temática que
sea de nuestro interés, lo cual disuade normalmente a los
usuarios de utilizar este tipo de herramientas.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Creación de BE
•
Existen dos modos de crear un motor de búsqueda
especializado:
1.
Construir o utilizar un índice especializado: es decir,
disponer de un registro con la descripción de los contenidos
web disponibles en internet sobre una temática concreta.
2.
Diseñar una herramienta de búsqueda que, actuando sobre la
consulta de los usuarios, permita realizar búsquedas sobre
la temática objeto de especialización.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Técnica 1: índice especializado
•
Existen tres modos de crear o utilizar un índice
especializado:
1. Generar el índice especializado indexando sólo aquellos
contenidos relacionados con la temática de interés.
2. Utilizar un sistema de metabusqueda que consulte
simultáneamente diferentes bases de datos web
especializadas en la materia de interés.
3. Realizar la recuperación de la información en tiempo real
tras formular el usuario su consulta.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Técnica 2: especialización de la consulta
• Consiste en la modificación de la consulta de sus
usuarios para adaptarlas a un dominio específico.
• Los buscadores especializados que utilizan esta técnica
no restringen la búsqueda y recuperación de la
información a un subconjunto de páginas disponibles en
la web, en su lugar se centran en limitar el tipo de
consultas que el usuario puede realizar.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Áreas de especialización
• Documentos académicos / técnicos
• Libros
• Imágenes
• Informes
• Noticias
• Blogs
• Videos
• Software
• etc.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Bibliografía
•
R. Steele. Techniques for Specialized Search Engines. 2007. [Consulta:
24/09/2007]
http://www-staff.it.uts.edu.au/~rsteele/SpecSearch3.pdf
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Buscadores académicos
• Son buscadores que sólo indizan sitios web vinculados
con el mundo académico.
• Los más importantes son:
– Scirus
– Google Scholar
– Science Research
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Inputs: fuentes de información
• La tipología de los sitios web indizados por los
buscadores académicos comprende:
– Universidades (dominio .edu)
– Centros de investigación (NASA, RAND, etc.)
– Gobierno (sitios web relacionados con la ciencia,
tecnología, etc.)
– Editores de libros y revistas
– Colecciones de bibliotecas
– Repositorios digitales (e-prints, e-books, etc.)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Outputs: tipos de documentos
recuperados
• T1: Páginas web (html) y documentos de toda clase (word,
ppt, etc.) publicados en sitios de instituciones académicas
o científicas (p.e., sitios del tipo .edu).
• T2: Artículos de publicaciones científicas, ya se trate de
publicaciones abiertas o de publicaciones de pago.
• T3: Trabajos académicos, tales como tesis doctorales o
tesis de licenciatura
• T4: Documentos depositados en repositorios científicos
• T5: Patentes
• T6: Libros, es decir, monografías, por acuerdos con
editoriales comerciales o bien a través de acuerdos con
bibliotecas
Abril 2009
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Google Scholar (I)
scholar.google.com
• Contexto
– Google
– Amplia tipología de documentos (sin patentes)
– Mayor número de documentos, pero sin información
precisa
– Completamente localizado
– Acceso a libros completos (acuerdos con bibliotecas)
• Características especiales
– Análisis de citas
– Opciones de ranking y navegación
Abril 2009
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Google Scholar (II)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Scirus (I)
www.scirus.com
• Contexto
–
–
–
–
–
Editorial Elsevier, parte de Reed-Elsevier
ScienceDirect
Scopus
Creado en el 2001
Amplia tipología de documentos (sin libros y
referencias)
– 450 millones de documentos a inicios del 2009
• Características especiales
– Opciones de búsqueda
Abril 2009
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Scirus (II)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Science Research (I)
• Contexto
– Desarrollo de Deep Web Technologies
– Utiliza la búsqueda federada (es decir, es un
metabuscador)
• Características especiales:
– Acude a casi 400 fuentes:
•
•
•
•
Colecciones de asociaciones
Repositorios
Editoriales y revistas científicas
Motores de búsqueda especializados
– Redundancia en los resultados obtenidos
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Science Research (II)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Actividad 3 (I)
• Realice un análisis comparativo de los tres buscadores
presentados. Preste especial atención en él a los
siguientes criterios:
– Opciones de búsqueda avanzada: qué opciones le ofrece cada
buscador (búsqueda a texto completo, por el título, por el autor,
por rangos de fecha, por publicación, por tipo de documento,
uso de operadores de consulta, etc.).
– Cantidad de información que son capaces de proporcionar: para
ello formule al menos tres consultas (p. ej. Web semántica, Web
social, y Cambio climático).
– Páginas de resultados de cada uno de estos buscadores
(comente brevemente su opinión con respecto a la calidad de
las mismas).
– Utilidad o relevancia (subjetiva) de los 10 primeros resultados.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Actividad 3 (II)
• Tipología documental en Scirus
– Utilizando un término vinculado con alguna disciplina científica o
área del saber…
– Intentar obtener:
• Una patente
• Una tesis doctoral
• Un artículo de publicación científica
– Sugerencia de palabras clave:
• Web semántica
• Web social
• Observaciones: puede hacer los ejercicios en parejas o en
pequeños grupos
Abril 2009
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Buscadores de libros (I)
• Contexto:
– Fracaso de los e-books a comienzos del milenio.
– Las editoriales incorporan entonces entre sus
productos los libros electrónicos (principalmente
académicos).
– Desarrollo de plataformas para el acceso a los
contenidos digitales (Bibliotecas universitarias, etc.):
•
•
•
•
NetLibrary (http://www.netlibrary.com/)
Safari Books online (http://my.safaribooksonline.com/)
Ebrary Discover (http://shop.ebrary.com/)
Amazon.com (http://www.amazon.com/)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Buscadores de libros (II)
• Soluciones más importantes:
– A9 (http://www.a9.com/)
– Google búsqueda de libros
(http://books.google.com/books)
• El presente/futuro:
– Amazon Kindle
– Sony Reader Digital Book
– Google Edition
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Actividad 4
1.
Acceda a la siguiente URL:
http://books.google.com/intl/es/googlebooks/agreement/
2.
Lea con atención la información que encontrará en ella. En
su opinión, ¿le parece acertada la iniciativa llevada a cabo
por Google? ¿cree que las instituciones académicas
pueden verse favorecidas por ella? Comparta su opinión
con sus compañeros en el debate que iniciará el profesor.
3.
Para finalizar, formule tres consultas (las mismas) en los
buscadores A9 y Google Libros. Haga un breve análisis
comparativo de sus opciones de búsqueda, páginas de
resultados, y relevancia de los resultados obtenidos
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
La búsqueda de imágenes
• Motores de búsqueda:
• Imágenes de poca calidad y con copyright.
• Interfaces de consulta inapropiados:
– Indexación inadecuada de las imágenes.
• Bancos de imágenes comerciales:
• Gestionan los derechos de los artistas.
• Imágenes de calidad: de contenido y de formato.
• Tratamiento documental de las imágenes.
• Repositorios abiertos:
• Licencias Creative Commons.
• Imágenes de calidad.
• Interfaces de consulta inapropiados.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Segmentación del mercado
• Dos grandes sectores:
– Sector Editorial:
• Prensa no diaria
• Prensa diaria
• Televisión: informativos, reportajes y documentales
– Sector Creativo:
•
•
•
•
Publicidad y relaciones públicas
Packaging
Multimedia (dvd, web)
Televisión y vídeo: video arte y cine de creación o de ficción
• Y una larga cola:
• Uso personal: invitaciones, tarjetas, webs, etc.
• Corporaciones: folletos y publicaciones de empresa
• Investigación: arte, sociología, política, historia, etc.
Abril 2009
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Buscadores de imágenes
• Búsqueda mediante palabras clave.
• Emparejamiento contra el nombre de los archivos o el
texto próximo a las imágenes.
• Opciones avanzadas:
– Tamaño.
– Formato.
– Color.
– Localización.
• Buenas opciones:
– Google images: http://images.google.es/
– bing: http://www.bing.com/images
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Bancos de imágenes comerciales
• Búsqueda por palabras clave.
• Contenidos indexados profesionalmente.
• Los más importantes:
– AGE Fotostock (a nivel nacional):
http://www.agefotostock.com
– Getty:
http://www.gettyimages.com/
– Corbis:
http://pro.corbis.com/
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Repositorios abiertos
• Búsqueda mediante palabras clave.
• Emparejamiento contra el etiquetado de las imágenes
realizado por los autores.
• Opciones de búsqueda avanzada muy limitadas
• Buenas opciones:
– Flickr Creative Commons:
www.flickr.com
– Archive.org:
www.archive.org
– MorgueFile:
www.morguefile.com
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
¿El futuro de la búsqueda de imágenes?
• Consulta de imágenes mediante ejemplo (Contentbased Image Retrieval):
– CIRES:
http://amazon.ece.utexas.edu/~qasim/cires.htm
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Actividad 4
• Para la realización de esta actividad utilice la plantilla
“EnunciadoActividad4.doc”.
• Pueden realizar estos ejercicios en parejas o pequeños
grupos.
Abril 2009
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Búsqueda de informes
• La información de carácter económico o empresarial
constituye hoy uno de los factores críticos de cualquier
institución.
• El producto más elaborado que podemos obtener dentro
de este tipo de informaciones son los informes y los
estudios de mercado.
• A diferencia de otros recursos, este tipo de información
normalmente sólo puede ser accedida previo pago.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Fuentes para la obtención de informes
y estudios de mercado (I)
• Hoover's, Inc.: información empresarial e industrial.
http://www.hoovers.com/free/
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Fuentes para la obtención de informes
y estudios de mercado (II)
• Northern Light: información financiera (Analyst Direct).
http://www.northernlight.com/
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Fuentes para la obtención de informes
y estudios de mercado (III)
• ESADE Guíame: en España es probablemente el
recurso más importante para la búsqueda de
información sectorial y empresarial.
http://www.esade.es/guiame/index_guiame.php
• ICEX (Instituto Expañol de Comercio Exterior): elabora y
difunde información sobre la oferta de productos
españoles, y sobre mercados internacionales.
http://www.icex.es
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
La búsqueda de noticias
• Contexto:
– La popularización de la Web, especialmente con la
llegada de la Web 2.0, ha propiciado la presencia de
la mayoría de los medios de comunicación en la
Web.
– La prensa escrita ha tenido que adaptarse a este
nuevo entorno para satisfacer a sus usuarios, cada
día más tecnificados.
– Aparición de los buscadores de noticias, unas
herramientas que permiten la recuperación de
noticias a partir de un gran número de fuentes
(diarios, revistas, agencias de noticias, blogs, canales
RSS, etc.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Google Noticias (I)
http://news.google.es/
• Opera en más de 40 países.
• Recoge noticias de más de 4000 fuentes (en España
más de 700).
• Agrupación de las noticias en torno a secciones.
• La selección de las noticias de cada sección se hace de
manera automática. ¿Y la selección de las fuentes?
• Dispone de interfaz de búsqueda avanzada.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Google Noticias (II)
• De cada noticia aparece: el titular, fuente y fecha, un
breve resumen, enlaces a otras noticias relacionadas, y
enlaces a otras fuentes.
• Permite la personalización del buscador (opción
“Personalizar esta página”).
• Su interfaz de consulta es casi idéntico al de Google
(Web).
• Recupera noticias tanto en formato texto como en
video, yendo muchas de ellas acompañadas de
imágenes.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Google Noticias (III)
• Todas las noticias recuperadas han sido publicadas en
los últimos 30 días.
• Otros servicios de Google Noticias son:
– Servicio de alertas de noticias por correo
electrónico.
– Suscripción a sus secciones o a alguna de sus
consultas a través de canales de contenido
sindicado (RSS y Atom).
– Interfaz para su consulta a través de dispositivos
móviles.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Google Archive Search
http://news.google.com/archivesearch
• Iniciativa de Google News de Estados Unidos para la
consulta de noticias de carácter histórico.
• Ordena sus resultados atendiendo a la importancia
histórica de los documentos recuperados.
• Con esta herramienta podemos recuperar noticias en
función de su relevancia para la consulta o bien una
cronología con las noticias publicadas para nuestra
consulta.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Yahoo! Noticias (I)
http://es.noticias.yahoo.com/
• Al igual que Google Noticias este servicio se presenta
en un portal organizado en distintas secciones.
• A diferencia de Google Noticias, estas secciones
constan de distintas subsecciones que ayudan a
organizar mejor su información.
• Como opción por defecto, Yahoo! España Noticias
ofrece noticias de su propiedad, obtenidas de
diferentes agencias (EFE, Reuters, AFP, Europa Press,
etc.) y que se visualizan en su propio portal.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Yahoo! Noticias (II)
• Ofrece la opción de búsqueda de fotos de noticias.
• Realizada una consulta recupera como resultados
noticias en los formatos: texto, video y audio.
• Otros servicios de Yahoo! Noticias son:
– Posibilidad de suscripción a tres canales de
contenido sindicado.
– Interfaz para la consulta y búsqueda de noticias
desde el móvil.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
abastodenoticias.com
http://www.abastodenoticias.com/
– Es un buscador de titulares de noticias aparecidos en la
prensa española.
– Dispone de opciones de búsqueda normal y avanzada.
– Dirigida a usuarios normales, pero sobre todo a webmasters
y administradores de páginas web interesados en
incorporar titulares de noticias en sus sitios o portales.
– Accede a más de diez mil titulares diarios de diferentes
periódicos y fuentes de información de España.
– Ofrece boletines temáticos (más de 150) de suscripción
gratuita mediante correo electrónico.
– Cuenta con 150 foros que permiten la participación libre de
sus usuarios.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Wasa Live
http://es.wasalive.com/
• Buscador de titulares de noticias que recoge más de
200.000 fuentes, entre las que se incluyen medios de
comunicación, blogs y foros.
• Recupera información en los formatos texto, imágenes
y video.
• Permite el seguimiento de una consulta mediante su
suscripción RSS.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Hemerotecas Digitales (I)
• Son colecciones de noticias ya aparecidas que se
conservan en formato digital y que permiten realizar
búsquedas retrospectivas de determinados
acontecimientos. Destacamos:
– El País (1976-)
(http://www.elpais.com/archivo/hemeroteca.html)
– La Vanguardia (1881-)
(http://www.lavanguardia.es/hemeroteca/)
– El Mundo (1994-)
(http://www.elmundo.es/papel/hemeroteca/)
– ABC (2002-) (http://www.abc.es/hemeroteca/)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Hemerotecas Digitales (II)
– La Voz de Galicia (2000-)
(http://www.lavozdegalicia.es/hemeroteca/index.htm)
– 20 minutos (2005-)
(http://www.20minutos.es/archivo/)
– Time (1923-) (http://www.time.com/time/archive/)
– The New York Times (1853-)
(http://www.nytimes.com/ref/membercenter/nytarchive
.html)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Otras opciones: BdD de prensa
• My News Online:
•
•
Participada por el grupo La Información (desde abril
de 2007)
Unas 120 fuentes nacionales (principalmente) e
internacionales
• Factiva
•
•
Grupo Dow Jones (The Wall Street Journal)
Más de 10.000 fuentes de 159 países
• LexisNexis
•
•
Grupo Red Elsevier
Más de 30.000 fuentes
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
La búsqueda de blogs
• Contexto:
– El primer blog aparece en 1993 de mano de Tim Berners
Lee.
– Su uso se populariza a partir de 1999 con la llegada de
Blogger (que en 2003 es adquirido por Google).
– Los blogs constituyen hoy un fenómeno imparable y de
continuo crecimiento en la web.
– Concentran en torno a ellos a auténticas comunidades
que comparten gustos e inquietudes similares.
– Su especialización les convierte en buenas fuentes
para detectar recursos (es decir, enlaces) valiosos
sobre su temática, así como a aquellas personas o
comunidades interesadas en la misma.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Herramientas para la búsqueda de
blogs o feeds
• Buscadores y directorios de los servicios para la
publicación de blogs.
• Agregadores o lectores de feeds (Google Reader,
Bloglines).
• Canales de contenidos sindicado (RSS y Atom de los
blogs).
• Directorios de blogs.
• Buscadores de blogs.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Directorios de blogs
• Yahoo! Directorios:
http://es.dir.yahoo.com/Internet_y_ordenadores/Internet/
World_Wide_Web/Weblogs/
• EatonWeb:
http://portal.eatonweb.com/
• Directorio de blogs en España:
http://www.directorio-blogs.com/
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Buscadores de blogs
• Google Búsqueda de blogs:
http://www.google.es/blogsearch
• Technorati:
http://www.technorati.com/
• Bloglines:
http://www.bloglines.com/
• BlogPulse Profile:
http://www.blogpulse.com/
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Búsqueda de videos online
• Recuperación en función de:
– Etiquetas asignadas por los usuarios.
– Categorías predefinidas de los servicios de
alojamiento.
• Inconveniente: hemos de confiar en la honestidad y
capacidad de los usuarios para describir los
contenidos.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Herramientas para la búsqueda de
videos online
1.
2.
Buscadores de los servicios de alojamiento de
video: conocer estos servicios y utilizar sus
herramientas es la mejor manera de encontrar el video
que necesitamos.
Buscadores de video: realizan su consulta
simultáneamente sobre los principales servicios de
publicación de videos.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Servicios de alojamiento para video
• DailyMotion: dispone de videos de hasta 150 Mb y 20 minutos de
duración, más que la mayoría de estos servicios.
http://www.dailymotion.com/es
• Metacafe: sus videos son en su mayoría profesionales
(fragmentos de películas, videoclips, etc.).
http://www.metacafe.com/
• MySpaceTV.com: servicio de alojamiento gratuito de videos de
MySpace. Se caracteriza por la presencia en ella de multitud de
grupos musicales y celebridades. Su orientación es
principalmente profesional.
http://vids.myspace.com/
• Youtube: fundada en 2005 esta empresa es la líder indiscutible del
sector del video online. Entre sus proveedores de contenidos
destacan: BBC, Sony Music Group, NBA, etc.
http://www.youtube.com
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Buscadores de video (I)
• Blinkx: es a la par un servicio de alojamiento de videos
gratuito y un buscador de videos. Como buscador
indexa y recupera videos procedentes, entre otros, de la
BBC, Fox, MTV, Sky News, Reuters, Metacafe, y
Youtube.
http://www.blinkx.com/
• BuscaTube: potente buscador de videos en castellano
que realiza las consultas sobre: YouTube, Google Video,
MySpaceTv, SoapBox, DailyMotion, y Metacafe.
http://www.buscatube.com/
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Buscadores de video (II)
• Exalead Video: realiza sus consultas sobre: YouTube,
DailyMotion, Metacafe, Kewego, e ifilm. Su interfaz de
búsqueda avanzada es muy potente, haciendo uso de
operadores booleanos y de proximidad.
http://www.exalead.com/search/video/
• Google Video: es tanto un servicio para el alojamiento
gratuito de videos como un potente buscador de videos.
Como motor de búsqueda presenta los resultados hallados
principalmente en YouTube, pero también de otros servicios
de alojamiento como el propio Google video, Metacafe, etc.
Facilita una buena interfaz de búsqueda avanzada.
http://video.google.es/
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Problemas: contenidos digitales y buscadores
• Aspectos legales de los contenidos online:
– Copyright vs. Creative Commons
• La búsqueda y recuperación de contenidos online ¿una
barrera para los proveedores de contenidos?:
– Modelo de negocio de los diarios online. Demanda de
los diarios belgas a Google.
– Demanda de Sony a Youtube.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Calidad de los contenidos en la Web 2.0
• ¿Qué define un contenido de calidad?
– Profesionales expertos VS. Bloggers y
Ciberperiodistas. Casos de:
• Artículos y noticias no contrastados
• Nature: Wikipedia vs. Enciclopaedia Britannica
– Usuarios y calidad (Google y Servicios de
bookmarking (Del.icio.us)).
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Creative Commons: ¿una solución?
• Creative commons (some right reserved):
– Inglés:
http://es.youtube.com/watch?v=2BESbnMJg9M
– Castellano:
http://es.youtube.com/watch?v=Lg6znYkNuUQ
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Creative Commons: formatos
• Una obra bajo licencia Creative Commons tiene
copyright
• Pensada para proteger obras en formato:
– Texto.
– Audio.
– Video.
– Imagen
– Interactivo
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Creative Commons
•
Estas licencias ofrecen diferentes derechos en función de las siguientes
condiciones:
– Reconocimiento (Attribution): El material creado por un artista puede
ser distribuido, copiado y exhibido por terceras personas si se muestra
en los créditos.
– No comercial (Non Commercial): El material original y los trabajos
derivados pueden ser distribuidos, copiados y exhibidos mientras su
uso no sea comercial.
– Sin Obra Derivada (No Derivate Works): El material creado por un
artista puede ser distribuido, copiado y exhibido pero no se puede
utilizar para crear un trabajo derivado del original.
– Compartir Igual (Share alike): El material creado por un artista puede
ser modificado y distribuido pero bajo la misma licencia que el material
original.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Licencias Creative Commons (I)
• La combinación de estas condiciones da lugar a seis
licencias:
– Reconocimiento: El material creado por un artista
puede ser distribuido, copiado y exhibido por
terceros si se muestra en los créditos.
– Reconocimiento - Sin obra derivada: El material
creado por un artista puede ser distribuido, copiado y
exhibido por terceros si se muestra en los créditos.
No se pueden realizar obras derivadas.
– Reconocimiento - Sin obra derivada - No
comercial: El material creado por un artista puede
ser distribuido, copiado y exhibido por terceros si se
muestra en los créditos. No se puede obtener ningún
beneficio comercial. No se pueden realizar obras
derivadas.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Licencias Creative Commons (II)
– Reconocimiento - No comercial: El material creado por
un artista puede ser distribuido, copiado y exhibido por
terceros si se muestra en los créditos. No se puede
obtener ningún beneficio comercial.
– Reconocimiento - No comercial - Compartir igual: El
material creado por un artista puede ser distribuido,
copiado y exhibido por terceros si se muestra en los
créditos. No se puede obtener ningún beneficio comercial y
las obras derivadas tienen que estar bajo los mismos
términos de licencia que el trabajo original.
– Reconocimiento - Compartir igual: El material creado
por un artista puede ser distribuido, copiado y exhibido por
terceros si se muestra en los créditos. Las obras derivadas
tienen que estar bajo los mismos términos de licencia que
el trabajo original.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Bibliografía
•
•
•
•
•
•
The Quality Gap: The Race for Context Pushes Content Quality to the Sidelines John Blossom 30 May 2007
http://shore.com/commentary/newsanal/items/2007/20070521quality.html
Ley de propiedad intelectual.
http://www.mcu.es/propiedadInt/docs/TextoRefundidoLeyPIntelectual.pdf
Derecho de autor / Wikipedia
http://es.wikipedia.org/wiki/Derechos_de_Autor
Commission sees need for a stronger more consumer-friendly Single Market for Online Music, Films and
Games in Europe
http://europa.eu/rapid/pressReleasesAction.do?reference=IP/08/5&format=HTML&aged=0&language=EN&gui
Language=en
"Creative Commons se convertirá en una organización de estándares de los derechos de autor“ / Consumer
Eroski
http://www.consumer.es/web/es/tecnologia/internet/2008/10/02/180170.php
Catedra COIT de la Universidad Politécnica de Madrid:
http://www.gtic.ssr.upm.es/ccoit/Docs/articulos%20BIT/DRM.pdf
•
Telefónica. “Descarga de contenido y gestión de derechos digitales” [Informe técnico].. Capítulo 19 de: “Las
telecomunicaciones y la movilidad en la sociedad de la información”
http://www.telefonica.es/sociedaddelainformacion/pdf/publicaciones/movilidad/capitulo_19.pdf
•
Transparencias de las ponencias del Dr. Fernando Pérez González:
Página personal: http://www.gts.tsc.uvigo.es/~fperez/
Transparencias:
http://www.gts.tsc.uvigo.es/~fperez/cursopim/
http://www.gts.tsc.uvigo.es/~fperez/cursopim/PIM_Part2.pdf
http://www.real-academia-de-ingenieria.org/actividades/Ponencia%20Perez%20Gonzalez.pdf
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Parte 3: La Ciencia 2.0
• Características de la Web 2.0:
–
–
–
–
Contenido creado por usuarios (prosumidores)
Redes sociales
Aplicaciones en línea (cloud computing)
Herramientas colaborativas
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Web 2.0
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Ciencia 2.0 / E-Science
• Recursos de la Web 2.0 aplicada, al menos, a tres
actividades características del mundo académico:
• Gestión de información
• Publicación y difusión de resultados
• Acreditación y promoción
• Una visión global:
http://www.mindomo.com/view.htm?m=d4d1f77be0d04af
0804c719038144de8
• Otra dimensión: Open peer review (no tratado en esta
presentación)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Casos concretos
– Gestores de información: p.e. RefWorks
– Repositorios académicos: p.e. E-LIS
– Portales de documentos: p.e. SlideShare
– Herramientas de creación: p.e. Mindomo
– Redes sociales: p.e. Exit
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
RefWorks (I)
• Aplicación en línea:
– No es necesario descargar ningún programa
– La aplicación está disponible desde cualquier lugar del
planeta … siempre que haya conexión a la Web
– Los datos están a mano desde cualquier lugar del
planeta
– Los datos están en un servidor seguro
• Funciones:
– Gestor personal de información
– Generador de bibliografías
– Herramienta de colaboración
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
RefWorks (II)
• Gestor personal de información:
– Importa referencias individuales o en grupo de manera
automática:
• Desde bases de datos:
– De modo automático
– Previa exportación desde la base de datos
• De sitios web visitados
• De búsquedas realizadas desde el propio RefWorks a
catálogos de bibliotecas o bases de datos
– Permite editar y entrar referencias “a mano”
– Permite incorporar imágenes y documentos a las referencias
– Permite búsquedas selectivas en la base de datos y diversos
modos de exportación
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
RefWorks (III)
• Generador de bibliografías
– Decenas o cientos de formatos disponibles
– Posibilidades:
• Referencias:
– Individuales
– De un conjunto tras una búsqueda selectiva o de
toda la base de datos
• Contexto:
– Desde RefWorks en línea
– Desde el procesador de textos (requiere instalar
un complemento en el procesador y conexión a la
Web)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Depósitos digitales (I)
• Origen en los e-prints
– Diversos tipos:
• Pre-prints
• Post-prints
• Actualmente:
– Parte de la estrategia a nivel:
• De país
• De Comunidad Autónoma
• De Universidad
• De autor
– La motivación:
• Visibilidad: la acreditación “informal”
• Instrumento: los motores de búsqueda y otros sistemas
de información especializados en Ciencia 2.0
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Depósitos digitales (II)
• En general:
– Depósitos digitales por institución
• Algunas disciplinas:
– Abiertos a todos los autores de un sector, p.e.:
Economía (RePec), Física, Matemáticas y
Computación (Arxiv), Documentación e Información
(E-LIS)
• Directorio de depósitos a nivel nacional e internacional:
http://roar.eprints.org
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Herramientas de creación y publicación
• Permiten crear documentos que, al mismo tiempo
quedan publicados en la web
– Presentaciones
• Zoho
– Diagramas
• Mindomo
• Wisemapping
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Portales de documentos
• El caso de SlideShare
– Depósito de presentaciones y documentos
– Plugin en PowerPoint
– Publicación automática
– Difusión automática
– Acceso universal
– Parte del ciclo de vida de la creación de una
presentación o un documento (artículo, informe, etc.)
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Redes Sociales
•
•
•
•
Instrumento de visibilidad y de acreditación “informal”
Sistema de colaboración y de difusión de resultados
Medio de contacto
Algunos casos concretos:
– Exit
– Academia.edu
– LinkedIn
– ResearchGate
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Conclusiones
• Son herramientas de coste cero (para los usuarios)
• Implican una pequeña curva de aprendizaje, pero rinden resultados de
manera inmediata
• Bien seleccionadas aportan:
– Visibilidad (acreditación formal e informal)
– Productividad
– Y en general: ventajas competitivas
• Propuestas para la acción:
– Una vez producido un documento (artículo, presentación, informe,
etc.) consideren que empieza el ciclo de vida de su difusión.
Consideren SlideShare para presentaciones (u otro tipo de
documentos)
– Consideren el paso a las aplicaciones en línea: RefWorks (o
equivalentes) puede ser un buen inicio.
– Consideren el uso de alguna red social.
• Por último: la Ciencia 2.0 es también un nuevo campo de investigación,
por tanto, una nueva zona de oportunidades
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Actividad 5
• Como actividad final de este curso deberá elaborar un
diagrama con Mindomo. En él deberá reflejar los
contenidos aprendidos en este curso, poner notas
definitorias de las herramientas estudiadas, y realizar
enlaces a las fuentes presentadas.
Unidad de Formación para la Administración
y los Servicios Universitarios
Servicio de Recursos Humanos
Referencias
• Directorio sobre Ciencia 2.0
http://www.mindomo.com/view.htm?m=d4d1f77be0d04af
0804c719038144de8
• Artículo Wikipedia sobre Web 2.0
http://es.wikipedia.org/wiki/Web_2.0
• Diagramas sobre otras características de la Web, el SEO
y los buscadores:
www.lluiscodina.com/diagramas.htm
Descargar

Diapositiva 1