BÚSQUEDA Y SELECCIÓN 1.2
 Internet
es un conjunto descentralizado
de redes de comunicación
interconectadas, que utilizan la familia
de protocolos TCP/IP, garantizando que
las redes físicas heterogéneas que la
componen funcionen como una red
lógica única, de alcance mundial.
1.2 BUSQUEDA Y SELECCIÓN Y ORGANIZACIÓN
DE LA INFORMACION
HERRAMIENTA DE
BUSQUEDA DE
INFORMACION
INTERNET
Se ha
convertido
en
que
facilitan
ATRAVES DE BUSCADORES
( Sistemas Informáticos
que indexan archivos de la
WEB) (google, msn, yahoo)
BUSCAR LA
INFORMACION POR
AREA Y LUGAR DEL
MUNDO
Para ello
resultando
Las búsquedas se
hacen con palabras
clave o con árboles
jerárquicos por temas.
un listado de
direcciones Web en
los que se mencionan
temas relacionados.
Desarrollo de
se genero la
Arpanet
primera red de
1960
computadoras
1965
1961
1990
Desarrollo del Desarrollo de
protocolo
TCP/IP
WWW
Leonard Kleinrock
Se genera el enlace
funciono como red
publico el primer documento
entre UCLA y la Univ.
de
Stanford
unió centros universitarios
lenguaje HTML
de paquetes
1975
1983
1989
Tim Bernes
creo
de la teoria de commutacion
1969
1972
Demostración
de la
comunicacion
es financiada
por DARPA
naciendo
Arpanet
y militares
El envío de correo electrónico
 La transmisión de archivos
 Las conversaciones en línea
 La mensajería instantánea y presencia
 La transmisión de contenido y comunicación
multimedia -telefonía , televisión
 Los boletines electrónicos , el acceso remoto a
otras máquinas
 Los juegos en línea.

Conjunto de redes de computadoras
 En organización no tiene un lugar central. La
gran parte de la infraestructura es pública, de
los gobiernos mundiales, organismos y
universidades.
 Otra gran parte de Internet es privada, y la
gestionan empresas de servicios de Internet
(que dan acceso) o simplemente publican
contenidos.

Redes
Inalámbricas
Telefonía
ADSL, Cable
Módems, o el
RDSI
Red
Eléctrica y
Satélite
Son categorías que identifican de manera
general la clase de empresa u organización
que está conectada y a los países.
Edu
Institución educativa
Mil
Militar
Gov
Institución pública.
Org
Otros organismos y entidades
sin ánimo del lucro
Net
Empresas de redes y
telecomunicaciones
Com
Comercial

Los dominios asignados a los países se
identifican mediante un código de dos letras
que aparecen al final de la dirección. Ejem :
Argentina: ar
 Colombia: co


México: mx
La Corporación de Internet para los Nombres y
los Números Asignados (ICANN) es la autoridad
que coordina la asignación de identificadores
únicos en Internet, incluyendo nombres de
dominio, direcciones de Protocolos de Internet,
números del puerto del protocolo y de
parámetros.
3.Cuando
queremos
acceder a
una pagina
proporciona
mos un
dominio que
es traducido
al servidor
DNS
4.Cuando sabemos en qué Servidor Web se
encuentra la página que queremos visitar se
procede a su descarga y visualización en el
navegador del PC
El fundamento de Internet es el TCP/IP, un protocolo de
transmisión que asigna a cada
máquina que se conecta un número específico,
llamado "número IP“ que evita que la información se
1. El
usuario se
conecta a la
red a través
de un
modem
2.El proveedor del s
Se da cuenta de la
Por el protocolo
TCP/IP y asigna un
Y desde ese mome
PARA QUE SIRVE INTERNET?

Uno de los usos más obvios es el del correo
electrónico: enviar y recibir mensajes a
cualquier otra persona conectada sin
necesidad de cartas, teléfonos, faxes o
contestadores, con la ventaja de recibir
información editable o archivos especiales (de
tratamiento de texto, hojas de cálculo, etc.) con
los que trabajar.

Otra de las utilidades más comunes es el entretenimiento: los
usuarios encuentran en los grupos de noticias , en las listas de
correo , una forma de comunicarse con otras personas con las
que comparten intereses y aficiones.

Para los usuarios de computadoras personales, Internet está
repleta de archivos y programas de distribución pública, que
pueden usar de forma gratuita (o del tipo "pagasi-te-gusta"),
incluyendo utilidades, aplicaciones y juegos.

Internet también se presenta como un vasto almacén de
información. Hay miles de bases de datos y recopilaciones de
información sobre todos los temas imaginables: médicos,
históricos, periodísticos y económicos.

HTML





Estas siglas significan Hiper Text Markup Language (Lenguaje de
Marcas de Hipertextos).
Permite saltar de una página a otra en un mismo documento o
hacia otro que podría estar localizado al extremo opuesto del
planeta.
A estos textos, que no son continuos ni lineales y que se pueden
leer como saltando las páginas hacia cualquier lado se les llama
hipertexto o hipermedia (expresión que comprende todos los
contenidos posibles, es decir, textos, audio, imágenes, iconos y
vídeos). Los browser o navegadores permiten visualizar la forma
amena y atractiva, toda la información en la pantalla del monitor.
El hipertexto es lo que permite que al hacer clic en una palabra o
gráfico pasemos de la página en la que estamos a otra página
distinta.



Facilita y hace atractiva la utilización de la red
añadiendo interactividad a través de la introducción del
hipertexto, los gráficos y los formularios.
Se define como hipertexto (sistema de enlaces que
permite saltar de unos lugares a otros) como
multimedia, que hace referencia al tipo de contenidos
que puede manejar (texto, gráficos, vídeo, sonido y
otros) e Internet la base sobre las que se transmite la
información.
El aspecto exterior de la WWW son las conocidas
"páginas Web."
.
Las páginas de la WWW están situadas en
servidores de todo el mundo (sitios Web), y se
accede a ellas mediante un programa
denominado "navegador" (browser).
 Este programa emplea un protocolo llamado
HTTP, que funciona sobre TCP/IP, y que se
encarga de gestionar el aspecto de las páginas
y los enlaces.
 Cada página Web tiene una dirección única en
Internet, en forma de URL que indica el tipo de
documento (página Web o documento en
formato HTML), y el de las páginas hipertexto
de la WWW comienza siempre por http.

FORMATO

se trata una página Web en formato HTML
http://www.ibm.com

identificador de la empresa

nombre de la empresa
 Si fuera .es seria de España

La
información
en la WEB
está
disponible a
través de
pág WEB
Escritas
en HTML
En 2008 apareció
Chrome
navegador de la
mano de Google.
Navegador transforma
El lenguaje en págs WEB visibles
El más usado
Internet Explorer
El primer navegador fue
Mosaic 1993, que paso
a ser Netscape .
Finalmente se generó
Internet Explorer de
Windows 1996
2005 se creo Firefox de
Mozzilla
INTRODUCCIÓN A LOS
BUSCADORES
Historia
 Definición
 Clasificación
 Componentes
 Funcionamiento

1990Desarrollo de Archie
Alan Emtage de la Universidad de
Montreal
se utilizaba para buscar archivos
alojados en servidores FTP públicos.
1991 sistema Gopher
con el objetivo de indexar archivos simples
estudiante de la Universidad de Minnesota de texto.
1993 Worl Wide Web Warender
Aliweb (Archie Like Indexing on the Web),
1993 Martijn Koster
Fue en Abril de 1994 cuando
David Filo y Jerry Yang crearon
Yahoo!
un robot de
búsqueda creado en Perl que pretendía
medir el tamaño de la
red. Ese robot se amplió pudiendo leer
direcciones URL creándose así Wandex
Muy inestable
1994 se creo Webcrawler
La gran diferencia y paso diferencial que
podríamos llamar la versión 1 de los
buscadores era que indexaba las
páginas de forma completa y que
buscaba información en ellas, al
contrario de sus antecesores, que sólo
buscaban en la
dirección web, título o metatags. Esto
hizo que la relevancia de los resultados
fuera mucho mayor
InfoSeek 1994
Este sistema lo que hace realmente es
unificar los resultados de varios motores
de búsqueda
1995 Excite Universidad de Stanford
1995 Altavista tenía ancho de banda
casi ilimitado, permitíaconsultas en
lenguaje natural (las que utilizamos
habitualmente para hacer búsquedas),
consultas avanzadas mediante
operadores lógicos (AND - OR)
añadir o eliminar direcciones web en 24
horas, comprobar los enlaces entrantes
a un sitio web e incluso permitía hacer
búsquedas en los nombres de imágenes
y algunos ficheros multimedia
1996 Sergey Brin y Larry Page
empezaron a desarrollar Google en
la Universidad deStanford
una interfaz muy clara y sencilla.
El 15 noviembre de 2003, Google
implementó uno de los
primeros grandes cambios en su motor
de búsqueda
añadiendo mejoras en la búsqueda
semántica. Los motores
de búsqueda tenían unas necesidades
básicas: clustering y
semántica
En 1998 apareció MSN Search, de la
mano de Microsoft Creado por Rich
Skrenta y Bob Truel
Nutch es un motor de búsqueda en
código abierto y creado en
Java.
Aunque su desarrollo es costoso, ha
conseguido el apoyo de
Yahoo!.
En noviembre de 2004, MSN Search y
de la mano de Christopher Payne y
Oshoma Momoh pusieron en marcha
una
primera fase pública del motor de
Microsoft, que se hizo pública el 20 de
enero de 2005
Definición: Un buscador es un sistema
informático que permite al usuario encontrar
archivos almacenados en servidores.




Los índices o directorios
En los índices, hay personas detrás de ellos que clasifican
inteligentemente las páginas web y los recursos de la red en
categorías predeterminadas, a modo de gran árbol .El primer
motor de búsqueda que apareció fue Yahoo.
Los motores de búsqueda
Son bases de datos que almacenan, una versión reducida de todas las
páginas web y recursos que encuentran en la red y que, aunque
almacenan más información, son ligeramente menos precisos. El rastreo
de la web lo hace un programa, llamado araña ó motor .Este
programa va visitando las páginas y, a la vez, creando una base
de datos en la que relaciona la dirección de la página con las
100 primeras palabras que aparecen en ella. Google.


Metabuscadores
Los metabuscadores son páginas web en las que nos ofrece una búsqueda
sin que haya una base de datos propia. Hacen las búsquedas
simultáneamente en varios motores seleccionados respetando el formato
original de los buscadores e incorporan funciones adicionales.
Los robots que recorren la red escrutándola
(también llamados spider, robot o
crawler)
Los buscadores automáticos
La base de datos que es construida
emplean programas de ordenador
por los robots
llamados robots o arañas, que
saltan de una página a otra de la Web
recogiendo páginas y almacenando
El motor de búsqueda que facilita
toda la información en una gigantesca
la consulta a la base (también
base de datos. Esta base de datos contiene, conocido con indicador)
entre otros datos, el título de la página,
una descripción, palabras clave
y los enlaces.
La interfaz de búsqueda en la cual
hacen la solicitud los usuarios




El funcionamiento de los buscadores puede resumirse en
tres pasos:
1. Recolectan información de todas las páginas que hay en
Internet explorando de manera automática cada una de
ellas y crean un archivo de las páginas exploradas.
2. Indexan el archivo, es decir, crean un índice a partir de las
palabras clave y criterios predeterminados. Ante la solicitud
de información de un usuario, revisan este índice para
arrojar los resultados.
3. Producen resultados ante determinada búsqueda
relacionando las palabras claves y la calidad de la página
con las palabras que ha ingresado el usuario para realizar
su búsqueda.
Descargar

INTERNET - clase-dhtics