Ahora
que ya hemos aprendido el manejo básico de un buscador podemos entrar a ver
cómo funciona internamente. Sólo veremos los conceptos básicos ya que es un
tema complejo y los buscadores tampoco dan mucha información al respecto para
no dar pistas a la competencia.
Para
comprender mejor la tarea de un buscador pensemos primero qué hay en Internet,
como está organizada la información. A continuación hablaremos de la propia
estructura del buscador para adaptarse a la estructura de los datos de
Internet.
Estructura
de datos en Internet.
Ya
vimos en la unidad 1 que cualquiera puede introducir información en Internet.
Simplemente tiene que disponer de un servidor donde alojarla. Cada nueva página
que se crea en Internet tiene una dirección única. Por ejemplo,
http://www.aulaclic.es/internet/t_4_7.htm. Cuando alguien decide crear un sitio
web elige el nombre que le parece apropiado, y también da el nombre que quiere
a las carpetas y páginas que va creando. De forma que los millones de páginas
que existen en Internet no tienen porque tener una estructura común ni una
relación prefijada entre ellas.
Si
comparamos Internet a una gigantesca biblioteca, donde cada libro representa un
servidor, no habría manera de colocar los libros en las estanterías de forma
que respondiesen a un orden lógico según su contenido. Tampoco habría una forma
estándar de ordenar las páginas dentro de cada libro.
Estructura de un buscador.
Acabamos de ver que la estructura de la información en
Internet no facilita su organización. ¿Qué han hecho los buscadores? La
respuesta es crearse su propia copia de Internet.
¿Cómo lo hacen? Lo hacen unos robots, por supuesto no son
robots de metal, en realidad son unos programas que van visitando las páginas
de Internet y copiándolas en los discos de los buscadores. Sabemos que hay
millones de páginas, por lo tanto copiar las páginas cuesta unos días, debido a
esto puede ocurrir que un buscador dé un resultado de una página que ya no
existe. El buscador ha consultado la copia que tenía de esa página, llamada
caché, realizada unos días antes y al mostrar el resultado esa página ya ha
sido borrada por sus dueños.
¿Qué es la compresión? Si estamos buscando texto, las
imágenes no nos interesan, tampoco el formato del texto, todo esto se puede
eliminar para realizar las búsquedas más rápidas. Además, existen técnicas
complejas para lograr que las páginas ocupen menos espacio.

Puedes aprender más sobre esta barra haciendo
clic con el botón derecho del ratón sobre ella y seleccionando Ayuda de la
barra de Google. Encontrarás, entre otras cosas, detalles de cómo
desinstalarla.

No hay comentarios:
Publicar un comentario