viernes, 29 de marzo de 2013

COMO FUNCIONA UN BUSCADOR POR DENTRO


Ahora que ya hemos aprendido el manejo básico de un buscador podemos entrar a ver cómo funciona internamente. Sólo veremos los conceptos básicos ya que es un tema complejo y los buscadores tampoco dan mucha información al respecto para no dar pistas a la competencia.

Para comprender mejor la tarea de un buscador pensemos primero qué hay en Internet, como está organizada la información. A continuación hablaremos de la propia estructura del buscador para adaptarse a la estructura de los datos de Internet.


Estructura de datos en Internet.

Ya vimos en la unidad 1 que cualquiera puede introducir información en Internet. Simplemente tiene que disponer de un servidor donde alojarla. Cada nueva página que se crea en Internet tiene una dirección única. Por ejemplo, http://www.aulaclic.es/internet/t_4_7.htm. Cuando alguien decide crear un sitio web elige el nombre que le parece apropiado, y también da el nombre que quiere a las carpetas y páginas que va creando. De forma que los millones de páginas que existen en Internet no tienen porque tener una estructura común ni una relación prefijada entre ellas.

Si comparamos Internet a una gigantesca biblioteca, donde cada libro representa un servidor, no habría manera de colocar los libros en las estanterías de forma que respondiesen a un orden lógico según su contenido. Tampoco habría una forma estándar de ordenar las páginas dentro de cada libro.

 Estructura de un buscador.

Acabamos de ver que la estructura de la información en Internet no facilita su organización. ¿Qué han hecho los buscadores? La respuesta es crearse su propia copia de Internet.

¿Cómo lo hacen? Lo hacen unos robots, por supuesto no son robots de metal, en realidad son unos programas que van visitando las páginas de Internet y copiándolas en los discos de los buscadores. Sabemos que hay millones de páginas, por lo tanto copiar las páginas cuesta unos días, debido a esto puede ocurrir que un buscador dé un resultado de una página que ya no existe. El buscador ha consultado la copia que tenía de esa página, llamada caché, realizada unos días antes y al mostrar el resultado esa página ya ha sido borrada por sus dueños.
¿Qué es la compresión? Si estamos buscando texto, las imágenes no nos interesan, tampoco el formato del texto, todo esto se puede eliminar para realizar las búsquedas más rápidas. Además, existen técnicas complejas para lograr que las páginas ocupen menos espacio.

 

 Puedes aprender más sobre esta barra haciendo clic con el botón derecho del ratón sobre ella y seleccionando Ayuda de la barra de Google. Encontrarás, entre otras cosas, detalles de cómo desinstalarla.


Ayuda de la barra de Google


No hay comentarios:

Publicar un comentario