giovedì, novembre 09, 2006

Motori di ricerca 1 - La storia e Yahoo

Quando sono nati i motori di ricerca? Come funzionano? Con Yahoo inizia l'analisi della storia e del funzionamento dei motori di ricerca.


Per leggere altri post interessanti visita il mio blog

L’idea di creare uno strumento che aiutasse gli utenti a trovare i file presenti su Internet risale ai primi anni Novanta. Nel 1990 Alan Emtage, studente della McGill University, decide di creare «Archie»: un database in grado di identificare la posizione di un elevato numero di file. Questo sistema viene affiancato l’anno dopo dal «gopher»: un sistema di visualizzazione dei contenuti di un server basato su una lista gerarchicamente strutturata di file e cartelle.

Tuttavia i primi siti di ricerca nati per il Web – Galaxy e Yahoo! – nascono solo nel 1994. A diventare uno degli standard di riferimento sarà Yahoo!, creato nel febbraio 1994 da due studenti di Stanford, Jerry Yang e David Filo. Yahoo!, come Galaxy, è un elenco strutturato di siti (directory), organizzato mediante parole chiave. In pratica una specie di «pagine gialle» digitali. Il meccanismo su cui si basa è molto semplice:
- l'autore di un sito segnala a Yahoo! la sua esistenza;
- nel giro di qualche giorno una persona dello staff di Yahoo! visita il sito e lo analizza;
- in base ai suoi contenuti viene classificato e inserito in una lista di siti simili.

Il vantaggio di Yahoo! è che la sua struttura di classificazione è basata sulla valutazione umana e quindi è solitamente molto precisa. Questo è però anche il suo principale svantaggio: con l’aumento vertiginoso del numero di nuovi siti è diventato impossibile per lo staff di Yahoo! riuscire a visitarli tutti.

Per questo motivo sono nati i motori di ricerca: siti di ricerca che categorizzano i contenuti del Web in maniera automatica. Il cuore dei motori di ricerca è un particolare software, chiamato «robot» o più colloquialmente «spider» che analizza in maniera automatica le principali caratteristiche delle pagine presenti sul web: titolo, contenuti, collegamenti ad altri siti, ecc.
Inizialmente, gli algoritmi sviluppati dai motori di ricerca si basavano sulle parole chiave indicate dagli utenti e sul numero di volte in cui un certo termine compariva all’interno di un sito. Questo meccanismo, però, ben presto si è rivelato poco efficace. Da una parte la presenza multipla di un termine non indica necessariamente l’utilità di un determinato sito. Inoltre, per cercare di essere più visibili, molti siti inserivano dei contenuti specifici pensati per ingannare i robot.

Aggiungendo a queste due limitazioni il numero crescente di pagine disponibili, molti motori di ricerca hanno incominciato ad avere difficoltà a fornire informazioni che siano significative per l’utente. Per esempio, se cerchiamo su un motore di ricerca il termine «psicologia dei nuovi media» otteniamo oltre dodicimila risposte, la maggior parte delle quali fanno riferimento ai corsi di questa disciplina attivati nelle diverse università italiane.

Sotto Dr. Jan Pederson e Dr. Daniel E. Rose parlano di Yahoo Search all'Università di Berkley:

Nessun commento: