Il 90% del web c’è, ma non si vede. O meglio, non viene indicizzato dai motori di ricerca. E’ quanto emerge da un autorevole studio, tanto che il prossimo traguardo da raggiungere nella scienza dei motori di ricerca è lo sviluppo di algoritmi che riescano a sopperire a questa grave mancanza. E intanto il Deep Web rimane taciturno in attesa.
Gli attuali motori di ricerca di basano su dei programmi, chiamati spider, che ricostruiscono la maglia di collegamenti tra i milioni di documenti presenti del World Wide Web, permettendo di stabilire delle correlazioni, similitudini e associazioni tra di esse e offrire così degli ottimi risultati per le nostre ricerche. Ma cosa succede se delle informazioni non sono linkate?
Pensate a tutta quella mole di dati presenti nei database in giro per il mondo: dati finanziari, prezzi delle merci, orari dei servizi pubblici, ricerche scientifiche. Tutti dati che non hanno un riferimento diretto, ma vengono prelevati da varie pagine attraverso delle query dirette. È questo il Profondo Web, una mole di dati stimata appunto nel 90% delle informazioni presenti in rete, e di cui il 54% è giudicato come dati utili.
Ma come si fa a trovare qualcosa che non si vede? O meglio, che non si sa come cercare? Bisogna, a partire da una particolare stringa di ricerca, analizzarla per cercare di capire che cosa l’utente sta cercando, e ad esempio, a partire dal nome di un calciatore arrivare a recuparare i dati delle partire disputate dalla sua squadra. Nonostante ad una mente umana sembri un approccio molto lineare, nella realtà le possibili query sono moltissime, troppe. C’è bisogno di un algoritmo che riesca ad indicizzare i dati dei database, magari a partire dai form ai quali è collegato, unificando tali informazioni al resto della “conoscenza” del motore di ricerca.
Insomma, la sfida è lanciata. Molti gruppi di ricerca, finanziati dai grandi colossi del settore, sono al lavoro per trovare una soluzione che potrebbe rivoluzionare il modo in cui eseguiremo le nostre ricerche nel futuro. E chi ne sarà l’artefice, potrebbe forse diventare il nuovo Google?