Ci sono stati diversi tentativi in passato di arginare i motori di ricerca nel loro continuo censimento arbitrario delle pagine web ma, di fatto, si registrano solo sporadici casi in cui è stata limitata questa loro attività.
Il problema è duplice: da un lato i motori di rierca catturano ogni informazione on-line che riescono ad individuare senza richiedere autorizzazione alcuna (e facendone peraltro ragione del loro business); nel contempo, catalogando file di ogni tipo, espongono gli utenti al rischio di virus o di altri documenti potenzialmente pericolosi.
Sul primo aspetto, i search engines applicano una specie di “silenzio – assenso”: se i gestori dei siti web non fanno nulla, le pagine web dei loro siti diventano censibili, altrimenti devono impostare un apposito file (robots.txt) che ne inibisce o ne limita la cattura. Il problema è che l’azione di scandaglio dei motori di ricerca è alquanto invasiva e tende ad acquisire qualsiasi documento presente on-line (file Wod, Excel, PDF, audio video, ecc.), situazione non necessariamente voluta dai rispettivi proprietari dei file.
L’aspetto sicurezza è ancora più rilevante. Abacus SEO, un weblog che tratta di search engines, ha giustamente evidenziato come l’archivio di Google contenga anche molti documenti (in particolare di tipo VBS e REG) che potenzialmente possono contenere applicazioni dannose, senza che l’ultente sia salvagardato in alcun modo. Ancora più evidente la presenza di documenti Word, i quali spesso sono proprio utilizzati per diffondere virus.
Secondo me gli hacker non ci hanno ancora pensato… ma non tarderanno a farlo, magari inondando Google & Co. di documenti “radioattivi”. Quindi: occhio alle ricerche!
Un commento per “Ricerche on-line “radioattive””
Pui seguire questa conversazione mediante lo specifico feed rss.
paperageppo scrive:
a volte le combinazioni…
http://deldesiderio.splinder.it/1072820931#1144839
Posted on 01 gen 2004 alle 02:57.