L'angolo dei giovanissimi: Google Hacking, nel bene e nel male

Alessio Ganci

Ultimamente in Informatica i termini “hacking” e “cracking” sono percepiti come sinonimi. In realtà la differenza tra queste due terminologie è notevole: l’hacker non è necessariamente un pirata informatico: può essere semplicemente un esperto di sicurezza informatica, ma volendo, anche di tutti gli altri rami concernenti l’Informatica. Il cracker invece è il vero e proprio pirata informatico nel senso della parola. Non a caso la parola hack in Informatica esprime un trucco o una strategia per bypassare un problema o per utilizzare impropriamente un sistema telematico (come un programma), ma senza incorrere nell’illegalità. Invece crack vuole esprimere una rottura, una forzatura di una protezione. Per cui il fenomeno del Google Hacking che verrà spiegato di seguito, può essere utilizzato dai pirati informatici per trovare informazioni segrete mediante un motore di ricerca come, appunto, Google, ma il suo scopo principale è quello di rifinire ulteriormente le ricerche effettuate in Internet. È l’utente che deve decidere se abusarne o meno. In ogni caso, sia in Google, sia in tutti gli altri motori di ricerca esistono dei comandi speciali che permettono di escludere i risultati contenenti certi termini di ricerca, ricercare frasi esatte, effettuare ricerche in un unico sito (o in tutti i siti fuorché quello selezionato), ricercare pagine simili ad una visualizzata precedentemente, effettuare ricerche di tutte le  pagine dentro una precisa cartella web di qualunque sito, visualizzare istantanee di pagine salvate in precedenza da Google.Innanzitutto, secondo una ricerca effettuata dall’Università Bocconi di Milano, l’utenza media effettua ricerche in Google visualizzando soltanto la prima pagina dei risultati ottenuti. In realtà i risultati di ricerca sono composti da tantissime pagine, ma l’utente medio non le scorre. Più un sito è in alto nei risultati di ricerca, più gode di un ottimo Google PageRank (livello di pertinenza determinato soprattutto dal numero di visite e dai link reciproci con altri siti Internet). Se un sito è posizionato agli ultimi posti dei risultati di ricerca, il motivo potrebbe riguardare anche la presenza di contenuti illegali, molto allettanti per i cracker. L‘esplorazione delle ultime pagine delle ricerche aiuta anche l’utente a trovare informazioni utili che altri utenti non hanno trovato (perché magari, non hanno scorso bene la lista dei risultati di ricerca).Quando si effettua una ricerca in Google, i termini digitati nel campo di ricerca permettono di visualizzare pagine web contenenti gli stessi termini digitati. Però è possibile anche il contrario, cioè ricercare pagine non contenenti determinati termini di ricerca: basta inserire questi termini nel campo di ricerca, preceduti da un segno di sottrazione (-). Per esempio, se si volessero cercare pagine contenenti il termine <<ricerca>>, ma non contenenti il termine <<Google>>, bisognerà digitare <ricerca -Google>. Durante la ricerca è possibile inoltre specificare di trovare (o non trovare, se posizionato il segno di sottrazione) un’intera frase, o comunque uno specifico gruppo di parole: bisogna semplicemente digitare la frase o il gruppo di parole dentro le virgolette “ ” nel campo di ricerca. Invece per trovare pagine contenenti espressamente tutte le precise parole chiave (e non pagine  contenenti anche una o più delle parole immesse nel campo di ricerca, come predefinito), bisogna anteporre a tutte le parole che si vogliono visualizzare in un risultato il segno di addizione (+). Infine per trovare pagine che non contengano tutte le parole chiave, ma solo alcune, bisogna inserire l’operatore OR tra ogni parola. Per accoppiata all’operatore OR, esiste anche l’operatore AND (per trovare più parole in una pagina), ma è inutile, dato che questo operatore è già inserito automaticamente tra ogni parola digitata, al momento della ricerca. Quindi l’operatore AND è stato introdotto solo per “fare compagnia” all’operatore OR.Le tecniche di Google Hacking utilizzate maggiormente dai cracker riguardano la ricerca di  pagine dentro una precisa cartella di tanti siti. Se ad esempio si vogliono cercare le pagine web dentro una cartella  /content e cento siti indicizzati da Google hanno all’interno questa cartella, si potranno trovare tutte le pagine dentro la cartella /content di ognuno dei cento siti. Per i cracker questa funzionalità è preziosa perché possono trovare password di accesso a sistemi Linux ed a siti Internet. Infatti, queste informazioni sono archiviate nelle cartelle /etc/passwd dei siti, per cui, il cracker può ottenerle subito. Le password, criptate, sono presenti in un file .pwd presente appunto nelle cartelle prima citate. Per  cercare le pagine presenti in una precisa cartella di tanti siti, bisogna digitare Index of seguito dal percorso della cartella. Però non bisogna abusare di questa funzionalità: trovare password altrui per accedere con  account non propri è un reato (accesso abusivo ad un sistema telematico). Per difendersi da questo attacco (nonché da tutti gli altri attacchi) di Google Hacking, è necessario proteggere i file da un robots.txt (insieme di regole che bloccano l’indicizzazione di determinati file o cartelle da parte di Google ed altri motori di ricerca (nonché web extractors, cioè, dei programmi che scaricano interi siti sul computer per permetterne l’esplorazione off-line).Una funzionalità non molto utile ai cracker riguarda la ricerca di pagine in un preciso sito (con possibilità di inserire anche i termini di ricerca). Per ricercare pagine di uno specifico sito bisogna inserire i termini di ricerca (se si vogliono includere) e poi la stringa site:nomedelsito.org dove nomedelsito.org è l’indirizzo del sito da ispezionare senza il www. davanti. Anche il .org è specificato per puro scopo esemplificativo dell’utilizzo di questa tecnica di ricerca.  Oltre a ricercare pagine in interi siti il Google Hacking permette di ispezionare il web alla ricerca di un tipo di file contenenti le parole chiave volute. Bisogna solo digitare le parole chiave, più filetype:estensionedelfile, dove estensionedelfile è l’estensione del file da cercare. Se ad esempio si vogliono cercare tutti file .pdf contenenti la parola chiave <<concorso>>  presenti in Internet, si digiterà <concorso filetype:pdf>.  Anche qui non è legale cercare file di password .pwd mediante filetype:pwd.Un ultimo segreto di Google riguarda la copia cache: si tratta della “fotografia” di una pagina web, consultabile se la pagina in questione non è disponibile in Internet. Il servizio è più o meno un’imitazione dell’archivio web di Internet Archive. I webmaster che non desiderano che Google (ed altri) raccolgano le istantanee di una pagina per la cache possono inserire nella pagina stessa il meta-tag <meta name=’pragma’ content=’no-cache’>.Considerando che le tecniche del Google Hacking si possono anche unire, è possibile affinare moltissimo le ricerche (considerando che Google ed altri automatizzano ancor
a di più il processo fornendo  un supporto di Ricerca Avanzata). Però, non bisogna incorrere nella illegalità: trovare dati segreti è un reato. Queste informazioni sono a puro scopo divulgativo. La responsabilità del loro utilizzo è soltanto dell’utente finale.