“Spazza-Google”
Si sa che Google offre il motore di ricerca più utilizzato e apprezzato. Come si sa che offre anche innumerevoli altri servizi, tanto da essersi affermato nel web come la pagina più aperta. Google, tuttavia, nasconde molti segreti: per esempio, se vi chiedo quali sono gli strumenti che Google utilizza per bannare un sito web dal motore di ricerca che cosa mi rispondete? I webmasters mi risponderanno che Google utilizzerebbe (in via ipotetica) un pannello di controllo accessibile da username e password. Fin qui nulla di strano, dato che è usuale per i siti web utilizzare questo sistema. Però, dove si trova questo pannello? Vi rispondo che Google mantiene segreto l’indirizzo, il quale dovrebbe essere accessibile solo tramite convalida (per esempio convalidando l’indirizzo IP). Tale pratica è spesso utilizzata in alcuni siti web. Tuttavia è evidente che Google non ha saputo fare i conti con i contatori visite dei siti web. Per la precisazione, in siti web bannati dal motore di ricerca si è scoperto che venivano visionati da Google tramite il seguente indirizzo Internet: http://webspam.google.com/admin.php?user=googleuser&status=verified&length=364&type=ban . Esattamente, il database dei siti web bannati da Google si trova in un sotto-dominio che dovrebbe essere perlopiù sconosciuto alla maggior parte degli utenti del web: http://webspam.google.com/. La variabile lenght nell’indirizzo di ban dovrebbe riguardare l’intervallo di controllo da parte di Google sul sito web, user dovrebbe riferirsi all’utente Google attualmente collegato, mentre status potrebbe riferirsi allo stato del sito web su Google. Da qui si può dedurre che: http://www.google.com/admin.php è il pannello principale. È evidente che, come ho avuto modo di sottolineare, i link non sono accessibili se non con determinate specifiche. Dalla scoperta del pannello di Google si giunge ad una considerazione particolarmente interessante: come si vede negli indirizzi, viene utilizzato il linguaggio PHP. Pertanto, a meno che Google non abbia volutamente camuffato un altro linguaggio con questa estensione mediante modifiche nel server (ma non ne vedrei il motivo), Google utilizza PHP esattamente come un qualsiasi altro sito basato su questo linguaggio. Ovviamente, evito accuratamente di analizzare le cosiddette “pagine senza estensione” (probabilmente delle applicazioni stile servlet o delle semplici variabili di pagine, forse in PHP, opportunamente riscritte e camuffate), poiché in questo caso, non vi sono certezze. Oltre al pannello di controllo di Google, un segreto aziendale riguarda GAIA: il sistema di autenticazione utilizzato per i cosiddetti Google Accounts. In poche parole, il sistema di autenticazione ai servizi di Google come GMail. Tale sistema è stato violato da hacker cinesi che si erano dunque intrufolati nelle caselle di posta GMail e si sono visti il famoso ultimatum “o rimuovete la censura o Google ritirerà le sue sedi dalla Cina”. L’algoritmo del motore di ricerca, infine, può essere spiegato sinteticamente: i risultati di ricerca, più che basati su un algoritmo semantico, sono organizzati a seconda della pertinenza del sito web (spesso correlata alla Google Popularity, la popolarità dettata soprattutto dai link in entrata da siti web abbastanza popolari). L’algoritmo che determina la posizione di una pagina web in Google è definito PageRank. Ad influire nella posizione ci sono anche Google Caffeine (che valuta la velocità di caricamento delle pagine web) e tanti altri fattori, che sono reperibili all’indirizzo http://www.impresapratica.com/seo/lalgoritmo-di-ranking-di-google-rivelato/ . E’ evidente che l’algoritmo esatto di Google non è reperibile, ma che comunque, non ci sono particolari segreti come si cerca di lasciar intendere.


Ciao Alessio, articolo molto interessante (non ero a conoscenza del sottodominio webspam). Vorrei solo fare alcune precisazioni:
1) I siti non vengono bannati “a mano” da un operatore umano ma mediante opportuni algoritmi che verificano determinate circostanze.
2) E’ però presente *anche* un controllo manuale e non è affatto un mistero in quanto se ne parla nella descrizione dell’algoritmo che determina il TrustRank (http://it.wikipedia.org/wiki/TrustRank)
3) E’ vero che molti criteri sono stati individuati, ma la conoscenza al 100% degli algoritmi di ranking non c’è. Il punto è che tra “intuire” e “sapere esattamente” c’è differenza assai. Se così non fosse, Google sarebbe un cumulo di spam (cosa che per fortuna ancora non è).
OT:
Per quanto riguarda la sicurezza, non esiste sito web o computer inviolabile. Qualcuno diceva che un computer per essere sicuro al 100% dovrebbe essere scollegato dalla Rete, *spento* e il disco distrutto *fisicamente*. Questo perché volendo i dati sono reperibili a distanza leggendo le emanazioni elettromagnetiche degli schermi (tempest), i dischi si possono leggere anche se formattati (informatica forense), etc.
Per i paranoici: esistono dei software che sovrascrivono i dati fino a 36 volte e riempiono il disco di 0 binari, ma se i dati “servono” a qualche agenzia governativa che ha i mezzi (es. NSA), allora per mantenerli riservati c’è solo un modo: prendere il disco a martellate (http://en.wikipedia.org/wiki/Data_remanence). :D
Gentile Sir Vester,
innanzitutto ringrazio per il commento e per l’interesse nei confronti del contenuto dell’articolo. Lei ha perfettamente ragione nelle sue precisazioni. Google ha automatizzato molte operazioni, per cui anche il ban è automatico. Il TrustRank, il controllo manuale, probabilmente viene effettuato tramite la pagina “admin.php” che avevo menzionato. Credo che se ne occupi per la maggior parte Matt Cutts, il portavoce di Google, dato che il link da me citato è stato sempre rinvenuto con la variabile “user” settata su “mcutts”. In effetti il sotto-dominio “webspam.google.com” sembra proprio non essere conosciuto in Rete, c’è chi addirittura parla di “domain spoofing”. Io credo che, invece, esista, non vedrei il perché Google dovrebbe fare dello spoofing. Dopotutto non penso che Google faccia sapere a tutto il mondo quali sono gli indirizzi dei suoi database. Infatti, se si prova ad accedere ad una qualsiasi pagina che ho linkato, si ottengono degli errori, come se i domini non esistessero. Se accedo ad “admin.php” nel sito principale di Google, c’è addirittura “404/not found”. Se l’accesso proviene dagli indirizzi IP dei dipendenti di Google, i pannelli, invece, si vedrebbero. Lo dico perché anch’io, nei siti web che gestisco, nascondo i pannelli di amministrazione con indirizzi lunghi chilometri e restituisco l’errore “404/not found” a chi non presenta le caratteristiche da me dichiarate per accedere.
Non si conosce con certezza l’algoritmo del motore di ricerca di Google, in effetti, se lo si conoscesse al 100% gli spammer troverebbero sicuramente il modo per essere in alto nelle SERPs e per non essere rilevati dagli algoritmi di controllo dello spam. E’ anche vero che il motore di ricerca non è segreto al 100%, l’articolo che ho citato dal Suo sito lo dimostra pienamente (lei stesso ha fatto il parallelismo con la formula della Coca Cola e la Pepsi Cola). La guida SEO rilasciata dalla stessa Google lo dimostra anche.
Concordo sul fatto che non esista sistema inviolabile. Peraltro la violazione dei server di Google da parte di hackers cinesi ne è una dimostrazione. Dopotutto, credo che per la protezione di questi server si siano prese molte precauzioni.
Con i migliori saluti,
Alessio Ganci.
Lascia un commento!
> IL PUNTO »
Le parole sono “pietre” anzi “macigni” la scienza non produce coscienza
Giuseppe Lembo
Gli improduttivi di Hitler, mangiatori inutili; sterminio di massa dei diversamente abili. Il non diritto alla vita degli umani improduttivi. Una necessità eliminarli per il bene della società normale. Ma verso quale società pura …
> IN EVIDENZA »
“Quando una donna ama” di Busiello, storia di una vita
Claudio Di Mella
“Quando una donna ama” è il titolo di un breve romanzo, pubblicato qualche anno fa da una scrittrice nostrana, Elisabetta Busiello di Brusciano (Napoli), una donna a cui la vita non ha sorriso, …
> SCIENZE E LETTERE »
Donne allo specchio: lunga vita alla regina
Giovanna Rezzoagli
Lo scorso sei febbraio Elisabetta Seconda d’Inghilterra ha festeggiato il sessantesimo anno da regina. Non un record da poco, se si considera che la sovrana è diventata regina a venticinque anni, era certo giovane …
Arte & Cultura »
Benvenuto a “Napoli – Milano” di Luca Miniero
*Nicola Crisci
“Napoli-Milano –da casello a casello “ (Milano, Rizzoli, 2011, dicembre, 162, € 14,00) è il primo libro di Luca Miniero, autore e regista di Benvenuti al Sud e Benvenuti al Nord. E’ fantastico, sorprendente, …
Cronaca »
Salerno: Arma, arresto pregiudicato per furto benzina
Nella tarda serata di ieri 9 febbraio, nell’ambito di predisposti servizi di contrasto ai reati contro il patrimonio, i Carabinieri del Nucleo Investigativo del Reparto Operativo di Salerno hanno arrestato il ventiquattrenne Rosario Di Biase, …
Spiritualità »
Alghero: conferenza su Natuzza e gli spiriti celesti di don Stanzione
Don Marcello Stanzione sabato 12 febbraio 2012 ad Alghero alle ore 16,30 nel salone dell’ex seminario a via Sassari 179 terrà una conferenza sulla mistica calabrese Natuzza Evolo e gli angeli, tenendo comunque ben presente …
Sport »
Carpedil Ipervigile Salerno, la corsa verso la salvezza riparte da Napoli
Ricomincia da Napoli la corsa della Carpedil Ipervigile Salerno verso la salvezza. Le granatine di Gigi Salineri, infatti, dopo lo stop forzato che a causa del maltempo ha rinviato a data da destinarsi la gara …
Cannocchiale »
Premio dell’editrice Segno a Don Marcello Stanzione
Carlo Di Pietro
In occasione dell’incontro tenuto da don Marcello Stanzione a Udine presso la sede dell’editrice cattolica Segno, il 5 dicembre 2011, gli è stata consegnata dall’editore Piero Mantero una targa in quanto “l’autore con …
Curiosando »
Il contratto editoriale
Laura Iuorio
Per siglare il proprio rapporto lavorativo, editore e autore firmano un contratto, il primo per acquisire la possibilità di pubblicare e sfruttare economicamente l’opera, il secondo per cedere i diritti di sfruttamento in cambio …
Immigrazione »
Salerno: Sel, campagna Ius Soli per immigrati
Dopo aver tradito i propri elettori con il voto del proprio rappresentante in consiglio comunale a favore della privatizzazione di Salerno sistemi, Sel lancia ora una campagna a favore dello Ius Soli e del voto …
miscellanea »
Fli: Diodato “Emergenza maltempo, tutela per clochard ed anziani”
<< Visto quanto avvenuto nei giorni scorsi e la lunga sequenza di vittime, ultima in ordine di tempo un’anziana a Portici , ci auguriamo che i Sindaci del napoletano abbiano predisposto misure adeguate per la …
Mondo »
Conosciamo i Balega (Congo Rd): il cane e il fuoco
Padre Oliviero Ferro
Cosa veramente eccezionale, dobbiamo constatare una bella amicizia tra il cane e il fuoco. Fido si recava ogni giorno dall’amico con l’intera sua famiglia. Il fuoco, da parte sua, l’accoglieva sempre con grande …
Sicurezza »
Salerno: GdF, bilancio attività 2011
Economia sommersa e frodi fiscali: questi i fenomeni criminali principalmente presi di mira dalle Fiamme Gialle nel 2011 per i danni che producono al bilancio dello Stato, delle Regioni e degli Enti locali, distorcendo la …
INFO
Iscrizione nel Registro della Stampa Tribunale di Salerno N.1404/08 R.V.G. del 25/11/2008.
Direttore Responsabile
Rita Occidente Lupo
Editore
Associazione Dentro la notizia
PI/CF 9511506 065 9
info@dentrosalerno.it
Commenti recenti
DENTROSALERNO WEB TV
Categorie
Siti Amici
Link
Area Riservata
Archivio
Calendario
Annunci