“Spazza-Google”
Si sa che Google offre il motore di ricerca più utilizzato e apprezzato. Come si sa che offre anche innumerevoli altri servizi, tanto da essersi affermato nel web come la pagina più aperta. Google, tuttavia, nasconde molti segreti: per esempio, se vi chiedo quali sono gli strumenti che Google utilizza per bannare un sito web dal motore di ricerca che cosa mi rispondete? I webmasters mi risponderanno che Google utilizzerebbe (in via ipotetica) un pannello di controllo accessibile da username e password. Fin qui nulla di strano, dato che è usuale per i siti web utilizzare questo sistema. Però, dove si trova questo pannello? Vi rispondo che Google mantiene segreto l’indirizzo, il quale dovrebbe essere accessibile solo tramite convalida (per esempio convalidando l’indirizzo IP). Tale pratica è spesso utilizzata in alcuni siti web. Tuttavia è evidente che Google non ha saputo fare i conti con i contatori visite dei siti web. Per la precisazione, in siti web bannati dal motore di ricerca si è scoperto che venivano visionati da Google tramite il seguente indirizzo Internet: http://webspam.google.com/admin.php?user=googleuser&status=verified&length=364&type=ban . Esattamente, il database dei siti web bannati da Google si trova in un sotto-dominio che dovrebbe essere perlopiù sconosciuto alla maggior parte degli utenti del web: http://webspam.google.com/. La variabile lenght nell’indirizzo di ban dovrebbe riguardare l’intervallo di controllo da parte di Google sul sito web, user dovrebbe riferirsi all’utente Google attualmente collegato, mentre status potrebbe riferirsi allo stato del sito web su Google. Da qui si può dedurre che: http://www.google.com/admin.php è il pannello principale. È evidente che, come ho avuto modo di sottolineare, i link non sono accessibili se non con determinate specifiche. Dalla scoperta del pannello di Google si giunge ad una considerazione particolarmente interessante: come si vede negli indirizzi, viene utilizzato il linguaggio PHP. Pertanto, a meno che Google non abbia volutamente camuffato un altro linguaggio con questa estensione mediante modifiche nel server (ma non ne vedrei il motivo), Google utilizza PHP esattamente come un qualsiasi altro sito basato su questo linguaggio. Ovviamente, evito accuratamente di analizzare le cosiddette “pagine senza estensione” (probabilmente delle applicazioni stile servlet o delle semplici variabili di pagine, forse in PHP, opportunamente riscritte e camuffate), poiché in questo caso, non vi sono certezze. Oltre al pannello di controllo di Google, un segreto aziendale riguarda GAIA: il sistema di autenticazione utilizzato per i cosiddetti Google Accounts. In poche parole, il sistema di autenticazione ai servizi di Google come GMail. Tale sistema è stato violato da hacker cinesi che si erano dunque intrufolati nelle caselle di posta GMail e si sono visti il famoso ultimatum “o rimuovete la censura o Google ritirerà le sue sedi dalla Cina”. L’algoritmo del motore di ricerca, infine, può essere spiegato sinteticamente: i risultati di ricerca, più che basati su un algoritmo semantico, sono organizzati a seconda della pertinenza del sito web (spesso correlata alla Google Popularity, la popolarità dettata soprattutto dai link in entrata da siti web abbastanza popolari). L’algoritmo che determina la posizione di una pagina web in Google è definito PageRank. Ad influire nella posizione ci sono anche Google Caffeine (che valuta la velocità di caricamento delle pagine web) e tanti altri fattori, che sono reperibili all’indirizzo http://www.impresapratica.com/seo/lalgoritmo-di-ranking-di-google-rivelato/ . E’ evidente che l’algoritmo esatto di Google non è reperibile, ma che comunque, non ci sono particolari segreti come si cerca di lasciar intendere.


Ciao Alessio, articolo molto interessante (non ero a conoscenza del sottodominio webspam). Vorrei solo fare alcune precisazioni:
1) I siti non vengono bannati “a mano” da un operatore umano ma mediante opportuni algoritmi che verificano determinate circostanze.
2) E’ però presente *anche* un controllo manuale e non è affatto un mistero in quanto se ne parla nella descrizione dell’algoritmo che determina il TrustRank (http://it.wikipedia.org/wiki/TrustRank)
3) E’ vero che molti criteri sono stati individuati, ma la conoscenza al 100% degli algoritmi di ranking non c’è. Il punto è che tra “intuire” e “sapere esattamente” c’è differenza assai. Se così non fosse, Google sarebbe un cumulo di spam (cosa che per fortuna ancora non è).
OT:
Per quanto riguarda la sicurezza, non esiste sito web o computer inviolabile. Qualcuno diceva che un computer per essere sicuro al 100% dovrebbe essere scollegato dalla Rete, *spento* e il disco distrutto *fisicamente*. Questo perché volendo i dati sono reperibili a distanza leggendo le emanazioni elettromagnetiche degli schermi (tempest), i dischi si possono leggere anche se formattati (informatica forense), etc.
Per i paranoici: esistono dei software che sovrascrivono i dati fino a 36 volte e riempiono il disco di 0 binari, ma se i dati “servono” a qualche agenzia governativa che ha i mezzi (es. NSA), allora per mantenerli riservati c’è solo un modo: prendere il disco a martellate (http://en.wikipedia.org/wiki/Data_remanence). :D
Gentile Sir Vester,
innanzitutto ringrazio per il commento e per l’interesse nei confronti del contenuto dell’articolo. Lei ha perfettamente ragione nelle sue precisazioni. Google ha automatizzato molte operazioni, per cui anche il ban è automatico. Il TrustRank, il controllo manuale, probabilmente viene effettuato tramite la pagina “admin.php” che avevo menzionato. Credo che se ne occupi per la maggior parte Matt Cutts, il portavoce di Google, dato che il link da me citato è stato sempre rinvenuto con la variabile “user” settata su “mcutts”. In effetti il sotto-dominio “webspam.google.com” sembra proprio non essere conosciuto in Rete, c’è chi addirittura parla di “domain spoofing”. Io credo che, invece, esista, non vedrei il perché Google dovrebbe fare dello spoofing. Dopotutto non penso che Google faccia sapere a tutto il mondo quali sono gli indirizzi dei suoi database. Infatti, se si prova ad accedere ad una qualsiasi pagina che ho linkato, si ottengono degli errori, come se i domini non esistessero. Se accedo ad “admin.php” nel sito principale di Google, c’è addirittura “404/not found”. Se l’accesso proviene dagli indirizzi IP dei dipendenti di Google, i pannelli, invece, si vedrebbero. Lo dico perché anch’io, nei siti web che gestisco, nascondo i pannelli di amministrazione con indirizzi lunghi chilometri e restituisco l’errore “404/not found” a chi non presenta le caratteristiche da me dichiarate per accedere.
Non si conosce con certezza l’algoritmo del motore di ricerca di Google, in effetti, se lo si conoscesse al 100% gli spammer troverebbero sicuramente il modo per essere in alto nelle SERPs e per non essere rilevati dagli algoritmi di controllo dello spam. E’ anche vero che il motore di ricerca non è segreto al 100%, l’articolo che ho citato dal Suo sito lo dimostra pienamente (lei stesso ha fatto il parallelismo con la formula della Coca Cola e la Pepsi Cola). La guida SEO rilasciata dalla stessa Google lo dimostra anche.
Concordo sul fatto che non esista sistema inviolabile. Peraltro la violazione dei server di Google da parte di hackers cinesi ne è una dimostrazione. Dopotutto, credo che per la protezione di questi server si siano prese molte precauzioni.
Con i migliori saluti,
Alessio Ganci.
Lascia un commento!
> IL PUNTO »
La continua crescita della disoccupazione Giovanile ed un futuro incerto
Alfonso Angrisani
Gli ultimi dati Istat hanno fotografato una scena davvero raccapricciante della situazione economica Italiana, dove un giovane su quattro è senza lavoro per le fascia d’età compresa dai 15 ai 24 anni il tasso …
> IN EVIDENZA »
Coppie in crisi: problematiche in atto
Michele Montuori
Riprendo in merito un mio vecchio articolo del maggio 2003, che credo tuttora maggiormente valido, aggiungendovi un paio di righe iniziali, queste: a settembre riaffiorano a pieno ritmo le consulenze legali per separazioni e …
> TERZA PAGINA »
La vita di oggi tra bugie e verità
Ferdinando Longobardi
La società contemporanea sta incrementando anzitutto la globalizzazione delle comunicazioni gridate e di parte, con effetti per lo più ipnotici e a discapito della vera polemica, l’unica sostituzione costruttiva di ogni guerra. La contemporaneità, …
Arte & Cultura »
Laureana Cilento: Peduto alla kermesse della Pro Loco di San Martino
Rita Occidente Lupo
Luoghi dell’anima quelli che ogni poeta tiene a cuore e che difficilmente scalfiscono il trascendente. Quando la fede autentica, provata sulle sofferenze che la vita riserva altalenandole alle gioie, la fa da padrona. …
Cronaca »
Dieta depurativa: After summer diet
Dieta depurativa post eccessi estivi : ecco cosa ci consiglia il dottor Rosario Porzio.‘After Summer Diet’ (o ‘Juicecolor diet’ per i tanti cibi liquidi colorati ricchi di principi attivi antiossidanti) dieta dei succhi, articolata in …
Spiritualità »
Salerno: riaperta al culto la Chiesa di San Michele
MariaPia Vicinanza
Dopo circa due anni di lavori, riaperta al culto la Chiesa di San Michele, nel cuore storico della città. In Via Bastioni, per la solenne concelebrazione, presieduta da Mons. Gerardo Pierro, Arcivescovo Metropolita, fedeli, …
Sport »
Ciclismo: Nusco incorona Mastantuoni
Nel fine settimana è andato in scena il 1° Trofeo ciclistico Città di Nusco, terza prova del Campionato Regionale UISP. La gara, ottimamente organizzata dalla sezione UISP di Avellino, ha visto la partecipazione di circa …
- Immigrazione »
Salerno: accattonaggio da parte d’immigrati
A seguito di numerose segnalazioni della cittadinanza lamentante la costante e pressante molestia con continue richieste di elemosina da parte di cittadini stranieri, anche con cani al seguito, nonché la presenza di dimore improvvisate con …
Curiosando »
Santo Stefano del Sole: puliamo la montagna!
A Santo Stefano del Sole, Domenica 5 settembre, l’Assessorato all’Ambiente, insieme a tutte le Associazioni del territorio, su iniziativa dell’AGS e con il supporto della Pro Loco propone la seconda edizione della giornata ecologica Puliamo …
Mondo »
Vita di Missione: i sogni di un missionario, condividere
Padre Oliviero Ferro
Prima di partire in Africa, qualcuno mi diceva che si andava a portare tante cose. Insomma, eravamo noi i ricchi che regalavano le cose ai poveri. Ma arrivato laggiù, ho dovuto cambiare in …
Sicurezza »
Salerno: due arresti della Mobile, rapine a mano armata a distributori di carburanti
Nell’ambito delle nuove strategie di contrasto alla criminalità, disposte dal Questore di Salerno, Antonio De Iesu, la Polizia di Stato salernitana sta ottenendo positivi risultati. I servizi di controllo del territorio e le mirate attività …
Commenti recenti
INFO
Iscrizione nel Registro della Stampa Tribunale di Salerno N.1404/08 R.V.G. del 25/11/2008.
Direttore Responsabile
Rita Occidente Lupo
Editore
Associazione Dentro la notizia
PI/CF 9511506 065 9
info@dentrosalerno.it
Categorie
Siti Amici
Link
Area Riservata
Archivio
Calendario
Annunci