Visto che non mi capita spesso di interagire con
kerouac3001, colgo l'occasione per qualche s**a mentale aggiuntiva
Escludo anche io l'ipotesi del Onlick Js o della pagina intermedia tra
serp e sito. Nel primo caso non c'è traccia nel codice delle
serp, e nel secondo, almeno una delle tante volte che navigo in gprs (quindi lentissimamente) me ne sarei accorto. Comunque lo escludo, anche in virtù della visione dei log (log...ti ho quasi letto nel pensiero?..vabbè me lo dici dopo

)
Quote:
|
kerouac3001
Google sa esattamente quali link ci sono nella serp che ti ha appena mostrato e conosce la loro posizione, quindi se ha bisogno di memorizzare i dati sul traffico generato da ogni link deve solo riuscire a scoprire dove l'utente ha cliccato e poi cercare nella serp per vedere a che posizione si trova il link.
|
Google sa per certo che il pc contraddistinto dall'IP XX.XXX.XXX.XXX (e da chissà quante altre caratteristiche unicizzanti) si è collegato a
Google.it ( .com, .fr ecc) e ha effettuato la query "xyz".
Visitando la pagina:
http://www.google.it/search?hl=it&q=...n+Google&meta=
A seconda delle preferenze dell'utente questa pagina mostrerà N risultati. Ipotizziamo l'utente nella configurazione comune (10 results).
Non trova nulla nella prima pagina, e va alla seconda:
http://www.google.it/search?q=xyz&hl...&start=10&sa=N
A questo punto clicca su
http://www.xyzrgb.com/
Che è posto alla 19esima posizione, almeno sul DC che ho appena visto.
Il
datacenter ha quindi la possibilità di memorizzare (come farebbe qualsiasi
server) che:
1. Un utente si è collegato al sito
2. L'utente ha richiamato il 'search' con la query XYZ
3. L'utente ha effettuato una nuova ricerca con la stessa query per vedere i risultati tra l'11 e il 20
4. L'utente è
uscito dal sito (google) tramite il link
http://www.xyzrgb.com/
5. Google sa che in quel DC, in quel momento,
http://www.xyzrgb.com/ era il numero 19 tra i risultati selezionati e presentati all'utente.
Tutto sommato non è tecnicamente arduo tracciare dati simili.
Quote:
|
kerouac3001
Ok. Questo è un discorso che può apparentemente essere valido se stiamo pensando di memorizzare il traffico generato da una singola serp. Ma con tutta probabilità google non memorizza il traffico generato da un sito in una serp (le risorse necessarie per monitorare il traffico generato da tutti i link di tutte le serp sarebbero veramente enormi)........
|
Sembra una mostruosità se immaginiamo di compiere la stessa operazione su un
hosting commerciale, o in locale con il pentiumIV, l'architettura hardware di un DC è un tantino più sofisticata, e non credo che la mole di dati generata, seppur imponente, rappresenti uno sforzo eccessivo (nota che ho parlato di architettura, più che di hardware in sè, visto che notoriamente i Pc in cluster di Google sono normalissimi...)
Per un sunto delle capacità hardware c'è un interessante
articolo-intervista su Zdnet
Mi spiace sia in inglese, se ne trovo una traduzione, o un articolo egualmente esplicativo in italiano lo posto volentieri.
Tornando al discorso memorizzazione delle operazioni, sarebbe impensabile fare tutto in tempo reale. L'esperimento "Traffico Vs Sandbox", pur nella sua artigianalità, mi ha portato all'ipotesi che almeno per quanto riguarda i dati del traffico (lo so lo so che
Vermut ha detto che sono stupidaggini le teorie sul traffico, ma lasciatemi andare avanti, assumo la responsabilità di tutto ciò che scrivo), vengono elaborati non immediatamente: probabilmente il DC memorizza tutta l'attività che c'è nelle serp, ricerche, click, visualizzazioni
Adwords ecc ecc...dopodichè, ad intervalli più o meno regolari, invia un report di questi dati ad altri DC in modo che siano allineati, e ripuliti.
Mi spiego meglio: quando cerchiamo qualcosa su Google, stiamo in realtà cercando qualcosa su un DC (tra i tanti). Se digito invece di Google, il singolo indirizzo del DC, posso assicurare anche 100 click al mio sito ogni giorno. Sono server diversi, e ognuno registra una (1) mia ricerca. Tutto regolare insomma. La rielaborazione dei dati a mio parere serve a ripulire i dati delle serp da ricerche inutili, duplicate, click fraud dagli AdWords.
Il gap che ho verificato tra un
posizionamento e l'altro, potrebbe essere dovuto proprio a questo calcolo in differita delle attività dei DC.
Quote:
|
kerouac3001
probabilmente google memorizza i dati generali sul traffico generato da un sito. Ovvero memorizza il traffico totale di un sito web, probabilmente in rapporto al numero di visualizzazioni.
|
Questo potrebbe anche avvenire. Ma come fa Google a memorizzare i dati
totali del traffico di un sito? Elabora i dati della Toolbar?.......dà una sbirciatina ai log del sito?
Quote:
|
kerouac3001
Ma a quel punto la domanda è: google prima di memorizzare tale dato, controlla se l'url è realmente presente nella serp?
|
Dipende da dove preleva le informazioni sul traffico del sito: se si limita a fare un rapporto tra
CTR e dati della TB, è già in grado di avere plausibili approssimazioni del 'valore' di un sito.
Quote:
|
kerouac3001
Se io sapessi come aggiungere un link alla serp, google vedrebbe positivamente o negativamente i click al link inesistente?
|
Quote:
|
kerouac3001
se google realmente usa i dati sul traffico generato da un sito && se google non controlla se il sito è realmente presente nella serp, allora forse la mia domanda diventa interessante, perché ad aggiungere un link in una serp ci vuole poco..basta un pò di fantasia 
|
Viste le recenti (e fino a prova contraria, autorevoli) smentite, il
SE è d'obbligo; il discorso però è interessante, almeno come test, si potrebbe far credere a Google che un sito non solo è presente in una serp (perchè ha Google nei referer?), ma che gli utenti spesso e volentieri ci cliccano sopra...sicuramente farei questo test su un dominio a perdere.
Cordialmente,
Stuart