• User Attivo

    Delucidazioni su Datacenter, Big Daddy, G.Dance

    Ciao a tutti, vi prego di non spararmi ma non riesco a focalizzare un concetto... mi scuso per la banalità da neofita.

    Vorrei sapere se secondo voi ho le idee chiare in merito il funzionamento di Google ossia:

    I dataceter sono degli archivi dove gli spider memorizzano le pagine web trovate nella rete; Giusto?

    Sono strutture composte da molti server ognuno dei quali possiede un IP...

    Periodicamente devono essere aggiornati quindi il Big Daddy è un evento nel quale si aggiorna e modifica il modo in cui gli spider trattano, immagazzinano e posizionano le pagine web; Giusto?

    La Google Dance (se ancora esiste) è un aggiornamento relativo ai link che ogni sito riceve da altri siti. Più i link sono autorevoli e più il valore di Page Rank sale e questo è un parametro che influenza il posizionamento delle pagine nelle serp; cambiamenti visibili appunto dopo la Google Dance; Ci Sono?

    Ora mi domando:

    Google per motivi geografici o tecnici del momento può consultare per una stessa ricerca datacenter differenti?

    Può accadere che un datacenter non sia aggiornato e che quindi restituisca serp differenti rispetto ad' un'altro per una stessa ricerca?

    L'azione che allinea i datacenter (purchè esista) e che fa in modo che tutti abbiano gli stessi contenuti avviene col big daddy o con la dance?

    Mi scuso anticipatamente se ho scritto delle idiozie ma mi sento un po confiso sul funzionamento nonstante abbia letto guide apposite...

    Vi ringrazio anticipatamente per la pazienza...


  • Community Manager

    @Schiappa said:

    Periodicamente devono essere aggiornati quindi il Big Daddy è un evento nel quale si aggiorna e modifica il modo in cui gli spider trattano, immagazzinano e posizionano le pagine web; Giusto?

    No. Alcuni aggiornamento riguardano solo alcuni parametri, magari gli spider non c'entrano.

    @Schiappa said:

    Google per motivi geografici o tecnici del momento può consultare per una stessa ricerca datacenter differenti?

    Si

    @Schiappa said:

    Può accadere che un datacenter non sia aggiornato e che quindi restituisca serp differenti rispetto ad' un'altro per una stessa ricerca?

    Si

    @Schiappa said:

    L'azione che allinea i datacenter (purchè esista) e che fa in modo che tutti abbiano gli stessi contenuti avviene col big daddy o con la dance?

    Con nessuno dei due...può essere anche una cosa che non te ne accorgi 🙂


  • User Attivo

    Grazie Giorgio ora ho le idee più chiare...:yuppi:


  • Super User

    @Schiappa said:

    I dataceter sono degli archivi dove gli spider memorizzano le pagine web trovate nella rete; Giusto?

    Nei datacenter le pagine vengono prima indicizzate... significa che in termini semplici, in realtà si forma un vero e proprio indice alfabetico (da qui "indicizzazione") di TUTTE le keyword trovate a cui vengono associate le url dei documenti che le contengono e dati relativi alla posizione, frequenza, ecc (in questo ecc puo' starci un mondo) ...

    Quando fai una query possono essere anche 500 i server che lavorano contemporaneamente a selezionare dagli indici i documenti migliori e a ordinarli in base agli algoritmi... in modo da "rispondere" all'utente in tempi incredibilmente veloci (frazioni di secondo).

    Prima poi, di essere "offerti" in serp vengono interrogati altri datacenter dove li' si, vengono fisicamente memorizzate le pagine e dove viene estrapolato lo "snippet"

    Altri approfondimenti li trovi da qui...

    :ciauz:
    Nicola


  • User Attivo

    grazie nbriani vado subito a dargli un occhiata! :yuppi:


  • User Attivo

    :arrabbiato: allora dopo quello che "gentilmente" mi avete detto e la guida indicata ho riordinato le idee... allora:

    Le pagine reperite dallo Spider vengono archiviate nei ?server?, di cui sono costituiti i datacenter, ed organizzate in ?indici? (tipo alfabetici) in modo tale che avviata una ricerca sia veloce la restituzione, come risultato, delle pagine ritenute ?rilevanti? a quell'indice specifico; questo processo prende appunto il nome di ?indicizzazione?, se l? utente digita ?mela? verranno restituiti tutti i documenti che possiedono nei contentuti questa parola.

    Per velocizzare le ricerche occorre che l?indice generale sia ordinato, per questo alle pagine web viene assegnato un ?id? (codice identificativo) specifico, in base alle parole chiave in esse contenute (classificazione?).

    Vista la mole di dati occorre che i documenti vengano restituiti seguendo un ordine di importanza; questo ordine è il ?ranking? dove gli algoritmi, considerando fattori interni ed esterni alla pagina, deicidono quale documento è più rilevante rispetto ad altri, portandolo in alto nelle serp.

    Ora ci sono?


  • Super User

    Direi che in linea di massima è cosi'.... poi se qualche ingegnere addetto alla sala macchine ci vuole dare qualche dettaglio tecnico maggiore meglio... comunque, si grosso modo cosi' dovrebbero funzionare i MDR.

    Chiaro che il "modo" di organizzare l'indicizzazione e il modo di applicare gli algoritmi... è un mondo intero.....

    :ciauz:
    Nicola


  • User Attivo

    E che sopratutto cambia nel tempo... meno male almeno stanotte dormo...
    grazie e alla prossima!


  • Super User

    @Schiappa said:

    Per velocizzare le ricerche occorre che l’indice generale sia ordinato, per questo alle pagine web viene assegnato un “id” (codice identificativo) specifico, in base alle parole chiave in esse contenute (classificazione?).

    Gli indici vengono fatti e ordinati per parola chiave, poi a ciascuna parola associ tutti gli ID dei documenti che la contengono ...che serve poi a rintracciare fisicamente il doc per la creazione dello snippet e la visualizzazione della cache


  • Super User

    cmq vorrei fare i miei complimenti a schiappa per aver detto come vede la cosa.. puo' servire a tanta gente (ri)leggere come funzionano i motori, soprattutto se a dirlo è una persona che parla un linguaggio umano e non troppo tecnico.

    ci vorrebbero più interventi di questo tipo 🙂