• Bannato Super User

    copia cache e tempistica dello spider

    da qualche tempo la data che si visualizza sulla copia cache di un sito relativamente all'archivio di google, indica l'ultimo passaggio dello spider. giusto?
    in questi giorni stavo controllando se lo spider passava o meno per la homepage di un sito piuttosto nuovo, la data sulla copia cache diceva 18 ottobre.
    lo ammetto, oggi pomeriggio e, a memoria, forse anche ieri, non ho controllato...mi sono dimenticato, ma sono sicuro che i primi giorni di questa settimana controllavo costantemente.
    oggi finalmente lo spider è passato, infatti la data è cambiata, solo che indica il 20 ottobre.
    non può essere che dal 20 ad oggi non mi sono accorto dell'aggiornamento, non può essere! perchè mi annoto i dati con carta e penna, quindi sono arrivato alla conclusione che la data indica sì l'ultimo passaggio dello spider, ma che questa non coincide con il "deposito" della pagina aggiornata nell'indice del motore.
    è giusta questa mia conclusione? lo spider passa, annota e poi lui, o un'altro crawler, ripassa ed immagazzina la pagina?
    oppure funziona in qualche altra maniera?

    🙂


  • Super User

    @cibino said:

    quindi sono arrivato alla conclusione che la data indica sì l'ultimo passaggio dello spider, ma che questa non coincide con il "deposito" della pagina aggiornata nell'indice del motore.
    è giusta questa mia conclusione?

    Sì, è corretta. Il passaggio di uno spider, anche quando comporta l'aggiornamento della copia cache, non necessariamente implica l'aggiornamento dell'indice con i (nuovi) contenuti della pagina.

    Il comportamento varia a seconda di quali spider decidono di richiedere la pagina al server (esistono spider di tipo differente), a seconda di quanto nuovo testo uno spider trova e presimubilmente anche a seconda di altre "valutazioni di convenienza" a noi sconosciute (scaricare una pagina ha un costo, scaricarla e indicizzarla ha un costo più alto).


  • Bannato Super User

    grazie mille, lowlevel! 🙂