• Moderatore

    Aggiornamento Google più frequente?

    Ciao a tutti,
    controllo tutti i giorni la mia pagina di google webmaster e come sapete nell' introduzione ti dice quand'è stata l' ultima volta che google ha aggiornato la tua homepage.

    Ho notato che ultimamente googlebot accedeva alla mia homepage con più frequenza, prima ogni 2 settimane o più, poi 1 settimana, poi 5 giorni.

    Io ne ero felice ma da qualche giorno non mi dice più la data dell' ultimo accesso.
    E' possibile che sia perchè googlebot "passa" sul mio sito tutti i giorni, o mi sto illudendo e il motivo è un altro?

    Aspetto le vostre opinioni
    Grazie :gthi:


  • Moderatore

    Anche sui miei siti da qualche giorno non dice più la data dell'ultimo accesso, appare invece "Accesso di Googlebot alla tua home page completato. ". Suppongo quindi che sia una modifica del wmt, valida per tutti e in generale.
    Qualche tempo fa accadeva che su un sito apparisse la data dell'ultimo accesso e magari su un altro no, senza che fosse possibile capirne la ragione, ma ora mi sembra che non compaia più.
    E' meglio così, perchè si trattava di un dato non vero.
    Probabilmente hanno preferito toglierlo per questa ragione. In realtà il robot passa molto più frequentemente di quanto risulti dal wmt, e spesso anche l'ultima home page indicizzata è molto più recente rispetto a quella indicata nel wmt.
    Per esempio, sull'ultimo sito (nuovo) che sto monitorando, wmt mi dava l'ultima home page caricata due settimane prima, ma in realtà il robot passava tutti i giorni a caricare una decina di pagine, e ogni due o tre giorni caricava anche la home page. Il che non vuol dire che la indicizzasse, però mi bastava fare una ricerca su un post recente presente in home per accorgermi che in realtà anche l'ultima indicizzazione era molto più recente di quanto apparisse dal wmt.
    Insomma non era un dato affidabile.
    Per quanto riguarda il sito che sto monitorando, che carica tra 10 e 20 pagine al giorno (lo vedo dal log), è probabilmente veritiero invece il dato che si trova in statistiche scansione (Numero di pagine scansionate al giorno) di wmt.
    Però, una volta scansionate le nuove pagine non è che le indicizza subito, come invece fa per esempio nel caso di scansione da link esterni, o almeno nel mio caso è molto lento a indicizzare le nuove pagine dopo averle scansionate.
    Se questo sia normale o no, mi piacerebbe avere qualche parere in merito.


  • User

    Ciao a tutti, anche nel mio sito da qualche giorno non appare più la data dell'ultimo accesso e penso sia come dice gianrudi. Suppongo anche che sia meglio coi', ma a questo proposito voglio farti una domanda Gianrudi. Come faccio a verificare quando il Robot ha scansionato le pagine del mio sito web? Hai parlato di Log, ma non sono molto esperto. potresti spiegarmi qualcosa in proposito? Grazie.


  • Moderatore

    Il log è un file di testo con la lista degli accessi ricevuti da un sito web, corredati da varie informazioni tra cui la specifica pagina caricata e il tipo di browser utilizzato dal richiedente (nella variabile $HTTP_USER_AGENT), data e ora dell'accesso, ip, etc.
    Se l'accesso proviene da un robot e non da un browser, la variabile relativa al tipo di browser conterrà la stringa identificativa del robot.
    Basta quindi cercare nel log, nel campo che specifica il tipo di browser, la stringa identificativa di un certo robot, per verificare gli effettivi accessi alle diverse pagine eseguiti da quel robot.
    Alcuni programmi di statistica dichiarano di fornire i dati degli accessi dei robot, a dire il vero quelli che ho provato io non si sono rivelati molto affidabili su questo punto, per cui alla fine uso un codice mio.
    Va detto però che la scansione di una pagina da parte di un robot non dà necessariamente luogo all'indicizzazione della pagina stessa, su questo punto ho trovato interessante questa discussione: giorgiotave.it/forum/indicizzazione/10900-googlebot-passa-ma-non-indicizza-niente.html


  • User

    Ti ringrazio per i chiarimenti, ma dove trovo il log del mio sito web?


  • Moderatore

    @maxirocco said:

    Ti ringrazio per i chiarimenti, ma dove trovo il log del mio sito web?
    Dipende, se il tuo fornitore di hosting prevede il servizio, lo puoi trovare nel pannello di controllo a una voce tipo 'statistiche', o 'logs del sito'. Non tutti però forniscono l'accesso ai log, io per esempio lo trovo nel pannello di un certo fornitore di hosting ma non lo trovo nel pannello di un altro più economico.
    In mancanza dei log del server, per monitorare gli accessi è necessario creare un proprio file di log attraverso porzioni di codice (tipicamente php) inserite nelle pagine del sito, che ad ogni accesso registrino (tipicamente in una tabella di database, ma volendo anche in un file) una riga di informazioni con i dati di chi ha eseguito l'accesso a quella pagina.
    In pratica, è quello che fanno i vari programmi per le statistiche del sito, che attraverso un codice (o un link a un codice) inserito nelle pagine da monitorare creano un proprio file di log, che poi si vanno a leggere al momento di restituire le informazioni all'utente.
    Personalmente, avendo trovato insoddisfacenti alcuni programmi di statistiche (phpstats e fkounter) nel monitoraggio dei robots, alla fine ho creato una tabella ad hoc dove registrare le informazioni sugli accessi e ho inserito nelle pagine da monitorare l'opportuno codice.


  • User Attivo

    lo notavo anche io! che pizza pero era utile l'informazione della data. Pero se si va nelle cache di google ti dice che pagina corrente ha lui e sopra la data, quindi credo sia quella l'ultima volta che è passato


  • User

    Non so se il mio fornitore di Hosting mi da un pannello di controllo, devo verificarlo, ma se cosi' non fosse, come creo il famoso file log? potresti farmi un'esempio pratico, ovviamente generico?


  • Moderatore

    @maxirocco said:

    Non so se il mio fornitore di Hosting mi da un pannello di controllo, devo verificarlo, ma se cosi' non fosse, come creo il famoso file log? potresti farmi un'esempio pratico, ovviamente generico?

    Posso dirti come ho fatto io in pratica.

    Ho creato una tabella mio_log nel database mysql con questi campi:
    time_accesso (data e ora dell'accesso)
    HTTP_USER_AGENT (identificativo del browser dell'utente)
    REQUEST_URI (indirizzo della pagina richiesta)
    HTTP_REFERER (indirizzo di provenienza)
    REMOTE_ADDR (ip del richiedente).

    Poi ho inserito nelle pagine da monitorare una insert sql di questo tipo (all'interno di codice php):

    INSERT INTO mio_log (time_accesso,HTTP_USER_AGENT,REQUEST_URI,HTTP_REFERER,REMOTE_ADDR) VALUES(strftime('%y  %b %d  %H:%M:%S',time()),$_SERVER['HTTP_USER_AGENT'],$_SERVER['REQUEST_URI'],$_SERVER['HTTP_REFERER'],$_SERVER['REMOTE_ADDR']);
    
    ```Per farlo in pratica bisogna avere le conoscenze di sql e php necessarie per creare la nuova tabella e il codice php che ci inserisce le righe.

  • User

    Ti ringrazio, purtroppo al momento le mie conoscenze di sql e php sono molto scarse, ma faro' tesoro dei tuoi consigli per quando avro' una preparazione migliore di quella attuale.