• User Attivo

    Googlebot e Sitemap: delirio!

    (spero di essere nella sezione corretta)

    Googlebot continua a leggere una vecchia sitemap che non esiste più da mesi.

    Non solo: è come se in continuazione la scaricasse segnalandomi poi che esistono url errati per cui viene scartata.
    Nel pannello WM tools di GG dice:
    [INDENT]Errori relativi agli URL delle sitemap (26)
    ...
    h ttp://w.w.italy-recipes.com/recipes/_basilicata/ 404 (Non trovato) 08/giu/2008 !!!
    [/INDENT]questo link non esiste più da due mesi!

    Ho provato di tutto fino a:

    • eliminare la vecchia sitemap.xml
    • eliminare fisicamente la directory "/recipes"
    • bloccarla nel robots.txt
    • eliminare vecchie pagine nel sito anche se non più inserite nella struttura dei link
    • reinviare una nuova map con nome diverso (mappazza.xml) di cui sono sicuro non contenga link a dir/recipes/

    DELIRIO!


  • User Attivo

    Hai provato a dire a google di eliminare le vecchie pagine indicizzate che non ti interessano più dal pannello di controllo dei servizi per webmaster di google?


  • User Attivo

    @wingroup said:

    Hai provato a dire a google di eliminare le vecchie pagine indicizzate che non ti interessano più dal pannello di controllo dei servizi per webmaster di google?

    Si si ... è la prima cosa che ho fatto
    lo scritto anche sopra, gli ho detto di rimuovere tutto il folder
    Ma il problema è che continua a dirmi che nella sitemap ci sono url errati 😮
    ma non esiste nemmeno la sitemap!


  • User Attivo

    Se forse ti crei un altro account credo sia meglio 😄
    Hai fatto praticamente tutto , e non funziona ancora.
    Strano. Davvero strano.


  • User Attivo

    Un'altro account? Argh!!!
    Ma a cosa servirebbe, GG permette di verificare l'autenticazione del sito a più di un profilo?


  • ModSenior

    Si puoi verificarlo in quanti profili vuoi


  • Super User

    @luvaltol said:

    Googlebot continua a leggere una vecchia sitemap che non esiste più da mesi.

    Hai modo di sapere se lo spider ha effettivamente richiesto la vecchia sitemap e che cosa gli è stato risposto dal server?

    Al momento l'unica tua sitemap XML è "mappazza.xml" ?

    Se sì, è l'unica sia sul pannello di GWT, sia sul server, sia nel file robots.txt?


  • User Attivo

    @LowLevel said:

    Hai modo di sapere se lo spider ha effettivamente richiesto la vecchia sitemap e che cosa gli è stato risposto dal server?
    non c'è nulla che mi faccia capire questo... nn ho errori tipo "sitemap non trovata"

    @LowLevel said:

    Al momento l'unica tua sitemap XML è "mappazza.xml" ?
    Si

    @LowLevel said:

    Se sì, è l'unica sia sul pannello di GWT, sia sul server, sia nel file robots.txt?
    Si, si , si


  • Super User

    L'unica idea che mi viene in mente è che Google affermi per errore che gli URL inesistenti stiano nella sitemap, quando in realtà si tratta di URL in link che da altri siti puntano alle vecchie pagine non più esistenti.

    Hai provato a fare delle redirezioni 301 dalle vecchie pagine "recipes" a delle pagine nuove corrispondenti (o alla sezione di appartenenza tematicamente più vicina)?

    (controlla anche il suto sito con uno spider, ho notato qualche "link" rotto ad immagini che stavano sotto "recipes")


  • User Attivo
    • Infatti ho fatto anch'io la stessa ipotesi su vecchi link in giro che puntavano a "recipes"

    • per i 301 li avevo messi e nella diagnostica mi diceva che la sitemap veniva scartata perchè cerano troppi redirect 301... ma il bello è che nella sitemap non avevo più messo i link a quella dir !

    Mannaggia a me quando ho cambiato il nome al folder! Spero che questa mia disavventura torni utili a qualcuno. Sai perchè l'ho fatto? Perchè quando ho visto che non mi posizionava bene, ho verificato i "siti simili al mio" e mi estraeva tutti siti in inglese! In pratica mi posizionava male sulle serp in italiano come se il mio sito fosse scritto in inglese ho pensato ... "sarà per via del nome italy-recipes" folder "recipes" ecc. ... ma che cavolo!!! :mmm:

    eh no Zio Gugol, non ci siamo.


  • Super User

    @luvaltol said:

    Sai perchè l'ho fatto? Perchè quando ho visto che non mi posizionava bene, ho verificato i "siti simili al mio" e mi estraeva tutti siti in inglese! In pratica mi posizionava male sulle serp in italiano come se il mio sito fosse scritto in inglese ho pensato ... "sarà per via del nome italy-recipes" folder "recipes" ecc. ... ma che cavolo!!! :mmm:

    Eh... l'errore è stato nel credere che i risultati dell'operatore "related:" dipendessero principalmente dal testo contenuto nell'URL. 😉


  • User Attivo

    @LowLevel said:

    Eh... l'errore è stato nel credere che i risultati dell'operatore "related:" dipendessero principalmente dal testo contenuto nell'URL. 😉

    Mah... pensi che fare una richiesta di re-inclusione possa servire per comunicare a loro che la vecchia sitemap non esiste più e che il sito è in italiano?

    O meglio provare a trasferire tutto su un altro dominio?

    :bho:


  • Super User

    @luvaltol said:

    Mah... pensi che fare una richiesta di re-inclusione possa servire per comunicare a loro che la vecchia sitemap non esiste più e che il sito è in italiano?

    A naso, consiglierei di usare le richieste di reinclusione solo nei casi previsti da Google.

    O meglio provare a trasferire tutto su un altro dominio?

    Mi parrebbe una decisione drastica.

    Prova a togliere tutte le sitemap per un po', controlla bene che sul sito non ci siano più link a "/recipes/" ed attendi del tempo.

    Magari riproponendo una nuova sitemap tra uno o due mesi, Google si baserà solo sul nuovo materiale.


  • User

    Da qualche giorno sulla sitemap di diversi siti ci sono "Errori relativi agli URL delle sitemap" e parecchi 404. Ma io a differenza di te non ho MAI toccato nulla. Non solo ma da una settimana Google ha iniziato ad indicizzare molto male: indicizza solo le pagine tag (sono blog in wp) e i single post non li vede neppure. E sto notando che le pagine cache di parecchi siti sono sempre più vecchie.


  • User Attivo

    Ok, già da giovedì scorso

    • ho eliminato tutte le sitemap
    • eliminato il denied a robots (per far sparire qls riferimento)
    • ho verificato online che non ci fossero riferimenti a "/recipes"
    • e già da molto tempo avevo fisicamente eliminato il folder
    • ho "spazzato" il sito dal pannello WM (come se non fosse + mio)
    • ho fatto diverse verifiche di validazione del codice html dal w3c

    Adesso vediamo che succede...

    grazie a tutti per il contributo 😉