+ Rispondi alla Discussione
Risultati da 1 a 4 di 4

File robots.txt ignorato

Ultimo Messaggio di silvername il:
  1. #1
    User
    Data Registrazione
    Sep 2013
    Localit
    roma
    Messaggi
    42

    File robots.txt ignorato

    Buongiorno,
    avrei bisogno di un chiarimento da parte vostra a proposito di una situazione che mi si sta presentando in questi giorni.
    Ho un sito in wordpress all'interno del quale ci sono delle pagine che erano state indicizzate ma che erano delle semplici bozze.
    Ho impostato queste pagine come "Bozze" in wordpress e in effetti ora sono irraggiungibili. Il problema per che google continua a tenerle nell'indice.
    A questo punto ho inserito le pagine da non indicizzare all'interno del file robots.txt nella speranza che non apparissero pi nelle serp; e invece con mio grande
    stupore le pagine continuano a essere indicizzate.
    Ho anche pensato che forse a google servisse pi tempo per riscansionare il sito ed eliminare le pagine non pi esistenti; e invece facendo una prova con una di queste pagine, eliminandola
    definitivamente ho notato che le serp si aggiornano dopo uno o due giorni.

    Riporto una delle istruzioni che ho inserito all'interno del file robots che a quanto pare viene ignorato:

    Codice:
    User-agent: *
    Disallow: /?p=12000
    La pagina che vorrei escludere dalla scansione : wwwmiositoit/?p=12000

    Spero in un vostro suggerimento.

  2. #2
    Utente Premium
    Data Registrazione
    Jul 2012
    Localit
    Roma
    Messaggi
    1,231
    1) Cambi url della pagina indicizzata su Google in modo tale che non venga pi trovata
    2) Fai un Redirect 301 dalla vecchia pagina alla home (o altra pagina indicizzata che vuoi far vedere)

  3. #3
    Moderatore L'avatar di Federico Sasso
    Data Registrazione
    Dec 2012
    Localit
    Genova
    Messaggi
    1,875
    Segui Federico Sasso su Twitter Aggiungi Federico Sasso su Google+ Aggiungi Federico Sasso su Linkedin
    Ciao silvername,

    Citazione Originariamente Scritto da silvername Visualizza Messaggio
    Ho un sito in wordpress all'interno del quale ci sono delle pagine che erano state indicizzate ma che erano delle semplici bozze.
    Ho impostato queste pagine come "Bozze" in wordpress e in effetti ora sono irraggiungibili. Il problema per che google continua a tenerle nell'indice.
    A questo punto ho inserito le pagine da non indicizzare all'interno del file robots.txt nella speranza che non apparissero pi nelle serp; e invece con mio grande
    stupore le pagine continuano a essere indicizzate.
    Ho anche pensato che forse a google servisse pi tempo per riscansionare il sito ed eliminare le pagine non pi esistenti; e invece facendo una prova con una di queste pagine, eliminandola
    definitivamente ho notato che le serp si aggiornano dopo uno o due giorni.

    Riporto una delle istruzioni che ho inserito all'interno del file robots che a quanto pare viene ignorato:

    Codice:
    User-agent: *
    Disallow: /?p=12000
    La pagina che vorrei escludere dalla scansione : wwwmiositoit/?p=12000
    Sicuro che il robots.txt venga ignorato?
    Tieni conto che l'esclusione nel robots.txt di un URL gi indicizzato in s non ne comporta la de-indicizzazione. Anzi potrebbe prevenirla: ora la pagina dovrebbe se ho capito bene restituire un 404 "Not Found", ma il bot di Google non pu scoprirlo perch gli impedita l'esplorazione della risorsa da parte del robots.txt

    Spero d'esserti stato utile
    MODPosizionamento nei motori di ricercaFederico Sasso, autore di Visual SEO Studio - Il tool SEO Italiano, disponibile anche in Inglese, Francese, Polacco, Russo, Spagnolo e Tedesco.

  4. #4
    User
    Data Registrazione
    Sep 2013
    Localit
    roma
    Messaggi
    42
    Grazie per la risposta, sei stato molto chiaro.
    In effetti stavo commettendo un errore pensando che con l'utilizzo di regole "Disallow" all'interno del file robots.txt per far sparire
    alcune pagine gi indicizzate dalle serp.

    Grazie ancora per il chiarimento.

    Citazione Originariamente Scritto da Federico Sasso Visualizza Messaggio
    Ciao silvername,


    Sicuro che il robots.txt venga ignorato?
    Tieni conto che l'esclusione nel robots.txt di un URL gi indicizzato in s non ne comporta la de-indicizzazione. Anzi potrebbe prevenirla: ora la pagina dovrebbe se ho capito bene restituire un 404 "Not Found", ma il bot di Google non pu scoprirlo perch gli impedita l'esplorazione della risorsa da parte del robots.txt

    Spero d'esserti stato utile

+ Rispondi alla Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] Attivato
  • Il codice [VIDEO] Attivato
  • Il codice HTML Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.