• User

    Stavolta Google ha "toppato"

    Salve a tutti, circa un anno fa ho registrato un dominio (italia e vacanza e poi il .it) perchè volevo realizzare un blog nell'ambito turistico italiano, successivamente ho inserito una pagina che avrebbe introdotto il tipo di blog che da li a poco avrei creato e pubblicato. Per questa realizzazione ho clonato interamente un altro mio blog che parlava di bellezza per poi rimuoverne i contenuti e modificato completamente il template. Dopo 2 giorni Google aveva inserito nel suo indice tutte le pagine. A questo punto blocco il tutto con una password e continuo il mio lavoro. A settembre finalmente pubblico il blog con nuova grafica, nuovi contenuti (tanti) e da quel giorno lotto per capire come fare per essere incluso da Google visto che una penalizzazione mi ha escluso. Cambiato hosting, segnalato a Google la reinclusione dal pannello webmaster, ho inserito decine di link verso questo sito e nonostante mi abbiamo detto che verrà reinserito ad oggi dopo circa 2 mesi ancora nulla! Pannello Webmaster la site map è ok, non ci sono errori proprio non capisco. Qualche consiglio? Grazie tante a tutti!!

    Dominio:
    italia e vacanza col punto it

    Motori:
    Google

    Prima indicizzazione o attività:
    Viaggi

    Cambiamenti effettuati:
    segnalazioni, hosting,

    Eventi legati ai link:
    dicersi link in entrata

    Sito realizzato con:
    wordpress

    Come ho aumentato la popolarità:
    nessuna

    Chiavi:
    non mi interessano per il momento

    Sitemaps:
    Si


  • Super User

    Ciao, ci sono centinaia di siti con gli stessi tuoi testi.
    I tuoi nuovi contenuti sono contenuti ben noti a google, il quale sa riconoscere quando sono duplicati.
    Che poi le varie strutture di prenotazione online ti abbiano dato il permesso di copiarli, è un altro discorso che a Google non interessa.


  • User

    ...mio caro Webmaster70, è evidente che ci deve essere un equivoco. Il sito in questione ha testi originali da noi creati. Abbiamo fatto verifica anche con copy escape il quale non segnala alcuna copia. I contenuti del sito sono del tutto originali. Ripeto il sito è: italiaevacanza.it. Grazie mille per la risposta comunque!


  • Super User

    Ho sbagliato sito! Ho cercato "italia e vacanza.it" e non ho trovato niente di simile, ho cercato "italia vacanza.it" e sono approdato in un altro sito, se lo scrivevi subito intero non c'erano equivoci.


  • Moderatore

    Concordo, i contenuti sono originali.

    Tra le altre cose il sito ha PageRank assegnato e pubblicità di AdSense tematizzata pur essendo completamente fuori dagli indici.

    Ho notato, navigando, che ogni tanto vengono restituite pagine di errore da Firefox: come se vi fosse applicato un redirect infinito. Le pagine in questione sono "idee" e "contatti" con collegamento in alto a destra, ma più in generale qualsiasi url alla quale si tolga la "/" finale. Controlla bene come hai implementato i vari redirect.

    Sempre cercando di ragionare posso proporre un problema di accesso al file robots.txt. Quando Google non riesce a reperire questo file, cancella il sito dall'indice. Possiamo toglierci il dubbio dagli Strumenti per Webmaster (sezione "Accesso crawler"), magari sostituendo all'attuale un txt con il codice

    User-agent: *
    Disallow: 
    ```per poterlo meglio verificare.
    
    Ti consiglio infine di controllare le statistiche di accesso del crawler sul tuo sito e di prelevare qualche pagina di prova, sempre dagli Strumenti, attraverso la nuova funzione "Visualizza come Googlebot".
    
    Se escludiamo il problema tecnico, mi viene in mente soltanto che tu possa essere stato bannato per un comportamento grave tenuto in precedenza. Ora però non hai praticamente link in uscita e contenuti originali, quindi hai tutte le carte in regola per essere reinserito a seguito di una richiesta di riconsiderazione. (Ma come si spiegherebbe AdSense?)
    
    Spero di esserti stato utile, rimango in attesa delle tue risposte ai problemi che ho posto o di spunti da parte di altri.
    Buona indagine!

  • User

    Grazie Bussola 🙂 in effetti avevo notato con firefox quei problemi alle pagine ma che avrei risolto e comunque lo avevo escluso come problema. Proverò anche modificando il file robot.txt Il pagerank gli e stato da un mese assegnato, AdSense sono sempre stati presenti sin dall'inizio.....


  • User

    Adesso ho inserito un robots.txt come quello indicato da te e ho ricontrollato il file .htaccess per l'url rewrite per verificare che non facesse redirect "strani".
    C'è però un'altra cosa che mi è venuta in mente e che mi lascia perplesso nel pannello webmaster di google.
    Ho inserito sia italiaevacanza punto it che www italiaevacanza punto it (il primo fa un redirect 301 sul secondo), andando a vedere la dashboard di www italiaevacanza punto it mi dice: "Googlebot has successfully accessed your home page. Pages from your site are included in Google's index." quindi secondo loro le pagine nell'indice ci sono ma sotto la voce Top search queries mi dice: "No data available. (Why not?)" ma sotto la voce Keywords mi elenca "hotel", "terme", "vacanza", "italia" e "visite" cioè tutte keyword che corrispondo effettivamente alle mie pagine.
    Vi è mai successo qualcosa di simile?


  • Moderatore

    Purtroppo non ho mai avuto esperienze simili, comunque vi sono ancora dei redirect strani utilizzando Firefox, provando ad accedere a certe pagine omettendo l'ultimo /.

    Mi perdoni questa raffica di domande? (Rispondi solo quando desideri e lo ritieni utile, ovviamente):

    Dagli Strumenti per Webmaster, nella sezione dedicata all'invio della Sitemap, quanti url risultano indicizzate?
    Hai provato a prelevare qualche pagina come ti ho suggerito ("Visualizza come Googlebot")?
    Il robots appare regolarmente negli Strumenti?
    I grafici del crawling sono movimentati?

    Resto in attesa di ulteriori interventi, sperando che altri possano partecipare alla risoluzione del problema.


  • User

    ...nessun problema! :))))
    Ecco cosa viene visualizzato in quella pagina inerente la site map:
    Statistiche Sitemap

    Totale URL: 71
    URL indicizzati: 52

    In ("Visualizza come Googlebot") ma fa un elenco di url con accanto "riuscita" e cliccandoci sopra si visualizza regolarmente il codice della pagina.

    Il Robot appare regolarmente ed è stato visto circa un'ora fa. (Richiesta riuscita)

    I grafici del crawling sono movimentati e neanche poco!

    Proprio non capisco.


  • Moderatore

    Sono sinceramente a corto di idee, per il momento mi sono rimaste soltanto queste 3 (nessuna delle quali, tra l'altro, mi convince appieno).

    Prima idea: questo redirect non funzionante, può fare così male? Non so come lo hai implementato, ma ti assicuro che con Firefox, cliccando i 2 link in alto a destra (senza "/" finale) si ottengono le cose più "strane": certe volte nessuna azione, certe volte un redirect infinito, certe volte il risultato corretto.

    Seconda idea: quanto è stato lungo il periodo di chiusura del sito? Mi preoccuperei di ottenere qualche link "fresco" e valido (lo hai già fatto?) perché magari Google ha già visionato quelli vecchi considerandoli a suo tempo "rotti". Adesso servirebbero per mostrargli la tua attività.

    Terza idea: a Google non è piaciuto il modo nel quale hai chiuso il sito. Devi scoprire come mai non gli è piaciuto e inviargli una (nuova) richiesta di riconsiderazione chiare e coincisa (guarda anche il video).

    Le prime 2 ipotesi mi sembrano oltremodo assurde (visto, ad esempio, il corretto passaggio del crawler sul sito) ma non vuol dire che non sia utile rimediare. L'ultima idea non mi combacia, in particolare, con la presenza di annunci AdSense ma almeno presuppone un intervento manuale lato Google in grado di redimere la questione.

    L'unica altra ipotesi razionale è un problema "nascosto" lato hosting; e su questo non posso assolutamente aiutarti. Mi dispiace dover tirare in mezzo chi probabilmente non c'entra nulla (non sono solito farlo), ma è davvero l'ultimo appiglio che m'è rimasto.

    Spero che altri sappiano darti la soluzione, visto che io, in sostanza, mi sono limitato a ragionare con te a voce alta. Credo comunque di esserti stato utile, se non altro a riordinare le idee. Tu a che punto del ragionamento sei? Qualcun altro ha la sua ipotesi da presentarci?


  • ModSenior

    Aggiungo qualche considerazione personale....

    A me sembra che Italiaevacanza.it sia bannato da Google e filtrato pesantemente da Bing visto che restituisce una sola pagina (rende solo la sitemap: www italiaevacanza.it/sitemap.xml.gz).

    Segno evidente come diceva LaBussola che qualcosa è accaduto in passato se 2 motori su 3 (Yahoo! ancora tiene le tue pagine) hanno deciso di escludere il tuo sito dal loro indice.

    Non è che hai subìto attacchi al template WordPress ?

    Intanto ti invito a segnalare la sitemap anche via robots.txt e a fornire altre informazioni (eventualmente anche relative all'altro blog sulla bellezza di cui parlavi) ...


  • User

    ...ripeto, l'unica cosa azzardata che abbiamo fatto è stato quella di clonare un nostro sito per modificarne il template. Nient'altro! E poi come si spiega il 2/10 di PR? come si spiega l'ADSense? Da quando il sito è on-line con nuovi contenuti e nuovo template sono passati 5 mesi e nonostante Google ci abbia detto che sarebbe stato reincluso ancora nulla. Sarebbe stato più semplice rispondere: il tuo sito è stato bannato per questo motivo. Abbiamo provato a fare un'altra prova inserendo un tema base di WP. Vedremo! Saluti e grazie.


  • User

    Salve, girando un po, leggendo, ho cercato di capire in quali situazioni Google penalizza e non mi sembra che abbia fatto di questa serie di probabilità. Negli ultimi 10 giorni abbiamo inserito un template base di wordpress (abbiamo anche pensato che fosse il template). Nessun testo nascosto, nessuna door-page, nessuna tecnica spam o redirect, NULLA! Allora perchè ha bannato il sito? Perchè nonostante tutte le richieste di reinclusione e nonostante le risposte positive ancora non è stato inserito nel suo indice? possibile che nessuno sia in grado di capire come mai questo sito abbia subito queste penalizzazione? potrebbe essere sicuramente un caso di studio. Se avete anche solo qualche indizio, riposndete....Grazie


  • Super User

    Ciao Analogico,

    non è che per caso hai segnalato dal GWT di voler indicizzare solo il sito senza "www" ?

    I link con anchor text "segnalato da: Italia e Vacanza" dai vari hotel e strutture ricettive sono merito tuo? insomma sono precedenti alla messa online del blog oppure successivi?

    Il caso è particolare, anche se ho già visto compotarmenti simili in altre situazioni (sulle SERP di google news).

    Attendo tuoi dati,
    grazie, a presto. 😉
    Michele


  • Super User

    Ciao Analogico,

    non è che per caso hai segnalato dal GWT di voler indicizzare solo il sito senza "www" ?

    I link con anchor text "segnalato da: Italia e Vacanza" dai vari hotel e strutture ricettive sono merito tuo? insomma sono precedenti alla messa online del blog oppure successivi?

    Il caso è particolare, anche se ho già visto compotarmenti simili in altre situazioni (sulle SERP di google news).

    Attendo tuoi dati,
    grazie, a presto. 😉
    Michele


  • User

    ...grazie Michele.
    abbiamo segnalato entrambi sia con www che senza.
    I link sono opera nostra e naturalmente successivi alla messa on-line del blog, ne mettiamo mediamente uno a settimana anche se a questo punto penso non ne valga la pena.
    Fammi sapere, grazie!


  • Super User

    Ciao, prova a segnare esclusivamente col WWW.

    Conviene si fermare quell'attività di link building, perchè se effettivamente sei bannato c'è il rischio di compromettere la visibilità dei siti che ti linkano.


  • Super User

    Ciao, prova a segnare esclusivamente col WWW.

    Conviene si fermare quell'attività di link building, perchè se effettivamente sei bannato c'è il rischio di compromettere la visibilità dei siti che ti linkano.


  • User

    perchè google non dice il motivo del "ban"? quale altro tentativo potrei fare? L'hosting lo escludiamo?


  • Super User

    Google solitamente da indicazioni solo quando effettua un BAN e spedisce una mail automatica con le motivazioni a indirizzi classici (come: [email][email protected][/email], [email][email protected][/email], etc.).

    Non sempre spediscono queste email, certo è sempre bene avere una casella di posta (info@..) così si è sicuri di essere contattati.

    L'hostin è escluso esclusivamente (scusa il gioco di parole) perchè come hai già scritto lo hai già cambiato. Dai contrilli fatti l'attuale non presenta problematiche evidenti.