• User

    Google Ban: qualcuno riesce a capire cosa non va nel mio sito?

    Salve a tutti... qualche giorno fa ho avuto una brutta sorpresa... accedendo al mio account SiteMap di google, mi son trovato scritto

    "Nessuna pagina del tuo sito è al momento inclusa nell'indice di Google perché non sono state rispettate le istruzioni per i webmaster."

    Ho letto qualche articolo a riguardo dei ban, ma non sono riuscito a fami un'idea precisa di quale possa essere il problema.
    Quindi provo a chiedere aiuto.
    Io ho fatto due ipotesi:

    1. nella mia home page http://www.fotovallescrivia.it sono presenti alcune parti "invisibili", tra cui un link a un contatore,e alcune frasi cmq attinenti al sito. E' possibile che per una sola pagina del genere io sia stato escluso dell'indice? (cmq provvederò a toglierle prima della richiesta di reinclusione)

    2)Stavo sperimentando un newsreader, che aveva creato delle cache di articoli news statci (.htm) in una directory del mio sito, che per qualche motivo è stata indicizzata da google.
    http://www.fotovallescrivia.it/public/cache/news/index.htm
    Sono pagine sicuramente poco "user-friendly", perchè stavo giusto facendo delle prove.. pensate che possano essere responsabili del ban?
    Devo anche dire, che prima questa cache (diverse migliaia di files) era in una posizione diversa.. possibile che google avesse ancora nella sua cache la copia delle mie pagine nella vecchia locazione, e che vedendone una copia sostanzialmente uguale nella nuova posizione, abbia pensato a una duplicazione volontaria?

    Spero che qualcuno sappia darmi qualche consiglio... grazie!


  • User Attivo

    direi che e' la prima...
    testo e link invisibili... sono spesso causa di ban


  • User

    Esaminando i sorgenti della tua homepage, sulla base della mia modestissima esperienza, direi che ci sono alcuni fattori "ambigui" che eliminerei:

    1. la presenza di praticamente tutti i tag META. Lascerei quelli essenziali DESCRIPTION tanto per iniziare e KEYWORDS. Anche se in quest'ultimo caso la presenza di tantissime key che non hanno un riferimento (leggi: occorrenza) all'interno della pagina potrebbe essere considerato "spammoso" da gg.
    2. mi suona molto strano il meta EXPIRES. Soprattutto messo a 0. Lo toglierei subito dato che vuol dire che quella pagina "scade immediatamente". Non so come la prenda gg, ma potrebbe essere un ottimo "ostacolo" al crawler.
    3. assenza di "testo" che possa essere considerato da gg un "buon contenuto"! Direi che la maggior parte della pagina è fatta di html + javascript e c'è pochissimo "contenuto". Metterei senz'altro più testo, con le parole chiave più importanti, per rendere sicuramente piu' digeribile la tua home.
    4. tutti i fattori di cui sopra e la presenza di due annunci gg in uno "spazio ristrettissimo" (AdSense non è infatti in grado di "capire" che tipo di adv mandare "in onda"... e visualizza annunci del tutto generici e fuori-contesto) , oltre (a mio parere) ad una strana struttura del sito (come mai la home page si trova in una directory di 3° livello? www. fotovallescrivia. it/ vscrivia/ pages/ main.aspx. Mi sembra un pò troppo "profonda".

    Naturalmente non so se questi sono i fattori che BLOCCANO il crawling del tuo sito, ma indubbiamente sono fattori degradanti dal punto di vista di un buon posizionamento. Farei qualche modifica tanto per stare piu' tranquillo!
    La presenza di un layer invisibile non credo sia dannoso, anche perchè ha una consistenza limitatissima rispetto all'intera pagina!

    Francesco


  • User

    Innanzi tutto vi ringrazio per l'interessamento..
    Ho eliminato le (poche) parola nascoste nella home page (www.fotovallescrivia.it, non ...main.aspx)

    Forse potrei eliminare il tag "Expires".. in raltà penso che sia equivalente a dire che non voglio che il browser metta la pagina nella cache.
    Il meta tag "GLOBAL" non so come ci sia finito... non so neanche cosa sia! Quindi potrei cestinarlo.
    Per quanto riguarda le keywords a dire il vero, a parte forse 5 o 6, sono tutte
    presenti nella pagina come testo almeno una volta. Cmq, si potrei eliminare
    ad es "photo" come keyword della pagina in italiano, e lasciarla per l'inglese.
    Cmq di testo javascript ce n'è poco.. solo il menu. Il resto è testo "normale",
    anche quello che "scrolla". Certo, il testo è poco... dovrei aggiungere un po' di contenuti 😛

    Ma in ogni caso fino a qualche giorno fa, ero sempre alle prime posizioni per le ricerche che mi
    interessavano, cioè per le ricerche delle foto della mia valle. E i google ads erano mediamente pertinenti,
    a parte uno ricorrente sulle vacanze in egitto, e uno sulla tossicodipendenza!

    Il fatto di avere la pagina "main" in una sub-sub-directory, è dato dalla necessità di avere una subdirectory
    per ogni applicazione web di ASP.NET (il sito, il contatore, il newsreader e poi chissà..),e poi per tenere
    separati i controlli ascx dalle pagine aspx, dalle librerie .cs, dai template, ecc, ho fatto delle subdirectory
    per ogni cosa. Dici che è penalizzante in termini i posizionamento una cosa del genere?

    Be, intanto procedo a eliminare un tag meta 😉


  • Super User

    @machiavellino said:

    Forse potrei eliminare il tag "Expires".. in raltà penso che sia equivalente a dire che non voglio che il browser metta la pagina nella cache.

    Il meta EXPIRES a "0" non vuol dire che è scaduto, ma vuol dire che non scade.
    Poi Google non lo calcola minimamente.

    Il meta KEYWORDS può influenzare averlo e può migliorare non averlo proprio.
    I testi nascosti insieme ai link dovresti toglierli in tutte le pagine e non solo nella home.

    Ormai sui link e testi nascosti Google riesce al 70% ad individuarli tutti e l'altro 30% siamo noi utenti a segnalarli.

    Bye :ciauz:


  • User

    @angelweb said:

    Il meta EXPIRES a "0" non vuol dire che è scaduto, ma vuol dire che non scade.
    Poi Google non lo calcola minimamente.

    Ottimo, avevo interpretato al contrario 😉

    @angelweb said:

    Il meta KEYWORDS può influenzare averlo e può migliorare non averlo proprio.
    I testi nascosti insieme ai link dovresti toglierli in tutte le pagine e non solo nella home.

    Si, le keywords non è che fossere scelte in modo ottimo.. però ero molto soddisfatto della posizione in cui comparivo nelel ricerche.

    Il testo nascosto c'era SOLO nella home, quindi l'ho tolto solo da li! Quindi anche secondo te il problema era quello... però, bannarmi solo per una pagina con 10 parole nascoste...
    Cmq, a porposito del ban, ho notato che il crawler continua a visitare il mio sito, e il page rank è ancora 3 per un po' di pagine. Facendo una ricerca site:www.fotovallescrivia.it non spunta fuori niente, ma dalla toolbar di google si riesce ad accedere alle pagine in cache del mio sito, alcune aggiornate al 2 dic ( e il presunto "ban" è partito il 31/11), quindi vuol dire che qualche attività di indicizzazione c'è nonostante dica che le mie pagine non sono momentaneamnte incluse nell'indice... boh, speriam bene!

    In ogni caso mi pare di capire che i doppioni di pagine delle news non fossero un motivo plausibile per bannarmi? (anche perchè in realtà non c'erano doppioni sul mio sito, solo nella cache di google.. infatti adesso se accedo a sitemap mi "avvisa" che non riesce a trovare 14300 pagine, esattamente quelle che avevo cancellato.. e si che non c'è una pagina che le linki, al momento.. boh).

    Beh, il testo nascosto l'ho eliminato, e farò la richiesta di reinclusione, affidandomi a san google 😛


  • Super User

    Il testo nascosto anche che ci fosse una solo parola è visto ormai per "fregare i motori" perciò non deve esserci.
    Poi se tu hai messo poche parole perchè non metterle visibili?' Cosa ti ruberà nello spazio della pagina ??
    Credo nulla...

    Il PR non viene annullato se vieni deindicizzato e cioè penalizzato, il BAN vero e proprio (quello che intendo io) è quello dove ti tolgono tutto ma proprio tutto dal PR, ai bl. Perciò è solo una penalizzazione per quella causa e vedrai che sistemando il tutto tornerai dov'eri e magari anche un pochino più in alto 😄

    Ciao


  • User Attivo

    elimina l'intro del sito, è priva di utilità, è priva di contenuto, ed è a rischio penalizzazione avendo degli annunci di adsense in una pagina vuota (adsense e tutti gli annunci PPC andrebbero inseriti in pagine con contenuti originali)

    fai diventare la root questa pagina: http://www.fotovallescrivia.it/vscrivia/pages/main.aspx

    ps: cambia server o piano di aruba, quello attuale è un vero chiodo.


  • User

    Ottima cosa che non mi abbia "cancellato" dall'indice... almeno non dovrò aspettare che ri-crawli tutte le mie pagine 😉
    Be, le cose nascoste le ho tolte,ho tolto qualche tag meta inutile, e magari potrei eliminare l'intro...
    Per eliminarla e portare direttamente a http://www.fotovallescrivia.it/vscrivia/pages/main.aspx , cosa consigliate? Di mettere una pagina di redirect fatta con javascript?(visto che ho letto che il redirect meta sarebbe da evitare...confermate?)

    ps: cambia server o piano di aruba, quello attuale è un vero chiodo.

    Si, ultimamemnte è scandalosamente lento, e infatti mi son lamentato.. ma mi han detto che non possono farci niente, che dipende dall'insieme di utenti che opera sul server su cui sono. Però c'è anche da dire che spendo solo24?/anno per dominio e hosting!Ma con i soldi di google ads ho visto che ci esce abbondantemente un server virtuale o non su aruba... sperando che sia più veloce (e almeno posso gestirmelo io.. il che non è detto sia un bene :P)


  • User Attivo

    @machiavellino said:

    Ottima cosa che non mi abbia "cancellato" dall'indice... almeno non dovrò aspettare che ri-crawli tutte le mie pagine 😉
    Be, le cose nascoste le ho tolte,ho tolto qualche tag meta inutile, e magari potrei eliminare l'intro...
    Per eliminarla e portare direttamente a http://www.fotovallescrivia.it/vscrivia/pages/main.aspx , cosa consigliate? Di mettere una pagina di redirect fatta con javascript?(visto che ho letto che il redirect meta sarebbe da evitare...confermate?)

    Si, ultimamemnte è scandalosamente lento, e infatti mi son lamentato.. ma mi han detto che non possono farci niente, che dipende dall'insieme di utenti che opera sul server su cui sono. Però c'è anche da dire che spendo solo24?/anno per dominio e hosting!Ma con i soldi di google ads ho visto che ci esce abbondantemente un server virtuale o non su aruba... sperando che sia più veloce (e almeno posso gestirmelo io.. il che non è detto sia un bene :P)

    non usare redirect.

    falla diventare la root


  • User

    @Matteo said:

    non usare redirect.

    falla diventare la root

    Mmm... si, magari sarebbe la souzione migliore, ma è inattuabile. L'unico modo per accedere al mio dominio è un indirizzo ftp, da cui non posso fare modifiche a dove punta il nome del dominio. Punta a una directory che è la root, e non posso cambiarla, posso solo aggiungere subdirectory. Se poi facessi diventare root (www.fotovallescrivia.it) una cartella (in questo caso /vscriva/pages/), e avessi (come ho) delle risorse (immagini, database, e altro) in cartelle di livello superiore (es /graph/, /public/,...), come potrei accedervi?:?

    Beh, cmq la cosa importante è che io venga reinserito...
    Tanto per cronaca:

    • il google bot continua a girare sulle mie pagine, ma sembra che abbia smesso di indicizzare le immagini (non ne ha più scaricate negli ultimi 6 giorni, nonostante io abbia aggiornato il sito con alcune nuove).
    • la sitemap vine scaricata periodicamente
    • site:www.fotovallescrivia.it continua a restituire 0 risultati
    • cache:www.fotovallescrivia.it/..unapagina restituisce in tutti i casi provati una pagina dalla cache di google.
    • qualche back link c'è ancora, anche se 2 o 3 sono spariti. Ci sono alcune pagine con PR 3-4 di altri domini, che linkano la mia home, ma che non compaiono tra i back link.. brutto segno?
    • ho mandato la richiesta di reiclusione... secondo voi devo aspettarmi una risposta, prima o poi, anche in caso di riufiuto, o devo aspettare e basta?

    Grazie per la pazienza 😉


  • Super User

    secondo me, dalla tua homepage dovresti eliminare il redirect javascript.


  • User Attivo

    Anche a me è accaduto la stessa cosa macchiavellino, solo che io non avevo testo nascosto. Ora ho rispedito la sitemap, vediamo che ne esce fuori!!!


  • User

    @must said:

    secondo me, dalla tua homepage dovresti eliminare il redirect javascript.

    Fatto! tanto non è che fosse indispensabile, e se è indiziato di aver causato problemi, sicuramente è meglio toglierlo!

    @vincenzino80 said:

    Anche a me è accaduto la stessa cosa macchiavellino, solo che io non avevo testo nascosto. Ora ho rispedito la sitemap, vediamo che ne esce fuori!!!

    Mal comune mezzo gaudio, si dice..:D
    La sitemap io la rispedisco tutte le volte che aggiorno il sito, e l'ho aggiornato 2 volte da quando sono stato "deindicizzato", ma ancora nulla.. (beh, son passati "solo" 6 giorni, un po' poco, immagino, per vedere effetti)
    Qual'è il dominio che ti è stato "deindicizzato"? Magari provo a guardarlo, e vedere se trovo qualche cosa che accomuna i nostri siti.. tipo giusto il redirect.. o simili...

    Una domanda che mi sono posto è: perchè se una pagina di un altro dominio, indicizzata e con un pageRank assegnato, ha un link al mio sito, questa pagina non sempre compare nei backlink del mio sito?(questo già prima del mio problema attuale). Ci sono almeno una decina di domini che hanno link al mio sito, ma solo 3/4 (sempre gli stessi) compaiono tra i backlink.:?


  • Super User

    @machiavellino said:

    Fatto! tanto non è che fosse indispensabile, e se è indiziato di aver causato problemi, sicuramente è meglio toglierlo!

    assolutamente si.

    Mal comune mezzo gaudio, si dice..:D

    a parte le discussioni sul proverbio che possono essere interessati ma andrebbero affrontate in altra sede, direi che il male é comune fino ad un certo punto.
    tu avevi testo nascosto e redirect js che ti hanno penalizzato. ma hai un sito tuo ed i motori di ricerca hanno interesse ad averlo nel loro indice (una volta ripulito da quelli che lui considera trucchi che violano le linee guida).
    vincenzino80 invece (se stiamo parlando dei siti che ha in firma) si limita fondamentalmente ad assemblare in una o piú pagine un insieme di banner, senza aggiungere un briciolo di contenuto suo. e quindi il motore di ricerca non ha proprio alcun interesse a tenerlo nel suo indice. e cmq, restando ai siti in signature, non risultano bannati.

    Una domanda che mi sono posto è: perchè se una pagina di un altro dominio, indicizzata e con un pageRank assegnato, ha un link al mio sito, questa pagina non sempre compare nei backlink del mio sito?(questo già prima del mio problema attuale). Ci sono almeno una decina di domini che hanno link al mio sito, ma solo 3/4 (sempre gli stessi) compaiono tra i backlink.:?

    discussione trita e ritrita su questo forum. in estrema sintesi: google mostra solo una parte dei link che trova. per approfondimenti, cerca nel forum 🙂
    :ciauz:


  • User Attivo

    @must said:

    vincenzino80 invece (se stiamo parlando dei siti che ha in firma) si limita fondamentalmente ad assemblare in una o piú pagine un insieme di banner, senza aggiungere un briciolo di contenuto suo. e quindi il motore di ricerca non ha proprio alcun interesse a tenerlo nel suo indice. e cmq, restando ai siti in signature, non risultano bannati.
    :ciauz:

    mai parole furono piu gradite 😄


  • User

    🙂 🙂 🙂 🙂
    Reindicizzatoooooo!!!Compaio su google con tutte le mie belle 4370 pagine 😄
    http://www.google.com/search?q=site:www.fotovallescrivia.it&hl=it

    Adesso invece che nei primi posti, compaio pure AL PRIMO posto in tutte le ricerche che mi interessano!Meglio di così :vaiii:

    Speriamo che la cosa sia stabile!

    Un ringraziemento a tutti per gli utilissimi consigli 😉

    :ciauz:


  • Super User

    @machiavellino said:

    🙂 🙂 🙂 🙂
    Reindicizzatoooooo!!!Compaio su google con tutte le mie belle 4370 pagine 😄
    http://www.google.com/search?q=site:www.fotovallescrivia.it&hl=it

    Adesso invece che nei primi posti, compaio pure AL PRIMO posto in tutte le ricerche che mi interessano!Meglio di così :vaiii:

    Speriamo che la cosa sia stabile!

    Un ringraziemento a tutti per gli utilissimi consigli 😉

    :ciauz:

    Ok!!!

    però non hai tolto il meta KEYWORDS che potrebbe farti scendere per le key inserite. Non dimenticarlo!!


  • User

    @angelweb said:

    Ok!!!

    però non hai tolto il meta KEYWORDS che potrebbe farti scendere per le key inserite. Non dimenticarlo!!

    Si, grazie per avermelo ricordato, ma in realtà stavo cercando di informarmi a riguardo...
    Tu pensi che sia meglio non avere di key, piuttosto che averle, o per lo meno, più specificatamente, nel mio caso, sarebbe meglio?
    Questo perchè, data la scarsità di testo nel mio sito, le chiavi hanno poco "peso", o è una cosa generale?
    POtrei provare a fare qualche prova, togliere le chiavi da un po' di apgine, e vedere se si posizionamo melgio delle altre...:?


  • Super User

    @machiavellino said:

    Si, grazie per avermelo ricordato, ma in realtà stavo cercando di informarmi a riguardo...
    Tu pensi che sia meglio non avere di key, piuttosto che averle, o per lo meno, più specificatamente, nel mio caso, sarebbe meglio?
    Questo perchè, data la scarsità di testo nel mio sito, le chiavi hanno poco "peso", o è una cosa generale?
    POtrei provare a fare qualche prova, togliere le chiavi da un po' di apgine, e vedere se si posizionamo melgio delle altre...:?

    Allora ti spiego: Google il meta keywords non lo legge più e da quello che ho visto averlo inserito porta solo svantaggi per le chiavi inserite.
    Già ne abbiamo parlato molte volte di questo meta.
    Prova a fare una verifica da solo cosi lo noterai anche tu 😉

    :ciauz: