• User

    Googlebot passa ma non indicizza niente...

    Salve, dopo aver passato ore a leggere il forum credo che la cosa migliore sia postare un nuovo topic...
    Ho registrato un dominio .com l'8 maggio. Il sito è online dal 9. Tutti i giorni ho cercato di incrementare i BL segnalando il sito su tutti i siti di directory e vari che avevate postato qui http://www.giorgiotave.it/forum/viewtopic.php?t=7284
    Poi ho letto questa discussione http://www.giorgiotave.it/forum/viewtopic.php?t=9809&postdays=0&postorder=asc&highlight=google+indicizza&start=0 dove si diceva che lo scambio link era controproducente in molti casi...Il mio sito è anche registrato con la Sitemaps di google e li mi dici che è tutto ok, compreso il robot.txt...
    Ora io mi trovo il googlebot che in 10 giorni è passato 7 volte ma ha sempre visionato solo la home (è un blog in wordpress e questa credo sia la spiegazione) e mi indicizza solo parzialmente. Infatti solo se scrivo site:miosito.com mi trova...tutto questo è normale? Cioè, è normale che il bot di google passi così spesso ma non mi indicizzi? Non sò veramente + che pensare. Msn mi ha già indicizzato...help please!


  • User Attivo

    Salve,

    se per indicizzare intendi tutte le pagine interne del blog, dovresti attendere perchè Google indicizza inizialmente la home e dopo un Tot di tempo se valide anche le pagine interne.

    Per quanto riguarda lo scambio link, negativo non lo è al 100%, è positivo ma non quanto un link in entrata senza controlink.
    Ad un link diretto in entrata darei 10/10 e ad uno scambio link (se a tema e se con popolarità adeguata) 4/10.


  • User

    Il problema è che indicizza parzialmente la prima pagina e le altre per niente! Cosa devo fare? Sto fondendo...ho letto decine e decine di topic su questo forum ma niente di specifico...il punto è: se googlebot passa, più volte, sitemaps mi dice che non ci sono errori di nessun genere, è un sito in wordpress e quindi da quanto ho letto molto veloce ad esser indicizzato...perchè non stò nell'indice di google? E' un sito su una band emergente quindi non sussiste il problema di ban o contenuto inadeguato...Non sò che pensare :bho:


  • User Attivo

    Cosa intendi con "Indicizza PARZIALMENTE la prima pagina" ? Se ci dai l'indirizzo del blog potremmo essere piu' specifici.


  • Super User

    @webbs said:

    Cosa intendi con "Indicizza PARZIALMENTE la prima pagina" ?

    Forse vuole dire che lo spider non carica tutta la pagina dal server, ma solo un "pezzetto". Comunque, guardando i log sul server, capità spesso di vedere questo tipo di attività (confronta la quantità prelevata con l'effetiva grandezza in byte del documento)


  • Super User

    L'ultima volta che mi è capitato di fare un test con una pagina di grandi dimensioni, ho rilevato che Google aveva indicizzato solo i primi 100 Kbyte del documento HTML. Come l'ho capito? Semplicissimo: basta prendere la copia cache della pagina (togliendo l'header aggiunto da Google) e salvarla in locale. Ricordo che erano 100 KB esatti.


  • Super User

    ArkaneFactors: ...basta prendere la copia cache della pagina ...

    La pagina cache non necessariamente deve corrispondere alla versione indicizzata. Però da l'idea di questo tipo di attività. Forse un insegnamento può essere quello di creare pagine più leggere, o per lo meno di portare i "contenuti strategici" nel top.


  • Super User

    @Serp said:

    La pagina cache non necessariamente deve corrispondere alla versione indicizzata.
    Sì, hai ragione. Però, se non ricordo male, avevo anche verificato che i contenuti mancanti nella copia cache (nella quale il documento HTML appariva troncato) non erano stati indicizzati.

    Ad ogni modo, è un test piuttosto facile da ripetere: basta trovare una pagina molto grande indicizzata su Google e fare qualche verifica. Vedo se riesco.


  • Super User

    Come non detto: ho appena trovato una [url=http://216.239.59.104/search?q=cache:K9lZtaJvj-wJ:caml.inria.fr/distrib/ocaml-3.07/ocaml-3.07-refman.html+inanchor:%22huge+html+page%22&hl=it&gl=it&ct=clnk&cd=1]pagina di 881 KB nella cache di google. Forse qualcosa è cambiato dal mio ultimo test. :lol:

    <added>Ho aperto un [url=http://www.giorgiotave.it/forum/viewtopic.php?t=11351]topic.</added>


  • User Attivo

    A volte prende a metà anche pagina inferiori ai 100kb...il motivo non l'ho ancora capito.


  • Super User

    @delargester said:

    Cioè, è normale che il bot di google passi così spesso ma non mi indicizzi?

    Sì, è normale. Continua ad acquisire backlink di qualità e pian piano Googlebot sarà disposto ad indicizzare anche le altre pagine del tuo sito.


  • User

    I backlink di qualità per un sito amatoriale sono merce rara...comunque per "indicizza parzialmente" intendo dire che google non salva la mia pagina nel database ma tra i siti da indicizzare, in una sorta di lista d'attesa. Infatti se provo a cercare site:dominio lo trova. Però non mi dà nè info sulla pagina nè ha preso le key della stessa. Se infatti cerco soul of the cave staccato non trova nulla. Ma è possibile che ci metta tutto questo tempo? O ho sbagliato qualcosa io? Non avendo pagine in html ma bensì in php mi è + difficile capire cosa possa essere di aiuto per l'indicizzazione. Le key e la descrizione nell'output html si vedono...abbiate pazienza, sono un webmaster alle prime armi e quesiti stupidi come questi per me sono ostacoli non da poco in questo momento...e se non ci fossero forum e utenti disponibili come voi sarebbe assai improbabile che le persone per solo diletto si avvicinino al mondo del web dal lato server! Se avete tempo comunque il sito è souTOGLIEREloftTOGLIEREhecave.com. Grazie comunque.


  • Super User

    @delargester said:

    Però non mi dà nè info sulla pagina nè ha preso le key della stessa.

    Significa che ha trovato uno o più link che puntano al tuo sito, ma che a) non ha ancora inviato lo spider a scaricare la home oppure b) ha scaricato la home ma non ha ancora inserito i suoi contenuti nel suo indice.

    Se ci troviamo di fronte al caso a), non puoi fare altro che incrementare i backlink ed attendere.

    Se si trattasse del caso b), allora dovresti vedere indicizzata la home entro 48 ore.

    Ma è possibile che ci metta tutto questo tempo?

    Sì. Google non indicizza quello che vuoi tu, indicizza quello che ritiene gli convenga di più. E per decidere quello che gli conviene e quello che non gli conviene, si basa sulla qualità dei backlink che il sito riceve.

    Il New York Times parla del tuo sito e pubblica un link? Indicizzazione veloce.

    Gli unici link che hai sono scambi link e qualche directory minore? Ci vuole più tempo.

    O ho sbagliato qualcosa io?

    Non hai sbagliato nulla. Ci sono semplicemente 75.000 nuovi blog che nascono ogni santissimo giorno ([url=http://technorati.com/weblog/2006/04/96.html]fonte: Technorati), e bisogna dare a Google un buon motivo per indicizzare il tuo prima degli altri.


  • Super User

    @LowLevel said:

    ... bisogna dare a Google un buon motivo per indicizzare il tuo prima degli altri.

    Concordo. Tuttavia credo che il problema sia da ricondurre al problema che si è manifestato in questo ultimo tempo nelle infrastrutture tecniche: penuria di memorie di massa, problemi di personale, nuovi DC consegnati in ritardo.


  • User

    Ho controllato bene e posso dire che non mi trovo nè nella condizione a), infatti lo spider di google è passato e continua a passare pur senza seguire i link, nè nella b) perchè sono passate ben + di 48 ore e spesso è capitato che mi toglievano dalla cache per poi rimettermici dopo qualche ora. Spero di avere presto buone nuove dal grande G...

    Edit: nella cache è presente una pagina da 1kb vuota! Questo sarà un indizio?


  • Super User

    @Serp said:

    problema che si è manifestato in questo ultimo tempo nelle infrastrutture tecniche: penuria di memorie di massa, problemi di personale, nuovi DC consegnati in ritardo.
    Fonte?


  • User Attivo

    @delargester said:

    Ho controllato bene e posso dire che non mi trovo nè nella condizione a), infatti lo spider di google è passato e continua a passare pur senza seguire i link, nè nella b) perchè sono passate ben + di 48 ore e spesso è capitato che mi toglievano dalla cache per poi rimettermici dopo qualche ora. Spero di avere presto buone nuove dal grande G...

    Edit: nella cache è presente una pagina da 1kb vuota! Questo sarà un indizio?

    Per capire quando passa lo spider di google dove devo andare a vedere? ()
    Hmm... sì devo andare alla Google Sitemap mi sa... :sbav:


  • Super User

    ArkaneFactors: Fonte?

    :pipi:


  • Super User

    @Serp said:

    ArkaneFactors: Fonte?

    :pipi:
    Come dobbiamo interpretare la simpatica faccina?

    • no comment (sono fatti miei).
    • me l'ha confidato il mio amico Vermut.
    • l'ho letto sul blog di Jeremy Zawodny.
    • ... [diccci tu]

  • Super User

    ArkaneFactors:* Come dobbiamo interpretare la simpatica faccina? ...*

    La seconda che hai detto (credevo che fosse scontato)
    :ciauz: