• User

    Indicizzate tutte le folder del sito

    Ciao a tutti, chiedo aiuto a voi guru del seo...
    Allora, vi racconto un po' la mia vicenda, l'altro giorno stavo spippolando un po' con Google WMtools, mi sono accorto che nella sezione "suggerimenti html" mi segnalava un centinaio di tag title duplicati...strano fino al giorno prima tutt'ok e di cambiamenti notevoli sul mio blog base wordpress, luxemozione.com, non ne faccio da diverso tempo:bho:
    Analizzando più accuratemente la questione mi sono accorto che gli url incriminati sono del tipo:

    /gaianorm/2009/10/
    /gaianorm/2009/10/?DD
    /gaianorm/2009/10/?MA
    /gaianorm/2009/10/?MD
    /gaianorm/2009/10/?ND
    /gaianorm/2009/10/?SA
    /gaianorm/2009/10/?SD

    cioè riferite alla folder in cui sono contenuti tutte le immagini e i file uploadati, in pratica google ha improvvisamente iniziato a far comparire nel suo indice tutta la struttura del mio blog , di fatto le pagine indicizzate sono passate in 24 ore da circa 600 a 1200 e poi giù a 800. Non capisco francamente perchè, ma sopratutto ma che cavolo sono ?DD ?MA ecc?
    C'entrano forse gli ultimi update dell'algoritmo di mr G?

    spero possiate aiutarmi:(
    grazie
    G.


  • User Attivo

    Ciao Gaianorm,

    il problema è il seguente:
    sul tuo server le directory hanno come impostazione di default la visualizzazione della lista dei file. Quindi se non inserisci una pagina di index tua, il server restituisce appunto la lista con titolo "index of ...", più la possibilità di indicare anche il tipo di ordinamento (?NA -> name, ?MD -> ultima modifica ecc....)

    Quindi il crawler di google navigando il link relativo alla directory determina anche gli altri link, e li naviga. Ognuna di queste pagine ha lo stesso titolo.

    Perché google ha cominciato a navigare la directory? Perché ha trovato da qualche parte un link che gli punta. Può essere sul tuo sito o su qualunque altro sito.

    Per risolvere il problema basta che inserisci un file index.htm con tag robot noindex

    Tra l'altro è sempre conveniente evitare che le directory possano essere navigate, sarebbe meglio impostarla già come situazione di default nel server (verrebbe restituito come errore 403).


  • User

    Ciao Dirioz
    dunque...a quanto pare le cose sembrano tornate alla normalità...ho dato un occhio a tutte le pagine indicizzate del mio blog e a quanto pare tutti gli url che puntavano alla lista dei files interni non ci sono più.
    Comunque sono anche riuscito ad impostare che le directory non vengano navigate, con restituzione di errore 403...
    domani indago con il manteiner per capire se hanno cambiato impostazioni di default.
    Grazie naturalmente, vi aggiorno se ci sono cambiamenti
    G.