• Super User

    indicizzazione errata da parte di google della index

    Salve spammoni :D!
    Ho notato che google mi indicizza erroneamente le pagine:

    miosito.com
    e
    miosito.com/index.htm mettendo quest'ultima tra i risultati filtrati quando interrogo google con il comando "site:miosito.com"

    Questo mi accade, penso, perchè ultimamente sto usando i link relativi mentre non mi succedeva in passato quando usavo gli assoluti, almeno è l'unica discriminante correlata a tale faccenda.

    Cosa mi potete/sapete dire a tal proposito?
    :ciauz:


  • Super User

    @"micky" said:

    mettendo quest'ultima tra i risultati filtrati quando interrogo google con il comando "site:miosito.com"
    Pardon,
    che intendi per "risultati filtrati"?

    I casi sono due: o esce solo dominio.com/ o solo dominio.com/index.html, e ciò è ok.
    Oppure escono entrambi, e ciò non è OK, sintomo che il tuo linkaggio interno non è consistente.

    Puoi risolvere il tutto con htaccess (spero il tuo hosting lo permetta) e rivedendo il linking interno. Se ti serve ti posto il codice da inserire.

    Linkaggio assoluto o relativo (se corretto) non ha attinenza con quanto accaduto.

    Cordialmente,
    Stuart


  • User Attivo

    @micky said:

    Salve spammoni :D!
    Ho notato che google mi indicizza erroneamente le pagine:

    miosito.com
    e
    miosito.com/index.htm mettendo quest'ultima tra i risultati filtrati quando interrogo google con il comando "site:miosito.com"

    Questo mi accade, penso, perchè ultimamente sto usando i link relativi mentre non mi succedeva in passato quando usavo gli assoluti, almeno è l'unica discriminante correlata a tale faccenda.

    Cosa mi potete/sapete dire a tal proposito?
    :ciauz:

    abolisci dal tuo sito i link a index.html sostistituendoli con http: // www .tuosito .com e se possibile fai un redirect 301 tramite htaccess da chi accede a index.html facendoli puntare a -> /
    in questo modo il motore non conoscerà index.html e la homepage sarà unica.


  • Super User

    @Stuart said:

    Pardon,
    che intendi per "risultati filtrati"?

    Intendo risultati non mostrati direttamente da google:
    "Al fine di visualizzare i risultati più rilevanti, sono state omesse alcune voci molto simili alle X già visualizzate.
    In alternativa, è possibile ripetere la ricerca includendo i risultati omessi."

    Oppure escono entrambi, e ciò non è OK, sintomo che il tuo linkaggio interno non è consistente.

    ok infatti è questo il caso: ma in che senso non consistente? Sbaglierò anch'io ma è una specie di bag di google, perchè non ci vuole uno scienziato per capire di aggiustare algoritmicamente la cosa che si manifesta utilizzando i link relativi con dreamweaver ad esempio e penso con quasi tutti gli altri editor che automaticamente lincano la index.htm in un certo modo a seconda del livello in cui siamo.

    Puoi risolvere il tutto con htaccess (spero il tuo hosting lo permetta) e rivedendo il linking interno. Se ti serve ti posto il codice da inserire.

    con un 301? E comunque dopo aver aggiustato il linking interno? (non saprei nemmeno come tra l'altro...)
    Comunque si grazie :)!

    Linkaggio assoluto o relativo (se corretto) non ha attinenza con quanto accaduto.

    so che usi i link relativi, che editor utilizzi? Li scrivi a mano?

    @"Ellegi" said:

    abolisci dal tuo sito i link a index.html sostistituendoli con http: // www .tuosito .com e se possibile fai un redirect 301 tramite htaccess da chi accede a index.html facendoli puntare a -> /
    in questo modo il motore non conoscerà index.html e la homepage sarà unica.

    Perfetto, ma forse proprio quella soluzione di mischiare assoluti e relativi sarebbe relativa all'incongruenza di lincaggio di cui parlava Stuart (ne parlammo in un'altra discussione in cui intervenne anche Claudioweb).
    Quello che dico io: possibile che google non aggiusti algoritmicamente casi come questo che si verificano almeno a chiunque usi come editor il dreamwaever e i relativi?

    Grazie a tutti e due 🙂


  • User

    a me succede la stessa cosa con msn... ma non mi son posto il problema piiu' di tanto.. dato che compare solo con il comando site:www..


  • User Attivo

    @micky said:

    Perfetto, ma forse proprio quella soluzione di mischiare assoluti e relativi sarebbe relativa all'incongruenza di lincaggio di cui parlava Stuart (ne parlammo in un'altra discussione in cui intervenne anche Claudioweb).
    Quello che dico io: possibile che google non aggiusti algoritmicamente casi come questo che si verificano almeno a chiunque usi come editor il dreamwaever e i relativi?

    No, google non c'entra, lui ciò che vede quello indicizza, il motore non ha modo di sapere che http://www.tuosito.com e http://www.tuosito.com/index.html sono la stessa url, anche a livello di pagerank vengono trattate diversamente. Ora anche dreamweaver non ha colpe visto che è nato come strumento per creare pagine web quindi linka bene con il nome di pagina poichè non ha modo di sapere il tuo webserver come tratta la default page.
    Sta a te navigare sul sito, cercare una pagina che contenga la parola index.html e cambiarla in /

    Se mi dai il sito posso anche dare uno sguardo.


  • Super User

    @eLLeGi said:

    No, google non c'entra, lui ciò che vede quello indicizza, il motore non ha modo di sapere che http://www.tuosito.com e http://www.tuosito.com/index.html sono la stessa url, anche a livello di pagerank vengono trattate diversamente.

    In che senso non ha modo di vedere, se addirittura di default quando si linka la cartella cerca gerarchicamente le index.htm, html, php, asp ecc.?

    So che le tratta in modo diverso, ma è secondo me, nel caso specifico, un limite del motore.

    Ora anche dreamweaver non ha colpe visto che è nato come strumento per creare pagine web quindi linka bene con il nome di pagina poichè non ha modo di sapere il tuo webserver come tratta la default page.

    Già, forse è qua la chiave di tutto :).

    Sta a te navigare sul sito, cercare una pagina che contenga la parola index.html e cambiarla in /

    Se mi dai il sito posso anche dare uno sguardo.

    Grazie molto gentile ma è un sito vietato dal regolamento :D!


  • User Attivo

    @micky said:

    Grazie molto gentile ma è un sito vietato dal regolamento :D!

    ok, cmq se hai bisogno di aiuto scrivi in privato il sito.


  • Super User

    @eLLeGi said:

    abolisci dal tuo sito i link a index.html sostistituendoli con http: // www .tuosito .com

    Ma quindi, Ellegi, secondo te non ci sarebbe un problema di coerenza, ossia nell'usare nel sito sia link relativi (tutti) e sia assoluti (ogni qual volta che linco la index)?


  • User Attivo

    @micky said:

    Ma quindi, Ellegi, secondo te non ci sarebbe un problema di coerenza, ossia nell'usare nel sito sia link relativi (tutti) e sia assoluti (ogni qual volta che linco la index)?

    Non credo ma guarda che se temi qualcosa del genere puoi anche linkare la home in relativo omettendo il nome pagina risolvendo quindi i problemi di cui sopra.

    [html]
    <A HREF="/">homepage</A>
    [/html]

    🙂


  • User Attivo

    Ciao Micky, perchè hai questo problema dei link assoluti o relativi?
    Lo spider se ne frega bellamente, per lui sono sempre assoluti, anche se espressi con ../../../../../pagina.html

    Le fatiche di un seo (o di uno sviluppatore) per lui non sono una notizia. Tutto quello che avviene prima, le tecniche e gli stili di sviluppo e di costruzione delle pagine, non hanno rilevanza per il bot.
    Lui trova una URL (sempre assolutizzata, altrimenti non è una URL) e la segue.
    E' meglio non fargli trovare due URL per la stessa pagina per evitare che faccia casino.
    Se ha già fatto casino con degli alias è meglio che le URL siano assolute, ma solo per evitargli di navigare nel sito con un alias al posto del dominio canonico.

    Con dreamweaver fai un find & replace e riscrivi tutto quello che contiene /index.html con /, ovviamente controllando voce per voce la sostituzione in modo da non fare casino.

    Il 301 sulla homepage risolverebbe tutto in teoria, ma a volte crea problemi, mandando in loop la redirezione, dipende da come è settato il server.

    Ciao


  • Super User

    @pieropan said:

    Ciao Micky, perchè hai questo problema dei link assoluti o relativi?
    Lo spider se ne frega bellamente, per lui sono sempre assoluti, anche se espressi con ../../../../../pagina.html

    Le fatiche di un seo (o di uno sviluppatore) per lui non sono una notizia. Tutto quello che avviene prima, le tecniche e gli stili di sviluppo e di costruzione delle pagine, non hanno rilevanza per il bot.
    Lui trova una URL (sempre assolutizzata, altrimenti non è una URL) e la segue.

    Ciao pieropan :). In effetti quanto dici non fa una piega, per cui potrei anche mischiare assoluti e relativi senza che succeda nulla.