• Moderatore

    Il problema degli url troncati

    Non ho trovato nulla al riguardo, eppure è un problema che ho da un po' di tempo... 😞

    Fra gli errori di scansione nel GWT, trovo dei link "troncati" provenienti da siti esterni, quindi non sempre posso correggerli.

    Faccio un esempio per essere più chiaro.
    Ho un url a questa maniera: miosito.com/cartella/pippo.html
    Sul GWT trovo degli errori 404 come questi:
    [] cartella
    [] cartella/
    [] cartella/pip..
    [] cartella/pippo

    Come faccio a risolverli?

    P.S.
    Da tener presente che ho anche sottocartella di nome 'pippo'


  • Moderatore

    Nessun altro ha il mio stesso problema? 😞


  • User Attivo

    Eccomi, stavo giusto per aprire lo stesso post! 😄
    Ho lo stesso problema, nel mio caso sul GWT ho url troncati che terminano con due punti, esempio:
    miosito/pagin..
    miosito/cartella/pag..
    ecc....
    Sono gli unici errori 404 che non sono riuscito a gestire (il mio sito è su hosting Windows e con IIS sembra non si riescano a gestire gli url che terminano con un punto).
    Negli altri casi che segnali es:
    [] cartella
    [] cartella/
    [] cartella/pippo

    dovresti usare le pagine di errore personalizzate, su IIS è semplice, se usi Apache non so come si faccia ma credo ci sia materiale in abbondanza in rete, ciao! 🙂
    P.S. Casi come questo (cartella/pippo) dovrebbero restituire l'errore 403 (accesso negato).


  • Moderatore

    Ciao artistic101,
    ok per le pagine di errore personalizzate: sono una possibile soluzione.

    Però dei redirect agli url corretti sarebbero megliori. 😉
    Quei link provengono da siti esterni... è un peccano non sfruttarli...
    Il problema è: come fare i redirect?

    P.S. Casi come questo (cartella/pippo) dovrebbero restituire l'errore 403 (accesso negato).
    Si, hai ragione. Danno errore 403.


  • User Attivo

    Non capisco, il problema è come fare a capire su quale url fare il redirect o proprio la tecnica del redirect? Con un httphandler puoi intercettare la url richiesta e a quel punto puoi "analizzare" la richiesta e fare il redirect dove vuoi 🙂


  • Moderatore

    Vorrei sapere la tecnica del redirect.
    Sono su Apache, quindi nada httphandler... 😞


  • User Attivo

    Acc mi era sfuggita la risposta, purtoppo non so aiutarti in quanto ho sempre lavorato su IIS e mai su Apache, mi sembra però che ci sia molto materiale in giro per la urlrewrite su Apache. 🙂


  • Moderatore

    Ritorno dopo un anno per sapere se qualcuno può aiutarmi. 😉

    Ora ho anche segnalati degli url con degli asterischi:
    anziché ww w.sito.it/nomedellapagina.html
    ho ww w.sito.it/nom****ina.html


  • Moderatore

    Dopo un altro anno 😉 riprovo a chiedervi se qualcuno si è imbattuto nel mio stesso problema.
    Quindi se e come ha risolto.

    Io ho rifatto qualche ricerca sul web (anche in inglese), ma non ho trovato nulla. 😞


  • Moderatore

    Ciao lazzo85,

    @lazzo85 said:

    Dopo un altro anno 😉 riprovo a chiedervi se qualcuno si è imbattuto nel mio stesso problema.
    Tutte le volte ho trovato link di quel tipo, con URL troncati, in realtà non erano affatto link attivi. Erano URL scritti nell'HTML e abbreviati.

    Googlebot è noto per esplorare URL trovati in chiaro nell'HTML nella speranza di trovare risorse nuove, assumendo il webmaster possa essersi sbagliato nel creare il link.
    Di solito sono mini-motori di ricerca verticali che espongono le proprie SERP senza noindex, o siti con servizi opinabili che censiscono l'installato di chi ha installato senza saperlo certe toolbar, o ancora siti con contenuti scraped, o vari analizzatori di siti web (pseudo-seo, pseudo valorizzazione economica, pseudo stima di traffico, etc...).

    Puoi verificare da GWT se i tuoi 404 ricadono nel caso illustrato, cliccando sul dettaglio dell'errore 404 e selezionando la tab "Con link da" per vedere dove Google ha trovato gli URL, ed esaminarne le pagine di provenienza.
    Qualora fossero come ipotizzato veramente URL privi di link, non ci sarebbe alcun "link juice" da salvare (e in alcuni casi la provenienza potrebbe essere discutibile).

    Spero d'esserti stato utile


  • Moderatore

    Grazie Federico, hai fatto un ottimo riepilogo a cui (non con la tua stessa chiarezza 😉 ) ero arrivato anche io.

    Quindi, secondo te quegli errori posso tranquillamente contrassegnarli come corretti?


  • Moderatore

    @lazzo85 said:

    Quindi, secondo te quegli errori posso tranquillamente contrassegnarli come corretti?
    Io l'ho fatto 🙂