+ Rispondi alla Discussione
Risultati da 1 a 11 di 11

Verificare quante pagine ha un sito per confrontarle con il numero di pag indicizzate

Ultimo Messaggio di Misia il:
  1. #1
    User
    Data Registrazione
    Jan 2013
    Localit
    Milano
    Messaggi
    120

    Verificare quante pagine ha un sito per confrontarle con il numero di pag indicizzate

    Ciao a tutti.
    Mi occorrerebbe sapere quali sono le pagine effettive di cui composto un sito: quelle indicizzate su Google sono decisamente troppe e vorrei capire se la mia valutazione corretta in modo da impostare eventualmente un rel canonical dove necessario.
    Sto provando con xenu , volevo fargli scansionare solo gli url della sitemap ma dev'essere stata inibita la possibilit di seguire la sitemap, perch non la legge.
    Come faccio per vedere solo le pagine effettive di cui composto il sito, quali filtri devo impostare su xenu (non potendo seguire gli url della sitemap)? Xenu, coem sapete, mi mostra di tutto: immagini, link in uscita ecc ecc.

    Grazie a tutti, buona serata .

  2. #2
    User
    Data Registrazione
    Jan 2013
    Localit
    Milano
    Messaggi
    120
    Citazione Originariamente Scritto da Misia Visualizza Messaggio
    [...]
    Ho appena notato che accanto a ogni url c' la colonna type: e tra i tipi di url c' "text/html". Devo considerare pagine effettiva del sito solo quelle text/html?
    Grazie ancora.
    Ultima modifica di LaBussola; 06-04-13 alle 12:35 Motivo: Rimosso quote inutile. Maiuscole.

  3. #3
    Moderatore
    Data Registrazione
    Oct 2009
    Messaggi
    1,279
    Ciao Misia.

    Xenu pu produrre una Sitemap, ma non le legge.
    Una cosa che puoi fare per eseguire comunque un test aprire la tua Sitemap con un editor testuale e fare un "trova e sostituisci" delle stringhe "<loc>" e "</loc>" inserendo al loro posto degli spazi. In questa maniera nella tua Sitemap si creeranno righe composte solamente da un URL (oltre a righe inutili ai fini dell'analisi). A questo punto vai su Xenu, "File" -> "Check URL list" e carichi il tuo file modificato: il programma legge come URL sbagliati tutte le righe nelle quali rimasto dell'XML ma controlla tutti gli URL della Sitemap. Diciamo che non particolarmente efficace ed elegante come soluzione.

    Non conosco bene le tue esigenze, ma solitamente non testando la Sitemap che si trovano URL duplicati; al pi si trovano errori nella Sitemap. Quello che puoi fare, invece, far partire una scansione di Xenu dalla home page. Mano a mano che la scansione procede, tieni il report di Xenu ordinato per URL e lo osservi: in questa maniera capisci subito se il crawler trova serie di URL sulle quali inserire il canonical. Al termine dell'analisi, inoltre, puoi ordinare il report per title e vedere se vi sono ulteriori duplicazioni.

    Per inibire la verifica dei link esterni al sito, puoi togleire la spunta alla voce "Check external links" sotto al campo di inserimento dell'URL.
    Riguardo la tua domanda sulla voce "text/html", invece, la mia risposta : non hai immagini o pdf sul sito che vorresti fossero indicizate? La duplicazione, poi, non c' solo per i file HTML, ma possono venire aggiunti parametri impropri anche alle immagini o ai Javascript.

    Provo a darti anche tre consigli, sperando che ti possano essere utili:
    1) Per la duplicazione interna guarda anche la scheda "Miglioramenti HTML" degli Strumenti per Webmaster di Google.
    2) Il canonical fa sempre bene, se implementato correttamente. Non puoi mai sapere come il tuo sito viene linkato dall'esterno.
    3) Xenu un ottimo programma, ma non viene sviluppato da molto n vi sono prospettive di sviluppo imminenti. Se ti interessano tool di questo tipo di consiglio di provare Screaming Frog (a pagamento se vuoi analizzare pi di 500 URL) e l'italiano Visual SEO Studio (ancora in beta e quindi gratuito).

    Spero di esserti stato d'aiuto e di essere stato abbastanza chiaro, in caso contrario resto a disposizione.

    Buon lavoro ed a presto,
    Marco.

  4. #4
    User
    Data Registrazione
    Jun 2010
    Messaggi
    65
    Quelle indicizzate da Google ti basta site: nome sito.
    Ultima modifica di LaBussola; 07-04-13 alle 13:35 Motivo: Maiuscola e punto.

  5. #5
    User
    Data Registrazione
    Jun 2010
    Messaggi
    65
    Google non legge solo la sitemaps ma scansiona anche il sito.
    Ultima modifica di LaBussola; 07-04-13 alle 13:36 Motivo: Maiuscola e punto.

  6. #6
    User
    Data Registrazione
    Jan 2013
    Localit
    Milano
    Messaggi
    120
    Citazione Originariamente Scritto da LaBussola Visualizza Messaggio
    Ciao Misia.

    Spero di esserti stato d'aiuto e di essere stato abbastanza chiaro, in caso contrario resto a disposizione.

    Buon lavoro ed a presto,
    Marco.
    Sei stato chiarissimo, certamente queste dritte mi torneranno utili.
    Ma io non son stata altrettando brava a spiegare la mia esigenza.
    Le pagine indicizzate da Google del sito che gestisco sono 9500 e so per certo che non ne ha cos tante.
    Per individuare i contenuti duplicati utilizzer le tecniche che mi hai inicato, tuttavia per capire la dimensione del problema vorrei capire quante sono le pagine effettive del sito (anche perch una info che mi ha chiesto il cliente e devo fornirgliela).
    Si si , lo so che non si individuano attraverso la sitemap i contenuti duplicati, e che pdf e immagini sono importantii ...
    E' solo una info di cui ho bisogno insomma . Va bene contare le pagine text/html, oppure meglio il metodo che mi hai suggerito tu? (quello del <loc>)?
    thanx a lot.
    Buon lavoro a te!
    A presto
    Ultima modifica di Misia; 08-04-13 alle 19:21

  7. #7
    User
    Data Registrazione
    Jan 2013
    Localit
    Milano
    Messaggi
    120
    Citazione Originariamente Scritto da cworld Visualizza Messaggio
    Quelle indicizzate da Google ti basta site: nome sito.
    Cworl,
    grazie lo stesso per la risposta , ma ho bisogno di sapere il numero di pagine effettive del sito, non il numero di pagine indicizzate da google.
    thanx

  8. #8
    Moderatore
    Data Registrazione
    Oct 2009
    Messaggi
    1,279
    Ciao Misia.

    Se il tuo cliente vuole sapere quante pagine ha il sito escludendo immagini, pdf e via dicendo allora puoi contare solamente le pagine etichettate con "text/html".

    Ti ricordo che il numero pu essere impreciso per 2 ragioni:
    1) Hai pagine sul sito che non sono raggiungibili navigando. In questo caso Xenu, partendo dalla prima pagina, non riesce ad arrivare al contenuto. Il risultato che al tuo totale mancheranno pagine.
    2) Hai problemi di duplicazione interna. Esempio banale: la tua home raggiungibile sia con l'URL sito.com che con l'URL sito.com/index.html . In questa situazione Xenu conta due URL differenti ma probabilmente per il tuo cliente si tratta della stessa pagina.

    Il metodo che ti ho suggerito io con il <loc> utile per verificare la correttezza della Sitemap, non necessariamente per contare di quante pagine composto il sito.

    Resto a disposizione per ulteriori chiarimenti.

    Buon lavoro,
    Marco.

  9. #9
    User
    Data Registrazione
    Jan 2013
    Localit
    Milano
    Messaggi
    120
    Citazione Originariamente Scritto da LaBussola Visualizza Messaggio
    ...
    Ah, interessante, grazie mille.
    Scusa se approfondisco ancora:
    quando dici che il metodo con il <loc> utile per verificare la correttezza della Sitemap, cosa intendi esattamente? Corretta da che punto di vista? Nel senso di completezza delle pagine inserite (tutte quelle del sito)?
    Grazie mille.
    Ultima modifica di LaBussola; 09-04-13 alle 21:50 Motivo: Rimosso quote inutile.

  10. #10
    Moderatore
    Data Registrazione
    Oct 2009
    Messaggi
    1,279
    Ciao Misia.

    Con il "metodo <loc>" verifichi tutti e solo gli URL della Sitemap. Cos facendo non puoi sapere se hai inserito tutte le pagine del sito, tuttavia puoi sapere se gli URL che hai inserito restituiscono tutti un 200 e non un 301 o un 404.
    Ordinando per title i vari risultati, inoltre, puoi vedere velocemente se hai title duplicati in Sitemap.
    Ancora: dalla colonna "in links" puoi vedere se in Sitemap hai pagine orfane, ossia pagine che non ricevono link in ingresso dal resto del sito ed anche questo, tipicamente, un errore.

    Se hai ancora bisogno sono a disposizione.

    Buon lavoro ed a presto,
    Marco.

  11. #11
    User
    Data Registrazione
    Jan 2013
    Localit
    Milano
    Messaggi
    120
    Citazione Originariamente Scritto da LaBussola Visualizza Messaggio
    [...]
    Ancora grazie. Se dovessi avere bisogno mi rifar viva, a buon rendere naturalmente.

    Grazie.
    Ultima modifica di LaBussola; 10-04-13 alle 16:10 Motivo: Rimosso quote inutile.

+ Rispondi alla Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] Attivato
  • Il codice [VIDEO] Attivato
  • Il codice HTML Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.