+ Rispondi alla Discussione
Risultati da 1 a 15 di 15

Cerco tool per individuare contenuti duplicati

Ultimo Messaggio di bra_mik il:
  1. #1
    User
    Data Registrazione
    Feb 2014
    LocalitÓ
    Torino
    Messaggi
    142

    Cerco tool per individuare contenuti duplicati

    Ciao, ho un sito con parecchie migliaia di pagine create dinamicamente con contenuti duplicati (o meglio molto simili) da rimuovere.

    In realtÓ le pagine sono dei risultati di ricerca del tipo:

    /cerca/?q=query
    /cerca/?q=query-simile

    Non posso mettere un nofollow a tutto perchŔ nel mezzo ci sono contenuti buoni, vorrei solo eliminare tutti i duplicati che sono stati indicizzati.

    Esiste un tool in grado di individuare le pagine duplicate presenti nell'indice di google?

    Grazie.



    Tipo:
    Altri

  2. #2
    Moderatore L'avatar di Lorenzosa
    Data Registrazione
    Jan 2011
    LocalitÓ
    Jesi
    Messaggi
    363
    Ciao kungfu e benvenuto in forum GT


    mi viene da proporti questa prova:

    copi una parte del testo che credi duplicato lo metti tra "" e fai una ricerca su google

  3. #3
    User
    Data Registrazione
    Feb 2014
    LocalitÓ
    Torino
    Messaggi
    142
    Ciao Lorenzosa,

    faccio giÓ qualcosa del genere: site:miosito.it intitle: parolachiave

    funziona abbastanza bene, ma quando ci sono un centinaia di parole da testare un tool automatico farebbe comodo.

  4. #4
    Moderatore L'avatar di Lorenzosa
    Data Registrazione
    Jan 2011
    LocalitÓ
    Jesi
    Messaggi
    363
    Allora, site:miosito.it intitle: parolachiave cosý trovi la parolachiave solo nel titolo (credevo parlassi di contenuto)

    Se ho capito male e si tratta del titolo ti suggerisco il webmaster tool Miglioramenti html ,oppure puoi provare anche
    site:miosito.it intext: "parolachiave"

  5. #5
    User
    Data Registrazione
    Feb 2014
    LocalitÓ
    Torino
    Messaggi
    142
    Si, trovo la parola chiave solo nel titolo, ma da come sono organizzate le pagine riesco a capire (quasi sempre) se il contenuto Ŕ troppo simile.

    Sto provando anche con intext, in effetti anche cosý ne trovo parecchie pagine da togliere.

    Per ora vedo di eliminarne almeno una 50ina al giorno, sperando che serva a qualcosa....

    Tutte le pagine della directory dove ci sono queste pagine sono scomparse dai primi risultati di google, voglio vedere se a furia di togliere duplicati qualche pagina torna su.

  6. #6
    Moderatore L'avatar di Lorenzosa
    Data Registrazione
    Jan 2011
    LocalitÓ
    Jesi
    Messaggi
    363
    Usi un CMS?

  7. #7
    User
    Data Registrazione
    Feb 2014
    LocalitÓ
    Torino
    Messaggi
    142
    meglio il Canonical che il noindex
    Ultima modifica di Lorenzosa; 28-02-14 alle 19:25

  8. #8
    Esperto
    Data Registrazione
    Oct 2006
    LocalitÓ
    Bari
    Messaggi
    1,030
    Segui Danilo Chiantia su Twitter Aggiungi Danilo Chiantia su Google+ Aggiungi Danilo Chiantia su Facebook Aggiungi Danilo Chiantia su Linkedin
    Anche io credo che sia molto meglio il canonical del NOINDEX.

    Per quanto riguara i tool, invece, io ti consiglio Siteliner.com ed un check completo completo con Seositecheckup.com

    ps: copyscape qui lo do per scontato, ok?
    Ultima modifica di Danilo Chiantia; 01-03-14 alle 10:48 Motivo: dimenticanza....
    Danilo Chiantia Web Marketing Specialist

  9. #9
    User
    Data Registrazione
    Feb 2014
    LocalitÓ
    Torino
    Messaggi
    142
    Per quanto riguarda il canonical: ci sono parecchie pagine con elenchi di prodotti di che non mi interessa pi¨ far apparire nel motore, in questo caso avrebbe un senso indirizzare il canonical verso una pagina con prodotti completamente differenti? Oppure verso la home della sezione?

    In questi casi non sarebbe meglio un noindex?

    Anche se inizio a sospettare che il motore non veda bene improvvise sparizioni di migliaia di pagine di colpo.

  10. #10
    User
    Data Registrazione
    Feb 2014
    LocalitÓ
    Torino
    Messaggi
    142
    Danilo copyscape in questo caso credo non centri molto.

    Invece gli altri due che hai segnalato mi sembrano interessanti! faro qualche test. Secondo te riescono ad analizzare un sito da circa 30000 pagine?

  11. #11
    Utente Premium L'avatar di makkis001
    Data Registrazione
    Mar 2013
    LocalitÓ
    roma
    Messaggi
    671
    siteliner (la versione "onpage" di copyspace) potrebbe esserti utile, io uso raven ma ha un limite di 10.000 pagine al giorno.

  12. #12
    Moderatore L'avatar di Lorenzosa
    Data Registrazione
    Jan 2011
    LocalitÓ
    Jesi
    Messaggi
    363
    Citazione Originariamente Scritto da kungfu Visualizza Messaggio
    Per quanto riguarda il canonical: ci sono parecchie pagine con elenchi di prodotti di che non mi interessa pi¨ far apparire nel motore, in questo caso avrebbe un senso indirizzare il canonical verso una pagina con prodotti completamente differenti? Oppure verso la home della sezione?
    Il canonical fÓ capire che i contenuti sono simili alla pagina canonica

    Citazione Originariamente Scritto da kungfu Visualizza Messaggio
    In questi casi non sarebbe meglio un noindex?
    Se gli articoli ci sono meglio un canonical, ma se nn ci sono o non sono disponibili cancella la pagina e redirect 301.

    Il noindex lo metti se non vuoi che la pagina sia indicizzata ma vuoi continuare a farla esistere (es. pagina con dati sensibili)

  13. #13
    Esperto
    Data Registrazione
    Oct 2006
    LocalitÓ
    Bari
    Messaggi
    1,030
    Segui Danilo Chiantia su Twitter Aggiungi Danilo Chiantia su Google+ Aggiungi Danilo Chiantia su Facebook Aggiungi Danilo Chiantia su Linkedin
    Citazione Originariamente Scritto da kungfu Visualizza Messaggio
    Danilo copyscape in questo caso credo non centri molto.

    Invece gli altri due che hai segnalato mi sembrano interessanti! faro qualche test. Secondo te riescono ad analizzare un sito da circa 30000 pagine?
    Non conosco i limiti in termini di pagine di Siteliner. In ogni caso credo che non sarebbe male un'analisi effettuata attraverso pi¨ tool.
    Danilo Chiantia Web Marketing Specialist

  14. #14
    Utente Premium L'avatar di Ilario SeoCopy Gobbi
    Data Registrazione
    Dec 2013
    LocalitÓ
    Perugia
    Messaggi
    86
    Segui Ilario SeoCopy Gobbi su Twitter Aggiungi Ilario SeoCopy Gobbi su Google+ Aggiungi Ilario SeoCopy Gobbi su Facebook Aggiungi Ilario SeoCopy Gobbi su Linkedin Visita il canale Youtube di Ilario SeoCopy Gobbi
    [...]
    Ultima modifica di vnotarfrancesco; 07-04-14 alle 11:20 Motivo: Vedi regolamento Art. 7.1
    Vieni a trovarmi, parliamo di SEO e storytelling!

  15. #15
    User
    Data Registrazione
    Mar 2006
    LocalitÓ
    Forum Livii
    Messaggi
    276
    Puoi usare anche lo spider seo Screaming Frog. Effettui lo spidering di tutto il sito (sperando che non ci siano problemi di architettura per cui tutti i duplicati siano raggiungibili). Poi vai nella scheda URI e selezioni dal menu a tendina "duplicate". Ti verrÓ mostrato un report esportabile in cui le pagine uguali (duplicate) che hanno lo stesso hash.
    Purtroppo alcuni CMS (typo Joomla in alcuni casi) creano pagine duplicate che non sono proprio uguali byte a byte ma magari includono il proprio url. Quindi pagine duplicate differiscono per pochi byte e non vengono identificate come tali da questo strumento ma per Google ovviamente lo sono. In questo caso puoi verificare quali hanno lo stesso title/description o esportare tutte le pagine ed ordinarle per dimensione (di solito questi duplicati differiscono per pochi byte).

+ Rispondi alla Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB Ŕ Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] Ŕ Attivato
  • Il codice [VIDEO] Ŕ Attivato
  • Il codice HTML Ŕ Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.