• User Newbie

    UGC e contenuti duplicati come comportarsi?

    Ciao,
    ho da poco aperto un'area del mio sito dando spazio ai contribuiti degli utenti (diari di viaggio).
    Ho purtroppo notato che quasi tutto il materiale inserito, o è già presente su altri 20 siti o se ho la fortuna che l'utente lo metta prima da me, da lì a poco lo pubblica poi altrove.
    Sapendo che Google non vede di buon occhio i contenuti duplicati, come comportarsi?
    Li metto solo se sono il primo ad essere indicizzato? Non li metto affatto?
    Aiuto!
    Grazie.


  • Super User

    Ciao Andrea99 e benvenuto sul Forum Gt,

    Se non riesci ad effettuare un controllo preventivo prima di pubblicare gli articoli ti consiglio di bloccare l'indicizzazione di quella porzione di sito per non incorrere in penalizzazioni derivanti dai contenuti duplicati.


  • User Newbie

    Ciao e grazie del benvenuto.
    Preventivamente lo posso fare, ma diciamo che il 90% dei contenuti è già indicizzato e quindi dovrei non pubblicarlo.

    Del restante 10%, diciamo che un 8% va poi a finire su altri siti nel giro di un giorno... utenti egocentrici mi sa!

    Le mie domande quindi diventano due:

    1. Se sono il primo ad essere indicizzato sono poi gli altri ad essere considerati duplicati? Anche se arrivano un'ora più tardi?
    2. Ma i siti tipo turistipercaso .it o altri big del settore, che a caso controllando hanno quasi tutti i diari dei loro utenti su altri 230 siti e come ti dico non sono sempre loro i primi a pubblicarli, come diavolo fanno a non essere penalizzati?

    Grazie.


  • Super User

    Provo a risponderti:

    1. Dipende dal Trustrank del tuo sito, se vengono pubblicati a distanza ravvicinata Google potrebbe attribuire la paternità dell'articolo al sito con Trustrank più alto

    2. Grazie all'ottimo Trustrank del sito da te citato Google potrebbe pensare che siano tutti gli altri siti a copiare il contenuto da quest'ultimo


  • User Newbie

    Grazie!
    C'è un modo per verificare il mio trustrank ed eventualmente confrontarlo con gli altri, tipo alexa.com con il traffico?

    Grazie.


  • Super User

    Non esiste un modo per vedere il proprio Trustrank, al massimo puoi visualizzare il Pagerank (tanto per farti un'idea puoi guardare quello).


  • User Attivo

    @Gibbo89 said:

    Ciao Andrea99 e benvenuto sul Forum Gt,
    ti consiglio di bloccare l'indicizzazione di quella porzione di sito per non incorrere in penalizzazioni derivanti dai contenuti duplicati.

    Però allora non avrebbe più senso pubblicarli in primo luogo, visto che non porterebbero alcuna visita.


  • Super User

    Ciao Web Hunter,

    Non concordo siccome è comunque contenuto utile per l'utente che arriva sul sito tramite altre strade.


  • User Attivo

    Sì, ma generalmente l'utente legge solo ciò che cerca, un portale web non è come un libro. Che senso avrebbe inserire una pagina tipo - foto viaggio giappone - se poi questa stessa non fosse indicizzata? Chi cerca altri viaggi o altre informazioni difficilmente guarderà la pagina sopra. Grandi portali hanno una media di pagine viste per utente di 2,5, perché appunto ognuno leggerà soltanto il contenuto inerenente alla sua ricerca, e se questo non sarà presente nel motore, certo, qualche visita dal menù del sito potrà anche averla, ma come minimo avrà un buon 90% di visite in meno, rispetto a quelle che sarebbero giunte dal motore. In buona sostanza: gestire un portale ed essere costretti ad escludere tante pagine dal motore, non vale, a mio avviso, la pena.


  • Super User

    Nel quote hai rimosso la parte più importante della frase però, che era "Se non riesci ad effettuare un controllo preventivo prima di pubblicare gli articoli", puoi ben capire quindi che bloccare l'indicizzazione della pagina è l'ultima spiaggia.


  • User Attivo

    Sì, certo, ma come esposto questa soluzione presenta un problema, ovvero, che un utente potrebbe pubblicare un giorno dopo lo stesso pezzo all'interno di un sito più in Trust e potente, e allora il controllo preventivo non serve a nulla. Io dico solo che, secondo la mia modesta opinione, pubblicare decine o centinaia di pagine e bloccarne l'indicizzazione non ha senso. E' qualcosa che non farei.

    Ne puoi bloccare una ogni tanto, ma è chiaro che tutti i siti che permettono la pubblicazione agli utenti hanno contenuti duplicati. Se tu scrivi poesie le vuoi diffondere maggiormente, quindi non pubblichi su un solo sito, ma su decine. Quindi cosa dovrebbero fare questi portali, bloccare tutte quante le pagine?

    A questo punto sarebbe più interessante se mi mettessi io a scrivere contenuti originali, almeno potrei posizionarli nei motore.

    Un sito che vive di contenuti degli utenti ha, per sua natura, questo problema dei contenuti duplicati, è fisiologico.


  • Super User

    Si ho capito cosa intendi, ma un controllo preventivo dovrebbe comunque evitare questo problema oppure ridurlo.

    Se una persona pubblica contenuto duplicato probabilmente l'avrà già messo su altri siti, mentre se non c'è traccia sul web del contenuto in questione lo si può accettare sperando che venga indicizzato in fretta per guadagnarne la paternità 😉


  • User Newbie

    Bella discussione.

    La mia regola è sempre stata: controllo che non sia indicizzato, e lo pubblico prima degli altri.

    Quello che non capisco è, la paternità mi viene sottratta se poi uno con trust rank più alto lo ripubblica?

    Perchè se così fosse, la guerra è impari...


  • User Attivo

    @Andrea99 said:

    Quello che non capisco è, la paternità mi viene sottratta se poi uno con trust rank più alto lo ripubblica?

    Certo che sì, ma dipende anche da quanto tempo lo hai pubblicato: una paternità di pochi giorni non conta nulla, mentre una di parecchi mesi potrebbe consentirti di battere anche un sito in Trust.


  • User Newbie

    Però che scandalo, è come autorizzare un sito a rubare impunemente.... con la scusa dell'UGC chiunque può attingere dal mio sito e poi dire ah ma lo hanno pubblicato anche da me, anche se magari non è vero!


  • Super User

    Se si parla di giorni (e in quei giorni è passato lo spider di Google sul tuo sito) la paternità probabilmente verrà attribuita a te, il problema sorge quando a distanza di minuti o ore il tuo articolo viene ripubblicato (ad esempio da aggregatori).

    Web Hunter tu hai qualche dato su "paternità attribuita" ad un sito con trust più alto anche dopo parecchi giorni di distanza? sarebbe interessante valutare qualche informazioni in più.


  • User Attivo

    @Gibbo89 said:

    Web Hunter tu hai qualche dato su "paternità attribuita" ad un sito con trust più alto anche dopo parecchi giorni di distanza? sarebbe interessante valutare qualche informazioni in più.

    Ti faccio un esempio che molti conosceranno: spesso mi copiano i contenuti ( e senza citarmi) su Yahoo! Answers e, se incollo una stringa, viene fuori prima la pagina su Yahoo!, e questo anche a distanza di mesi. Tuttavia, è da notare che il mio posizionamento non viene minimamente intaccato e, anzi, sono sempre meglio posizionato rispetto a Yahoo! per la chiave principale di quella pagina.

    Quindi: se incollo una stringa è vero mi restituisce prima la pagina su Yahoo!, ma per quanto concerne il posizionamento delle key principale rimango in testa. Questo è ovviamente anche dovuto al fatto che la key della pagina viene da me spinta tramite link, mentre quella di Yahoo! non lo è, ma soprattutto non è linkata direttamente dalla home.

    Diverso sarebbe se Yahoo! per assurdo tentasse di spingere questa pagina anche lui, e allora probabilmente vincerebbe.


  • Super User

    Il problema di Yahoo! Answers è che non viene visto come contenuto duplicato siccome le risposte alle domande aggiungono parecchio contenuto alla pagina (quindi la parte copiata è minima rispetto a tutto il contenuto della pagina), il resto lo fa il Trustrank del sito 😉


  • User Attivo

    Appunto, non c'è giustizia 🙂


  • Super User

    Diciamo si e no, perchè dal punto di vista di Google quelle risposte aggiungono altro oltre al contenuto duplicato, quindi possibili informazioni utili per l'utente, e Google cerca di fornire queste informazioni.
    Dal punto di vista del blogger che si vede copiare parte dell'articolo ( o l'articolo completo) e si ritrova dietro alla fonte che ha duplicato il contenuto capisco il problema ma per ora c'è poco da fare purtroppo.