Google definisce il contenuto duplicato

beke

Google definisce il contenuto duplicato

[LEFT]Adam Lasnik, in un post di tre giorni sull'Official Google Webmaster Central Blog fa aiuta i webmaster a capire cosa intende Google per "contenuto duplicato"

http://googlewebmastercentral.blogspot.com/2006/12/deftly-dealing-with-duplicate-content.html
[/LEFT]

giorgiotave

Ottimo davvero

Servirebbe una traduzione per tutti quelli che non conoscono l'inglese

ignatz

@beke said:

[LEFT]Adam Lasnik, in un post di tre giorni sull'Official Google Webmaster Central Blog fa aiuta i webmaster a capire cosa intende Google per "contenuto duplicato"

http://googlewebmastercentral.blogspot.com/2006/12/deftly-dealing-with-duplicate-content.html
[/LEFT]

Interessante, interessante, interessante

e soprattutto molto chiaro.

Grazie,
bye

cibino

@Giorgiotave said:

Ottimo davvero

Servirebbe una traduzione per tutti quelli che non conoscono l'inglese

detto...fatto...;)
Google e i contenuti duplicati

sitionweb

Ottimo articolo

giorgiotave

@cibino said:

detto...fatto...;)
Google e i contenuti duplicati

Ottimo, ben fatto

deborahdc

Grande marco complimenti

google.penalty.30

Ciao a tutti,

A proposito di contenuti duplicati, nell'ultimo aggiornamento di GG,

lo spider ha seguito una directory del mio sito con una lettera in Maiuscolo, piuttosto che in minuscolo.

Ora il motore vede

sia la directory .../Hotel/
che quella .../hotel/

chiaramente con gli stessi contenuti.

Inutile dire che il sitemap del sito ha sempre indicato la directory giusta.

Intanto, ho controllato un po' di pagine index ed ho inserito tutti link assoluti www.miodominio.it/hotel/

Ora però la serp mostra una caterva di risultati supplementari (quasi un migliaio) e non vorrei beccare penalizzazioni.

E adesso che faccio ?

netdream

Sul contenuto duplicato, vorrei chiedervi se esso viene riconosciuto automaticamente dai filtri di google oppure la penalità scatta solo a seguito di segnalazione ed intervento dei quality rater.

Dico questo perchè, tempo fa ho realizzato un sito e su alcune pagine, porzioni di testo erano simili ad altre, di un sito realizzato in precedenza.

Le pagine in oggetto però, senza link provenienti dall'esterno hanno raggiunto grazie al linking interno, tutte un pr 3.
Il filtro di google non si è accorto che erano simili?

hypertext

E come si fa a stabilire chi ha copiato l'altro?

beke

[LEFT]Dal punto di vista dei motori di ricerca il problema del contenuto duplicato può ricondursi principalmente a quello di non presentare serp con contenuti ridondanti.
L'utente del motore di ricerca non apprezzerà una serp dove 9 risultati su 10 sono identici o quasi.

La rilevazione dei contenuti duplicati o quasi-duplicati da parte di Google avviene senza alcun intervento manuale, tramite algoritmi che "spezzettano" i documenti, ne calcolano degli identificativi univoci (che loro chiamano "impronte digitali") e li confrontano fra loro.

A parte pochi casi i documenti duplicati non vengono tolti dall'indice, vengono invece filtrati in fase di presentazione dei risultati delle ricerche.
In questo caso la regola è che rimane quello che viene ritenuto più autorevole (maggior PR, maggior trust, aggiornamento più recente).

Non è compito del motore scoprire chi abbia copiato chi, il motore deve soltanto individuare la risorsa di maggior qualità da offrire agli utenti

Senza contare che la maggior parte dei documenti duplicati presenti nel web sono assolutamente legittimi (versioni html e pdf, versioni stampabili, ecc.)
[/LEFT]

dell.orto.fabio

@beke said:

[LEFT]Dal punto di vista dei motori di ricerca il problema del contenuto duplicato può ricondursi principalmente a quello di non presentare serp con contenuti ridondanti.

L'utente del motore di ricerca non apprezzerà una serp dove 9 risultati su 10 sono identici o quasi.[/LEFT]

[LEFT]La rilevazione dei contenuti duplicati o quasi-duplicati da parte di Google avviene senza alcun intervento manuale, tramite algoritmi che "spezzettano" i documenti, ne calcolano degli identificativi univoci (che loro chiamano "impronte digitali") e li confrontano fra loro.[/LEFT]

[LEFT]A parte pochi casi i documenti duplicati non vengono tolti dall'indice, vengono invece filtrati in fase di presentazione dei risultati delle ricerche.
In questo caso la regola è che rimane quello che viene ritenuto più autorevole (maggior PR, maggior trust, aggiornamento più recente).[/LEFT]

[LEFT]Non è compito del motore scoprire chi abbia copiato chi, il motore deve soltanto individuare la risorsa di maggior qualità da offrire agli utenti :)[/LEFT]

[LEFT]Senza contare che la maggior parte dei documenti duplicati presenti nel web sono assolutamente legittimi (versioni html e pdf, versioni stampabili, ecc.)[/LEFT]

Stefano secondo te i links presenti nei documenti reputati duplicati hanno lo stesso valore di altri per la risorsa linkata ?

beke

[LEFT]Ciao Fabio,
non ho mai fatto test specifici.

Ragionando come un motore di ricerca direi che se il documento è pienamente duplicato i link andrebbero scontati.

In prima battuta si può fare qualche ricerca per vedere se "link:" in qualche caso riporta backlink da documenti duplicati.
Ma in caso positivo non ci sarebbe la certezza che quei bl spingano effettivamente come quelli provenienti da documenti non duplicati, mentre in caso negativo, visto il comportamento dell'operatore "link:" non si potrebbe dire proprio un bel niente.

Tu cosa ne pensi?
C'è qualche ragione particolare per cui la cosa ti interessa?

[/LEFT]

fheller

@Dell'Orto Fabio said:

Stefano secondo te i links presenti nei documenti reputati duplicati hanno lo stesso valore di altri per la risorsa linkata ?

Anche se non sono Stefano dico la mia

Bella domanda, direi di no, da quanto vedo su diversi siti i link nei documenti reputati duplicati sono privi di valore per Google, sicuramente quando questi documenti sono presenti in siti svalutati nel loro insieme a causa della duplicazione (compaiono in basso nelle serps pur cercando intere frasi originali).

Anche se secondo me ci sono più gradi di "penalizzazione" per duplicazione ad oggi nei siti che monitoro comunque non ho mai visto un sito "penalizzato" per duplicazione comparire nel listing di link:

Voi cosa ne pensate?

dell.orto.fabio

Chiedo scusa... naturalmente sono gradite le risposte e il parere di tutti, ci mancherebbe.

La mia domanda, era provocatoria, in quanto vorrei conoscere il Vostro parere su questo fattore, soprattutto in riferimento a comunicati stampa e article marketing.

beke

[LEFT]Secondo me attualmente vengono contati.

Non so proprio dirti se in qualche modo siano svalutati rispetto ai link provenienti da documenti unici, in teoria sarebbe giusto ma in pratica non credo venga fatto o almeno non ancora.
Però si tratta di opinioni non supportate da alcuna verifica.

Per article marketing e comunicati io, comunque cercherei di evitare la palese duplicazione di contenuti, soprattutto per il primo dei due.

Non ho mai pubblicato guide redistribuibili, questo, per esempio, sarebbe un buon test per una verifica "reale" sui contenuti pienamente duplicati.
In passato funzionavano egregiamente, ma sospetto che funzionino ancora, soprattutto se il sito che ospita il documento duplicato gode di un buon trust.

Il tuo parere qual'è?
[/LEFT]

fheller

@Dell'Orto Fabio said:

Chiedo scusa... naturalmente sono gradite le risposte e il parere di tutti, ci mancherebbe.

Si era capito, scherzavo

@Dell'Orto Fabio said:

La mia domanda, era provocatoria, in quanto vorrei conoscere il Vostro parere su questo fattore, soprattutto in riferimento a comunicati stampa e article marketing.

Dal punto di vista di chi usufruisce dei contenuti è rischioso servirsene perchè ci sono ancora poche fonti rispetto al "mercato anglosassone", c'è da dire che sono ancora in pochi ad attingere da quelle fonti...se avessi tempo di realizzare uno spam engine basato su articoli (la voglia ci sarebbe cercherei di variare il più possibile le fonti e integrare con contenuti originali oppure prelevati da newsgroups etc.etc.

Dal punto di vista di chi mette a disposizione i contenuti non ci sono ancora abbastanza dati per valutare il valore dei link ricevuti, sicuramente se i link provengono da siti svalutati nel loro insieme (anche solo causa della duplicazione) quei link non danno apporto benefico.

Se invece il link proviene da un documento "penalizzato" all'interno di un sito ritenuto valido allora il vantaggio c'è quando il sito che riceve i ink non riceve solo link di quel tipo.

Questo almeno da quanto vedo su siti in lingua straniera, ma ammetto che secondo me è ancora presto per dare una risposta certa se mai ce ne sarà una.

Secondo me la parola d'ordine ormai da tempo è "spontaneità"... avercela o simularla

dell.orto.fabio

Fheller ha scritto:

Dal punto di vista di chi usufruisce dei contenuti è rischioso servirsene perchè ci sono ancora poche fonti rispetto al "mercato anglosassone", c'è da dire che sono ancora in pochi ad attingere da quelle fonti...se avessi tempo di realizzare uno spam engine basato su articoli (la voglia ci sarebbe cercherei di variare il più possibile le fonti e integrare con contenuti originali oppure prelevati da newsgroups etc.etc.

Dal punto di vista di chi mette a disposizione i contenuti non ci sono ancora abbastanza dati per valutare il valore dei link ricevuti, sicuramente se i link provengono da siti svalutati nel loro insieme (anche solo causa della duplicazione) quei link non danno apporto benefico.

Se invece il link proviene da un documento "penalizzato" all'interno di un sito ritenuto valido allora il vantaggio c'è quando il sito che riceve i ink non riceve solo link di quel tipo.

In linea di massima concordo con la tua analisi, ora invito altri auterevoli esponenti del forum e chiunque se la sente a farlo ad esprimere il loro parere.

Peccato che la discussione è venuta fuori in un particolare periodo dell'anno, quando molti sono in vacanza, è uno degli argomenti più hot che ci possano essere.

schizzorl86

beh... l'articolo è molto interessante... qualche tempo fa avevo letto che GG puniva i contenuti duplicati con il ban.. e su un'altro forum era stato consigliato di non linkare il sito originale da quello duplicato... mentre invece leggendo l'articolo si capisce che addirittura è buona cosa che ci siano link diretti tra i contenuti duplicati... ad ogni modo meglio scegliere il contenuto da mostrare nelle serps piuttosto che punire un sito che magari non ha nessuna malizia...