• Super User

    possiamo essere bannati per eccesso di contenuti forzati?

    Ho aperto questo topic perchè dove è emersa la discussione stavamo paurosamente OT :):

    @micky said:

    avete mai visto bannare qualcuni per eccesso di contenuti?
    Mi spiego. Nelle linee guida di google c'è scritto di non fare pagine dai contenuti sostanzialmente duplicati.
    Se io facessi una sezione siffatta:
    sposami-per-denaro.com/italia/firenze/chiese/sposarsi in chiesa1.html
    sposami-per-denaro.com/italia/firenze/chiese/sposarsi in chiesa2.html
    sposami-per-denaro.com/italia/firenze/chiese/sposarsi in chiesa3.html
    sposami-per-denaro.com/italia/firenze/chiese/sposarsi in chiesa4.html
    ecc.
    e poi

    sposami-per-denaro.com/italia/firenze/negozi_da_sposa/negozio1.html
    sposami-per-denaro.com/italia/firenze/negozi_da_sposa/negozio2.html
    sposami-per-denaro.com/italia/firenze/negozi_da_sposa/negozio3.html
    sposami-per-denaro.com/italia/firenze/negozi_da_sposa/negozio4.html

    e poi ancora
    sposami-per-denaro.com/italia/tradizioni/tradizione_popolare

    e faccio per appesantimento
    sposami-per-denaro.com/italia/usanze/usanza_popolare

    dove tradizione_popolare e usanza_popolare si riferiscono alla stessissima cosa ma scritta con un testo totalmente diverso senza copiare nemmeno una virgola dall'altro file

    e immaginate il sito pieno di questi contenuti siffatti,
    mi potrebbero mai bannare o penalizzare per questo?
    Arricchisce invece il sito una politica del genere?

    @Stuart said:

    Ebbene sì. Questa notte è stata bannata Wikipedia.org
    Scherzo... comunque no, mai visto un ban per contenuti. Anche duplicati, non comportano ban, ma filtering-out..
    Questo ovviamente fatta salva l'eventualità in cui venga verificato che la duplicazione dei contenuti è chiaramente fatta a scopo di spam.

    @micky said:

    Anche se creassi queste pagine, e bada bene ho detto pagine:

    noleggio_auto
    noleggio_automobile
    noleggio_autombili
    noleggio_autovettura
    noleggio_autovetture
    noleggio_macchina
    noleggio_macchine
    noleggio_automezzo
    noleggio_automezzi

    ecc...

    , sempre fermo restando che riscrivo i contenuti da zero per ogni pagina, non sbirciando nemmeno sugli altri contenuti?
    non potrebbe essere considerato un modo poco ortodosso per scalare posizioni?


    e a corredo Aldwin fa notare, cosa se fosse così come la espone molto ma molto preoccupante e deleteria:
    Domanda interessata: come ti spieghi che allora il mio sito in sign sia bannato da google visto che non mi pare avesse altre cose scorrette come doorway e simili?

    http://www.dietagratis.com/
    , tra l'altro dando una controllatina con MSN sembra essere sito molto ben fatto:
    http://search.msn.com/results.aspx?q=site%3Ahttp%3A%2F%2Fwww.dietagratis.com%2F&FORM=QBRE


  • Super User

    @Stuart said:

    aldwin ha scritto:
    Domanda interessata: come ti spieghi che allora il mio sito in sign sia bannato da google visto che non mi pare avesse altre cose scorrette ...

    Come ragiona Google:
    Hai 10 pagine duplicate sul tuo sito?
    Ok, 1 di quelle pagine, quella che io ritengo essere la matrice da cui sono state fatte le altre, la tengo buona per i miei utenti. Le altre le filtro, grazie.
    Hai 100 pagine duplicate sul tuo sito?
    Ok, spammer, fuori di qui. Ritorna quando hai fatto pulizia e hai le idee più chiare.

    Al di là di ciò, sarà che è iniziato il w/e e la mia soglia di attenzione è più bassa, non ho rilevato motivi per cui il tuo sito è stato bannato. Honestly ...

    micky ha scritto:
    Anche se creassi queste pagine, e bada bene ho detto pagine: ... noleggio_auto noleggio_automobile noleggio_autombili noleggio_autovettura noleggio_autovetture....

    Non verresti bannato, ma è lavoro inutile.
    Scrivere da zero una pagina, solo per fornire a Google un'alternativa 'plurale' di un termine, quando è noto che fondamentalmente non ha bisogno che tu gli dica che il plurale di automobile è automobili è tempo perso.

    La ripetizione di noleggio è evitabile se crei una directory chiamata 'noleggio' (appunto...) con un'index.html ottimizzata per la parola noleggio, che linka alle pagine ottimizzate secondarie (vetture, automezzi, macchine...).

    Cordialmente,
    Stuart

    Ok per il plurale d'accordo!
    E per i sononimi:
    autovettura, auto, automezzo, automobile, macchina ecc.?

    E poi sei sicuro che non mi dà vantaggi chiamare il file noleggio se già la cartella si chiama noleggio? Su questo punto ti confesso che più di un dubbio, anche se la logica sembra darti ragionissima 🙂

    Cacchio, il sito di Aldwin sembra fatto benissimo, eppure...
    non è che stiamo prendendo un abbaglio?
    **Non create più pagine, sottodomini o domini dal contenuto sostanzialmente duplicato.
    **
    dalle linee guida di google....


  • User

    Due annotazioni per chiarezza.

    1. Il sito è davvero fatto bene, ma non sono io l'autore. Fate i complimenti ad Atletico Gio 🙂
    2. Se fate dei controlli con copyscape e molte delle pagine non vi risultano come copiate è solo perchè son due settimane che sto riscrivendo tutti i contenuti. Volendo posso ritirare fuori i contenuti vecchi (che ho ancora)

  • Super User

    @Aldwin said:

    Se fate dei controlli con copyscape e molte delle pagine non vi risultano come copiate è solo perchè son due settimane che sto riscrivendo tutti i contenuti. Volendo posso ritirare fuori i contenuti vecchi (che ho ancora)

    Cosa vuoi dire con questo, che c'erano in precedenza contenuti copiati da qualche altro sito? Sei sicuro, magari se AlteticoGiò è nei paraggi ci dà la sua opinione, che nel sito non c'erano prima del ban doorway o altro?


  • User

    @micky said:

    Cosa vuoi dire con questo, che c'erano in precedenza contenuti copiati da qualche altro sito? Sei sicuro, magari se AlteticoGiò è nei paraggi ci dà la sua opinione, che nel sito non c'erano prima del ban doorway o altro?

    Gliel'ho già chiesto io. Mi ha detto che non ha usato tattiche scorrette e non ho motivo di dubitarne, visto che mi è sempre sembrato onesto.

    Per quanto riguardi i contenuti copiati da altri siti, quelli c'erano. Non è facile stabilire chi ha copiato chi, fatto sta che non ho trovato una pagina che non fosse copiata da un blog o da altri siti e google deve aver pensato che DietaGratis.com copia. Probabilmente c'è una confusione che nasce dal fatto che per me duplicato è sinonimo di copiato, mentre voi lo usate probabilmente nel senso di pagine multiple con contenuti simili o identici, ma sempre interni allo stesso sito. mi sbaglio?


  • Super User

    non ti sbagli, intendevo interni allo stesso sito; scusami in effetti tendo spesso ad esprimermi male per la fretta.
    Ma anche nel caso di un sito totalmente copiato da altri siti penso non ci debbano essere i presupposti per un ban! O sbaglio, ragazzi?


  • Super User

    @micky said:

    ...nel caso di un sito totalmente copiato da altri siti penso non ci debbano essere i presupposti per un ban! O sbaglio, ragazzi?
    Un presupposto automatico non c'è. Ma se come ha detto aldwin:
    ...non ho trovato una pagina che non fosse copiata da un blog o da altri siti ...
    E' lecito pensare che qualche webmaster o blogger non l'abbia presa con umorismo e abbia fatto un bello spamreport. E se ben presentate e documentate, Google risponde prontamente contro le violazioni dei copyright.

    Cordialmente,
    Stuart


  • Super User

    @Stuart said:

    E se ben presentate e documentate

    ma google non ha la cache di tutte le nostre pagine?
    Come mai talvolta, come è emerso da molti post di questo forum, ne fa le spese, addirittura con un ban chi è copiato (come nel tuo caso vi copiò una società russa...mi sembra)? Questi di google c'hanno algoritmi impressionanti, geniacci che si sforzano per far apprendere la semantica ad una macchina da spiderizzazione, e poi si perdono nel controllo della data di una pagina posseduta da loro stessi nei loro archivi in cache? :bagno:


  • Super User

    @micky said:

    ma google non ha la cache di tutte le nostre pagine? Come mai talvolta, come è emerso da molti post di questo forum, ne fa le spese, addirittura con un ban chi è copiato
    Non esiste un algoritmo perfetto. E il ban AUTOMATICO per contenuti duplicati è assai remoto. Ciò che anche in altri post è emerso non è stato il ban (penalizzazione, meglio) di tutto il sito ma della risorsa che -erroneamente- Google riteneva non essere l'originale.
    Lo spam report, e il form di contatto per i webmaster serve anche e soprattutto per chiedere a Google di intervenire sui suoi stessi errori di valutazione.

    @micky said:

    (come nel tuo caso vi copiò una società russa...mi sembra)?
    Russi, Vietnamiti e ...Italiani, anche illustri. Ma è un errore di chi ha gestito il sito prima di me, che non si è tutelato. In un futuro prossimo non succederà.

    @micky said:

    Questi di google c'hanno algoritmi impressionanti, geniacci che si sforzano per far apprendere la semantica ad una macchina da spiderizzazione, e poi si perdono nel controllo della data di una pagina posseduta da loro stessi nei loro archivi in cache?
    Google non è un tribunale.
    Google può fare il match delle date delle copie in cache per 'uso interno'. Se io ho una bella pagina con un bell'articolo, poi tu webmaster vieni da me e mi dici: "Ehi forte quel contenuto. Ti pago 1000 euro, mi cedi i diritti di pubblicazione?" Io accetto e tu pubblichi il contenuto sul tuo sito. A quel punto io dovrei eliminare l'articolo dal mio sito, ma non lo faccio. Google in base alla cache darà ragione a me, ma chi dei due ha in realtà diritto di avere quella risorsa sul proprio sito web?

    Cordialmente,
    Stuart


  • Super User

    dunque il sito é stato realizzato un anno fa esattamente, ricordo di averci messo parecchio tempo a realizzarne i contenuti, molte pagine furono scritte interamente da me e quelle prese in giro se non ricordo hanno la fonte con relativa dicitura al fondo.

    per quanto riguarda doorways e cloaking chi mi conosce sa che non so proprio usarli... 😄

    la prossima volta segnalatemelo in pvt la discussione così posso intervenire perché l'ho trovata per caso...

    ricambio comunque i complimenti a Luca, (aldwin), ottimo acquirente e molto corretto, come direbbero su ebay, "un piacere fare affari cone gente così" :yuppi:

    ah dimenticavo di dire per informazione che dopo vari mesi di attesa é stato inserito in dmoz

    http://dmoz.org/World/Italiano/Salute/Nutrizione/


  • Super User

    @Stuart said:

    Google non è un tribunale.
    Google può fare il match delle date delle copie in cache per 'uso interno'. Se io ho una bella pagina con un bell'articolo, poi tu webmaster vieni da me e mi dici: "Ehi forte quel contenuto. Ti pago 1000 euro, mi cedi i diritti di pubblicazione?" Io accetto e tu pubblichi il contenuto sul tuo sito. A quel punto io dovrei eliminare l'articolo dal mio sito, ma non lo faccio. Google in base alla cache darà ragione a me, ma chi dei due ha in realtà diritto di avere quella risorsa sul proprio sito web?

    Uhm, per ovviare a questo caso potrebbe stabilire, mettendolo nelle lineeguida, che in caso di cessione di contenuti tramite acquisto o tramite cessione spontanea, il "passaggio di proprietà" potrebbe essere accertato dal motore con un segnale, tipo un metatag, o qualcosa del genere, che testimoni al primo passaggio dello spider successivo all'evento, la nuova "proprietà".

    Insomma, Atletico Gio, che idea ti sei fatto del ban che il tuo sito ha ricevuto?


  • Super User

    @micky said:

    Uhm, per ovviare a questo caso potrebbe stabilire, mettendolo nelle lineeguida, che in caso di cessione di contenuti tramite acquisto o tramite cessione spontanea, il "passaggio di proprietà" potrebbe essere accertato dal motore con un segnale, tipo un metatag, o qualcosa del genere, che testimoni al primo passaggio dello spider successivo all'evento, la nuova "proprietà".
    Esiste già. Ed è la redirect 301. In mancanza di essa, Google darà credito alla risorsa che ritiene (in base alla cache o altri parametri) quella originale.
    Immagina che delirio ci sarebbe se il passaggio di proprietà di un contenuto fosse affidato ad un META 😉
    Pensa ad esempio ai casini, fortunatamente ora risolti, che ci sono stati in passato con l'hijack tramite redirect 302...

    Cordialmente, (e buon weekend a tutti. :1:
    Stuart


  • Super User

    @Stuart said:

    Immagina che delirio ci sarebbe se il passaggio di proprietà di un contenuto fosse affidato ad un META

    e perchè, non posso manipolare l'html altrui e mettere il META a caso sarebbe controproducente per chi lo mette. Ma lo so che sto dicendo una cacchiata, Stuart non ha mai torto.
    E quel buon weekend a tutti sta a dire, "per stasera non mi rompete più le balle" :):)

    buon weed end anche a te 😉