Scusami Enrico, nel
post precedente non ho spiegato bene il motivo della mia soluzione drastica.
Avevo capito la tua indicazione e conoscevo la possibilità di escludere le pagine che finiscono in un determinato modo.
Purtroppo nel mio caso il problema non è risolvibile con quel metodo. Le
url da escludere non finiscono con "_pdf.html" ma con "_pdf-NNN.html" dove NNN è un numero da 1 a 999! Inoltre lo stesso problema capita anche nelle pagine non "pdf" altrimenti potevo escludere tutte le url con "_pdf".
Lo vedi bene anche negli esempi che hai citato tu.
Il fatto di togliere da
Google il mio
forum, se può avere risultati positivi sulle altre pagine, non è assolutamente un problema. Il forum ha molti msg ma ha un numero relativamente basso di ingressi da google.
Purtroppo in questo momento non riesco risolvere velocemente il problema delle url duplicate del forum e devo quindi trovare una strada diversa.
Per la cronaca la soluzione dei problemi del forum comporterà probabilmente una diversa riscrittura delle url (dovuta dalla diversa versione del forum) e dovrò comunque reindicizzarlo da capo.
Pensandoci bene, potrei in alternativa escludere tutte le pagine che finiscono con dei numeri, a costo di perdere delle pagine "vere" (sicuramente poche). In questo modo toglierei tutti i duplicati.