• Super User

    Un risultato sconcertante riguardante i BLs

    Dunque io non dovrei dirle certe cose perchè se mi sgamano me la prendo nel ****. Però mi sembra anche giusto informarmi degli eventi paranormali che ho constatato dopo la dance.

    Google mi ha appena aggiornato il pr e ha anche aggiornato tutti i BLs.

    Cosa c'è di strano?
    io ho 3 siti su altervista che uso come doors..il meccanismo di redirect non è nè un semplice meta content, nè un redirect in js, nè un semplice header("Location: "); ...è uno script php un pò strano che ho creato per non far capire agli spider che nelle pagine c'è un redirect (non ho la minima intenzione di svelarvi il trucco)

    Il fatto strano è ke dopo aver controllato i BLs del mio sito (quello a cui le doors fanno redirect) ho notato che questi BLs sono gli stessi che google ha attribuito alle 3 doors !!!!! O____O

    dunque mi spiego meglio:

    il mio sito ha 65 BLs

    la prima door ha 65 BLs e sono gli stessi del sito (anche se non è mai stata linkata da quei siti!!!)

    la seconda door ha 65 BLs e sono gli stessi del sito (anche se non è mai stata linkata da quei siti!!!)

    la terza door ha 65 BLs e sono gli stessi del sito (anche se non è mai stata linkata da quei siti!!!)

    Inoltre sia il sito che le doors adesso hanno pr3.

    Come ve lo spiegate? com'è possibile che lo spiders abbia attribuito alle doors i BLs del sito?

    Premetto che come ho già detto che il redirect non avviene in modo automatico. Mettiamo che la mia door si chiami: door.altervista.org .. se voi andate su quella pagina non verrete reindirizzati da nessuna parte e il googlebot quando passa da quella pagina la legge correttamente (ho visto la cache)

    Dunque com'è possibile???

    se qualcuno vuole più info mi contatti su [email][email protected][/email] (no mail solo msn)

    per le mail [email][email protected][/email]


  • Super User

    ah come test nuovo ho deciso di puntare una delle tre door su un sito con pr 8 di nota fama

    se funziona come ipotizzato, al nuovo aggiornamento avrò i suoi BLs e il suo PR :fumato:

    se non funziona amen 😢

    rischio un ban a vita per sto test bwahahahah


  • Community Manager

    kerouac3001,

    praticamente tu stai facendo questo redirect lato server e lo spider non riconosce il tuo dominio e crede ti trovarsi in un altro.

    Niente di nuovo, qualcuno si è modificato il PageRank e aveva i Backlink di Yahoo, ma nessu vantaggio nelle serp proprio perchè lo spider riconosce il dominio del redirect.

    :ciauz:


  • Super User

    ma vedi ke è strano lo stesso...

    per un motivo semplice...lo spider non fa redirect quando passa lo spider...quindi lui che ne sa che io ho fatto redirect?

    bè visto che la cosa è strana vi do il link di una door:

    http://freeupload.altervista.org

    se accedete al sito non troverete alcun redirect...se lo spider accede al sito non subisce alcun redirect..c'è il redirect solo in casi particolari, quindi la conclusione è:

    il Googlebot vede il mio sito senza redirect e lo mette in cache

    uno spider di google che rientra nel caso particolareinvece di vedere il mio sito vede il sito in redirect e assorbe i BLs del sito in redirect..perchè?

    e soprattutto se vengono modificati sia i BLs delle door sia il PR, perchè non ho vantaggi nelle serp?

    In ogni caso avrei una domanda: le mie door hanno PR 3 o no? cioè se io adesso linko il sito B dalle mie doors influirà sul prossimo aggiornamento del pr?


  • Community Manager

    Ho visto fare questa cosa a frateralph o più o meno

    ha preso il pagerank di yahoo e tutti i backlink

    Puo essere che hai fatto qualcosa di simile?


  • Super User

    si può essere...ma involontariamente...mi sai dire il sito di ralph?

    la questione è: il pr è vero?...non dico per l'indicizzazione delle door, ma per scambi link..se io faccio uno scambio link tra la mia door e un altro sito, lui trae beneficio?

    cmq sto provando a prendere i BLs di expedia..è + a tema col mio sito ahahahahahhah 😉

    Cmq è una cosa importante...non è da sottovalutare...secondo me bisognerebbe discuterne e fare test...prometto che presto svelerò il codice che uso per il redirect

    è un codice molto banale, ma ne derivano importanti questioni sull'algoritmo per il calcolo dei BLs

    🙂


  • Community Manager

    mannaggia è da due ore che cerco quel post e non lo trovo :arrabbiato:

    Se lo trovo lo faccio presente, ma non hai nessu vantaggio di BL. Di PageRank non lo so.


  • Super User

    anch'io stavo cercando quel post...se non lo trovo vedo di contattare frateralph via mail...dovrebbe esserci su alverde 🙂

    in ogni cas non vorrei passare per un cattivo cattivo cattivo webmaster, ma da questa situazione mi vengono in mente tante cattive cattive idee, spero di non fare mai le cose che mi stanno passando per la testa ora bwahahahahah :lol:


  • Community Manager

    no dai kerouac3001, sei un bravo webmaster 😄


  • User Attivo

    Scusate ma non basterebbe fare un controllo (tipo quello di Izzyweb):
    [php] <?php
    if ( strpos( $_SERVER['HTTP_USER_AGENT'], 'Googlebot' ) !== false )
    {
    //QUI METTI I CONTENUTI DELLA PAGINA CHE VEDRA' SOLO GOOGLEBOT
    }
    else
    {
    //QUI CI PIAZZI UN BEL REDIRECT...
    }
    ?>[/php]Non l'ho provato.. può fungere?


  • Super User

    Ciao tiago, forse non te ne sei accorto, ma il post che hai riportato alla luce risale al 2005 e in due anni ne sono cambiate di cose... 😉

    Quello che hai postato è una tecnica non conforme alle linee guida di GG e di altri motori: si chiama cloaking Il rischio è il BAN del dominio. 🙂


  • User Attivo

    @dechigno said:

    Ciao tiago, forse non te ne sei accorto, ma il post che hai riportato alla luce risale al 2005 e in due anni ne sono cambiate di cose... 😉
    Che figura di me*** :D:D:D
    Non me ne ero proprio accorto.. ho fatto una ricerca, ma non ho fatto caso alla data.. 😄
    Sorry


  • User Attivo

    Kerouac3001 le cose sono cambiate e non solo i redirect classici sono intercettati facilmente dai motori, ma ora anche quelli piu0 avanzati.

    Faccio un esempio.
    Per anni bastavano 3 righe in un htacces per ottenre un redirect meraviglioso:

    RewriteEngine on
    RewriteCond %{HTTP_REFERER} ^.?.$
    RewriteRule (.+)$ http://www.destinazione.xyz/ [R,L]

    Se si scriveva l'url nel browser, se passava un bot, se si cliccava un link da un altro sito (che ci aveva lincato la door) non succedeva nulla, perche' appariva la pagina originale, la door.

    Se si cliccava un link da un motore ecco che partiva il redirect, perche' il link del motore conteneva il "punto interrogativo".

    Semplice, geniale, efficacissimo.


    E' stato bello finche e' durato.

    Adesso i motori, soprattutto G, hanno il loro bot classico, poi lanciano quanto spiderizzato localmente, poi cliccano i loro link e vedono cosa succede.

    Insomma non solo spiderizzano, ma riproducono esattamente cosa vede o vedrebbe un utente che usa il loro motore.

    Per questo motivo si batte e ribatte sul concetto di web multiverso.
    L'universo web dei motori oggi e' quasi sempre uno solo, e vedono e riproducono solo un universo, tipicamente legato per esempio ad ip americani.

    Metti una door che redirige solo gli ip dell'estonia e poi vedi se G se ne accorge...

    Fai un redirect solo per i browser che hanno impostato come unica lingua quella del Qatar e poi controlla.


    E cosa succede coi multiversi ed Adsense?
    Evito di fare esempi pratici per amor di patria.

    E i controlli manuali?

    I controlli manuali vengono fatti sulle pagine indicizzate nei motori ed inoltre chi controlla non lo fa con 4 browser diversi o 50 impostazioni di lingua particolari etc. E via discorrendo...


    Insomma Kerouac3001 niente di piu' facile che G abbia sgamato il tuo redirect, per quanto intelligente e nascosto fosse.
    Lo ha sgamato perche' rientrava nel suo universo e nel suo universo lui comanda, tutto vede e tutto decide.

    Ma fuori dal loro "territorio" i motori sono alla merce' dei wm.


  • Bannato User Newbie

    tempi indietro per generare un valido (a mio parere 🙂 ) sistema di cloaking avevo fatto uno script che teneva in considerazione ANCHE la presenza dell'eventuale blocco popup dell'utente (funzione che il googlebot non ha, o per lo meno non aveva fino a pochi mesi fà)

    Lo script funzionava bene perchè si riusciva a stare in prima pagina con keywords come hosting o server .net anche per 7 / 8 (poi si veniva sgamati dai quality o dalle segnalazioni del webmaster central)


  • User Attivo

    @kerouac3001 said:

    Cosa c'è di strano?
    io ho 3 siti su altervista che uso come doors..il meccanismo di redirect non è nè un semplice meta content, nè un redirect in js, nè un semplice header("Location: "); ...è uno script php un pò strano che ho creato per non far capire agli spider che nelle pagine c'è un redirect (non ho la minima intenzione di svelarvi il trucco)

    Il fatto strano è ke dopo aver controllato i BLs del mio sito (quello a cui le doors fanno redirect) ho notato che questi BLs sono gli stessi che google ha attribuito alle 3 doors !!!!! O____O

    dunque mi spiego meglio:

    il mio sito ha 65 BLs

    la prima door ha 65 BLs e sono gli stessi del sito (anche se non è mai stata linkata da quei siti!!!)

    la seconda door ha 65 BLs e sono gli stessi del sito (anche se non è mai stata linkata da quei siti!!!)

    la terza door ha 65 BLs e sono gli stessi del sito (anche se non è mai stata linkata da quei siti!!!)

    Inoltre sia il sito che le doors adesso hanno pr3.

    Come ve lo spiegate? com'è possibile che lo spiders abbia attribuito alle doors i BLs del sito?

    Premetto che come ho già detto che il redirect non avviene in modo automatico. Mettiamo che la mia door si chiami: door.altervista.org .. se voi andate su quella pagina non verrete reindirizzati da nessuna parte e il googlebot quando passa da quella pagina la legge correttamente (ho visto la cache)

    Dunque com'è possibile???

    [/email]

    Ciao kerouac3001,
    allora, vediamo un po' come ti vede un user agent generico.
    Lancio livehttpheader e vedo:

    http://freeupload. altervista.org/
    HTTP/1.x 302 Found
    Location: http://www.impattosonoro. it/hotel_roma_prenotazioni_hotel_roma/


    http://www.impattosonoro. it/hotel_roma_prenotazioni_hotel_roma/
    HTTP/1.x 302 Found
    Location: http://www.kerouac3001.com/


    http://www.kerouac3001.com/
    HTTP/1.x 200 OK

    Dunque, due 302 portano al tuo sito, con user agent generico.
    Se googlebot vedesse quello che vede uno user agent generico il fatto di avere gli stessi backlink sarebbe perfettamente normale, e fa parte del grande problema 302 di GG.

    Se uso googlebot come user agent invece NON vengo rediretto automaticamente: vado su una doorway che contiene alla fine un link alla doorway intermedia... e stop, nessun link o redirezione al tuo sito.

    Quindi la domanda è: come fa a vedere un nesso tra una catena di 302 che, pure esistente per gli altri, in teoria lui non dovrebbe neppure vedere?

    Imho è probabile che il bot (o 1 bot dedicato) si presenti in borghese, senza lo user agent d'ordinanza, ed è probabile che se quello che vede differisce da quello che ha visto suo fratello in divisa, il suo punto di vista allora diventi predominante.

    Quale metodo più elegante per intercettare il cloacking? Da IP casuali mandi il bot con user agent normale e confronti la vista dei due bot.
    Non ho prove provate di questo, del resto difficilmente ottenibili, ma è un sospetto che mi frulla nella testa da un bel po'...

    Ciao, stammi bene.


  • Super User

    Rispondo unicamente per farvi notare 2 cose:

    1. questo thread risale ad esattamente 2 anni fa
    2. mi ero iscritto su GT 15 giorni prima di scrivere questo post

    Precisato questo rispondo alle domande di pieropan tramite mail e mi scuso con chi ha postato qui aspettandosi un mio intervento. Purtroppo non passo di qui da un pò.

    Baci e abbracci a tutti e per chi vuole fare due chiacchiere la mia mail e il mio msn sono sul profilo 🙂

    Cercate di non uppare thread di anni fa 😄

    P.S. post interessante agoago, anche se tutto sommato: niente di nuovo 😉 Però hai perfettamente ragione. Invito pure te a contattarmi tramite mail..ho pensato ad una tecnica nuova per fare cloacking e vorrei il tuo parere prima di partire con dei tests dato che tutto si basa su di un SE 🙂


  • Super User

    Cercate di non uppare thread di anni fa 😄

    No no,
    se uppare vecchi topic può portare ad interessanti considerazioni, facciamolo pure 🙂

    ...post interessante agoago, anche se tutto sommato: niente di nuovo 😉 Però hai perfettamente ragione. Invito pure te a contattarmi tramite mail...
    Naa.
    I forum esistono per discutere e crescere assieme.
    Tramite email non è possibile 😉