• User Newbie

    150 Gb/mese divorati in 13 giorni.

    Ciao a tutti: ho un problema di cui non riesco a venire a capo. Avevo 2 banner (ora li ho dovuti disattivare) ospitati su un portale di discreta affluenza. Il peso dei banner è 773 e 160 Kb. Sono entrambi sulla stessa pagina del portale ospitante i banner. I click sui banner portano al mio sito. Nel mese di maggio mi è stato oscurato il sito per aver consumato tutti i 50Gb di banda che avevo a disposizione, ho pensato di aver calcolato male e ne ho comprato altri 100 Gb per un totale di 150Gb di bandwidth a disposizione dal mese di giugno. Ebbene, dopo 13 giorni sono arrivata a consumare l'84% di quei 150 Gb. Ho tenuto sotto controllo le statistiche sia dal pannello di controllo messomi a disposizione dal portale ospitante che dal pannello di controllo del mio sito. Il traffico maggiormente generato proviene da uno script che risiede sul portale. Il portale è su un server virtuale (Aruba) e si appoggia alla piattaforma OpenX per la gestione dei banner. Lo script è questo: phpADS/www/delivery/afr.php di cui ho trovato il listato sul web:(. La cosa che non mi convince è che dal pannello del portale sembra che siano circa 600.000 impressions per banner (corrispondenti a 5-6 click su ciascuno, che portano al mio sito) mentre controllando gli accessi provenienti dal portale, anche tramite tramite analytics che ho installato sul mio sito, queste cifre sono molto ma molto inferiori (diciamo almeno 200 volte di meno). Ho identificato l'IP dello script e tentato di bloccarlo con la modifica dell' .htaccess, ma questo bastardo sembra che cambi IP e mi divora ugualmente la banda. Ho interpellato il proprietario del portale ma mi ha riso in faccia dicendomi di fare i conti "moltiplicate il peso dei banner x le visualizzazioni". Io invece ho il sospetto che quello script sia configurato in modo da amplificare in qualche modo il consumo di banda o moltiplicare le statistiche del portale.C'è qualcuno che mi può aiutare a capire cosa sta succedendo?Se vi servono altre info, non esitate a chiedere.Grazie


  • Moderatore

    Di certo le impression si possono truccare ed è questo il motivo per cui nessun network di adv vuole più usarle. Il tuo problema esattamente qual'è? Ridurre la banda consumata? Le statistiche ti dicono che 1 utente ogni 200 visita il sito? Un ctr molto basso, possibilmente dovuto ad una campagna di adv non molto efficace.


  • User Newbie

    Ciao Paolino, grazie per la risposta. Il mio problema è impedire che uno script (se il mio sospetto è reale) "si finga un visitatore" consumandomi inutilmente tutta la banda. Sono sicura che se avessi a disposizione 500 Gb di banda mi mangerebbe pure quella perché da quando ho messo i banner, il consumo è sempre aumentato senza fermarsi mai (a parità di peso dei banner). Se guardo le mie statistiche (quelle sul server del mio sito) vedo che dal 1 al 13 giugno ho avuto: numero di visite=3.425, pagine=3.796, hits=409.000,bandwidth=133 Gb. Di quelle 3.425 visite, il 98% è durata al massimo 30 secondi. Ci sono 3.247 links da url esterni, questo url è quello dello script mentre ci sono una ventina di links che riportano a url veri di vere pagine del portale. I CTR dei banner sono 0,30 ciascuno (fonte le stats del portale). Analytics installato sul mio sito dice che nello stesso periodo ho avuto 2.947 visite, 2.646 visitatori unici, 3.273 visualizzazioni di pagina durata media della visita=25 secondi, tutto traffico proveniente dal referral che sarebbe sempre quello script del portale, non le pagine vere e proprie dove erano posizionati i banner.Guardando invece le stats (sempre stesso periodo e dei due banner insieme) si legge: impressions=1.200.000, click=3.257 (tutti questi click portano solo al mio sito).


  • Moderatore

    Le tecniche ci sono, ma sono abbastanza complesse. Le usano i grossi network di adv. Ma il problema sorgerebbe nel momento in cui un software anti-script dovesse filtrare le visite "fraudolente". In quel caso il proprietario del portale potrebbe in qualche modo sentirsi defraudato e quindi reagire in qualche modo.

    Quello che si può fare è cominciare ad analizzare gli header http inviati dal bot ( se si tratta di un bot ) e quindi filtrare in base a questo parametro. Un altro metodo usato è quello di filtrare tutti gli unici che stanno pochi secondi sulla pagina e/o non cliccano da nessuna parte. Un altro metodo ancora potrebbe essere quello di inserire un piccolo script javascript nelle pagine che si occupi di verificare la cosa ( i bot in genere non sono capaci di eseguire tali script ). Oppure si può non contare tutti gli accessi provenienti da proxy ( il bot deve usare dei proxy per cambiare ip ), ma moltissimi proxy sono pc normali infettati da malware e quindi difficili da distinguere.

    Tuttavia è sempre possibile creare un bot abbastanza intelligente da simulare il comportamento di un utente reale.


  • User Newbie

    Grazie, ti dirò che ho anche fatto un site:portale.it per vedere come è messo 'sto sito e ho visto che si replica in decine e decine di subdomains (tipo sicilia.portale.it, veneto.portale.it etc) dove si trova in pratica lo stesso portale replicato x volte. Anche questo può portare ad estremizzare il consumo di banda?


  • User Newbie

    ops..è uscita una liguaccia..volevo scrivere site : portale.it


  • User Attivo

    Proporrei anche l'utilizzo di una cdn per il delivery dei contenuti statici, in questo modo andresti a risparmiare tantissima banda con un intervento poco invasivo


  • User Attivo

    prova ad attivare la versione free di cloudflare e vedi se la situazione migliora.


  • Super User

    Ciao Eleonora_,
    relativamente alla banda credo sia normale. Considerando le cifre da te elencate:
    600000160Kb = 96Gb
    600000
    773K = 460Gb
    Sicuramente openx utilizzerà la cache ed è per questo che il traffico è di 150 Gb.

    Avrei alcune domande:
    Come viene richiamato il banner (codice completo)?
    E' possibile diminuire la dimensione dei banner?
    Come hai identificato L'IP fraudolento?
    Cosa fa secondo te questo script fraudolento? Non capisco se genera falsi click o false impression. Nel caso in cui siano false impression a che pro?