• Moderatore

    [Altri] Velocizzare Web Ceo

    Devo analizzare il ranking di molti siti con Web Ceo e ognuno ha circa 200 parole (o più).
    Il problema è che è lento!
    Sapete se e come fare per velocizzare il lavoro il più possibile?

    Tipo:
    Altri


  • Moderatore

    Ciao Lazzo,
    Web Ceo è volutamente lento nello scansionare le serp, per evitare che l'IP dal quale partono le richieste non venga bannato o temporaneamente bloccato da Google.
    Metodi sicuri per aumentare la velocità potrebbero essere la selezione di una pagina o di un numero di risultati oltre i quali non proseguire con la scansione della serp se il sito non è stato trovato e l'interruzione della scansione appena il sito è stato rilevato tra i risultati.
    Invece le impostazioni di sicurezza e "human emulation" possono essere disattivate a tuo rischio e pericolo da
    File - Settings - SE requests - Safety and Accuracy
    Ciao.


  • Moderatore

    Ciao Blays,
    settare "basic emulation" è un rischio, quindi?
    E se invece settassi (con custom emulation) le opzioni?

    Comunque, ora l'ho settato in modo che interrompa la scansione appena il sito viene rilevato.

    Io ho 2 cpu Intel(r) Core (TM) Quad con 8 GB di RAM collegati a 2 ADSL. Su entrambi è installato Web Ceo.
    Quando lancio i software sembra che la scansione del ranking sia rallentata.
    A cosa può essere dovuto?

    • Impostazione di Web Ceo da migliorare
    • Servono più macchine per una grossa mole di lavoro
    • Problemi derivati dall'ADSL
    • Altro

  • Moderatore

    Ti è mai capitato di stressare Google (anche manualmente) ed all'ennesima query vederti apparire una pagina in cui inserire un captcha per poter continuare?
    Questo è quello che rischi facendo lavorare Web Ceo troppo velocemente, ovviamente il programma non è in grado di inserire il captcha e manda in errore tutte le scansioni delle serp. Poi credo che per arrivare ad un ban dell'IP ci voglia ben altro.

    Insomma Web Ceo lavora lentamente (salvo diversa configurazione) per rendere la sua attività "umana" e non mettere in allerta Google, non dipende dal clock della CPU o dalla banda dell'adsl.

    Puoi cambiare la configurazione e vedere se ad un certo punto ottieni degli errori, facendo una ricerca manuale dallo stesso IP dovresti ottenere la pagina di blocco.
    Per non perdere tempo io ti consiglierei di valutare la reale necessità di controllare il posizionamento di tutti i siti e di tutte le keys ogni giorno, configurando per bene i profili potresti non dover controllare sempre tutto, ma solo alcuni profili e quindi risparmiare molto tempo.
    Ciao.


  • Moderatore

    Il fatto è che la mole di lavoro è molto elevata a prescindere.
    Al momento vorrei ottimizzare le configurazioni per diminuire i tempi e vedere con che tempi riesco a svolgere i lavori.

    Quello che non mi spiego (non ho verificato personalmente, è quello che mi viene detto) è che pur avendo 2 cpu con 2 adsl distinte, sembra che entrambe le macchine siano rallentate. :mmm:
    Prima di tutto verificarò cosa succede realmente, quando entrambe le macchine lavorano in contemporanea.
    Potrebbe essere una soluzione un'altra macchina con un'altra linea adsl?

    Ho ancora un paio di domande. 🙂

    Come funziona la scansione programmata (se c'è)?
    In "Set scan rules" mi conviene spuntare "Include subdomain"?


  • Moderatore
    • La schedulazione è configurabile cliccando sul secondo pulsante in basso a destra, non l'ho mai provata, ma non dovrebbe aver problemi.

    • L'include subdomain è un'opzione che devi valutare in base ai siti che controlli ed alle tue preferenze
      Ciao.


  • User

    Usa proxies


  • Moderatore

    Ciao Controlladomini,
    potresti spiegarti meglio?
    Perché dovrei usare proxies?


  • User

    @lazzo85 said:

    Ciao Controlladomini,
    potresti spiegarti meglio?
    Perché dovrei usare proxies?

    Non conosco il programma in questione (ne uso altri per fare lo stesso lavoro), ma in linea di principio se il tuo IP viene bloccato da G perchè fai troppe query in poco tempo (e ti chiede di risolvere il captcha per verificare se sei umano o un bot) evidentemente una soluzione può essere quella di utilizzare dei proxies a rotazione (proxy rotator) o VPN con scheduled IP change.


  • User Attivo

    Ciao,
    anche io uso uno o più proxy per fare queste cose come ad esempio lo scan del pagerank. Ci sono delle società che noleggiano una decina di proxy per una cifra ragionevole.
    Io ne ho uno mio privato e gestito da me ed è piuttosto semplice per chi è già avvezzo a linux: basta installare tinyproxy e configurarlo in modo da accettare esclusivamente richieste dai propri indirizzi IP (se statici) e si può anche impostare una password.


  • Moderatore

    OK, voglio provare a usare i proxies.
    Mi date una mano a impostarlo?
    Vado in File>Settings>SE Requests>Connection

    Trovo:
    O Use proxy servers retrieved by Web CEO from public proxy listings
    O Enter proxy addresses manually
    Che differenze ci sono? Nel primo punto mi sembra di capire che fa tutto da solo... ma in che modo?
    Nel secondo sono io che vado a inserire... ma che cosa ci dovrei mettere?

    Poi ci sono da spuntare:
    || Use random user agents
    |
    | Usa IE cookies and language settings when requesting search engines
    Spunterei il primo (mi sembra utile), ma il secondo a che serve? Mi conviene spuntarlo o no?

    Se uso i proxy mi vanno a influire le statistiche di analytics?

    Ricordo, che devo "solo" fare i ranking a circa 150 progetti con ognuno 200 parole. 😮