+ Rispondi alla Discussione
Pagina 1 di 2 12 UltimaUltima
Risultati da 1 a 50 di 55

Script che quando passa lo spider di google manda una mail

Ultimo Messaggio di mailwork il:
  1. #1
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    40,078
    Visita il canale Youtube di Giorgiotave

    Script che quando passa lo spider di google manda una mail

    Ragazzi, proviamo questo script


    if (stristr($HTTP_USER_AGENT, 'google')){
    $destinatario ="vostra mail";
    $oggetto ="google è passato";
    $info="è passato lo spider di google";
    mail ($destinatario, $oggetto, $info);
    } else {

    }


    Deve andare in una pagina con estensione php. Cerco ancora in giro per vedere se va perchè ho paura che la sintatti sia sbagliata.

    Se funziona mettiamo anche l'ora.
    Giorgio Taverniti Blog. FastForward: su YouTube ogni Martedì (SEO) e Giovedì (Social)!

    Tutta la SEO in 23 ore: 9 diversi moduli tematici, 34 lezioni, questo è il Videocorso SEO del 2017!


  2. #2
    User Attivo
    Data Registrazione
    Nov 2004
    Località
    Catania
    Messaggi
    1,142
    Non penso proprio che vada...
    la variabile $HTTP_USER_AGENT (o $_SERVER['HTTP_USER_AGENT'] ) rileva il browser in uso... non penso che esista un browser chiamato google...


    Al massimo, puoi fare una ricerca dell'indirizzo ip, con $_SERVER['REMOTE_ADDR'] ( o getenv("REMOTE_ADDR") per le versioni più vecchiotte di php ) e controllare se sia quello usato da google così:
    Codice:
    <?
    $googleip = gethostbyname&#40;"google.com"&#41;;
    if&#40;$_SERVER&#91;'REMOTE_ADDR'&#93; == $googleip&#41; mail&#40;"aaa@aaa.aaa", "E' passato!", "Google"&#41;;
    ?>

  3. #3
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    40,078
    Visita il canale Youtube di Giorgiotave
    Non sono esperto di spider, conosco ben poco.

    Proviamo quello di Pater?
    Giorgio Taverniti Blog. FastForward: su YouTube ogni Martedì (SEO) e Giovedì (Social)!

    Tutta la SEO in 23 ore: 9 diversi moduli tematici, 34 lezioni, questo è il Videocorso SEO del 2017!


  4. #4
    User Attivo
    Data Registrazione
    Nov 2004
    Località
    Catania
    Messaggi
    1,142
    io non so neanche cosa è lo spider...
    stavo pensando che secondo il ragionamento, che dice che ogni computer connesso ad internet è fornito di un IP dal provider al momento della connessione, quando il programma spider di google passa dal tuo sito, deve avere l'ip del suo pc, ovvero quello di google. Facendo gli opportuni controlli, è possibile sapere se un utente od un programma sul pc del server di google sta passando per il tuo sito

  5. #5
    Utente Premium
    Data Registrazione
    Jan 2005
    Messaggi
    186
    guarda se funziona questo script doveva funzionare anche quello che avevo postato per togliere le sessioni da phpbb (la condizione dell'if è la stessa). Però quello continua tuttora a non funzionare..

  6. #6
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    40,078
    Visita il canale Youtube di Giorgiotave
    Citazione Originariamente Scritto da oronzo_canà
    guarda se funziona questo script doveva funzionare anche quello che avevo postato per togliere le sessioni da phpbb (la condizione dell'if è la stessa). Però quello continua tuttora a non funzionare..
    Strano, ora chiedo uno per il cloaking ma la funzione e la stessa
    Giorgio Taverniti Blog. FastForward: su YouTube ogni Martedì (SEO) e Giovedì (Social)!

    Tutta la SEO in 23 ore: 9 diversi moduli tematici, 34 lezioni, questo è il Videocorso SEO del 2017!


  7. #7
    User Attivo
    Data Registrazione
    Nov 2004
    Località
    Catania
    Messaggi
    1,142
    Citazione Originariamente Scritto da oronzo_canà
    guarda se funziona questo script doveva funzionare anche quello che avevo postato per togliere le sessioni da phpbb (la condizione dell'if è la stessa). Però quello continua tuttora a non funzionare..
    mmm...
    non so... in effetti è possibile che google utilizzi un router per gestire un'altro pc, che esegue lo spider... ma l'IP dovrebbe essere comunque lo stesso :|

  8. #8
    User Attivo
    Data Registrazione
    Jan 2005
    Località
    ...
    Messaggi
    1,026
    Anche gli spider hanno l'user agent "HTTP_USER_AGENT"

    Uno di quelli di google è:
    Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
    gli altri non me li ricordo a memoria cmq si cerca la stringa google da user agent e via.

    Per funzionare funziona, ultimamente mi sono fatto un sistemino di statistiche con mysql e queste variabili ambiente di apache REQUEST_METHOD QUERY_STRING REQUEST_URI HTTP_USER_AGENT REMOTE_ADDR REQUEST_METHOD più qualche altra cosa che non mi ricordo.

  9. #9
    User Attivo
    Data Registrazione
    Nov 2004
    Località
    Catania
    Messaggi
    1,142
    Qua ho trovato alcune info utili... Non ho approfondito... appena aprirete la pagina capirete il perchè... :stordita:


    Tradotta in italiano:
    http://216.239.39.104/translate_c?hl...f%3D1%26sa%3DG

    Originale:
    http://www.google.com/bot.html

  10. #10
    User
    Data Registrazione
    Jan 2005
    Messaggi
    12
    Io ho fatto questo script per loggare in un file .txt il passaggio degli spider, può essere facilmente adattato per l'invio di una mail

    Codice:
    <?
    
    $agents = array&#40;
    "ultraseek" 		=> "Infoseek",
    "sidewinder/" 		=> "Infoseek",
    "ia_archiver" 		=> "Alexa",
    "arianna.iol.it" 	=> "Arianna",
    "ask jeeves" 		=> "?",
    "fast-webcrawler/" 	=> "Fast",
    "googlebot-" 		=> "Google Immagini",
    "googlebot/" 		=> "Google",
    "mercator-" 		=> "Altavista",
    "scooter/" 			=> "Altavista",
    "scooter-" 			=> "Altavista",
    "arachnoidea"		=> "?",
    "yhaoo"				=> "Yahoo",
    "slurp"				=> "Inkomi",
    "gulliver/"			=> "NorthernLight",
    "lycos_spider_&#40;t-rex&#41;"	=> "Lycos",
    "architextspider"	=> "Excite",
    "libwww-perl/"		=> "Excite",
    "almaden.ibm.com"	=> "Ibm Resarch"
    &#41;;
    
    $filename = "motori.txt";
    $ua = $_SERVER&#91;"HTTP_USER_AGENT"&#93;;
    $page = $_SERVER&#91;'PHP_SELF'&#93;;
    
    
    foreach &#40;$agents as $ag => $motore&#41; &#123;
    //print date&#40;" d-M-Y H&#58;i "&#41; . " \t" . $motore . " \t" . $ag . " \t" . $page ."\n";
      if &#40;strpos &#40;strtolower &#40;" " . $ua&#41;, $ag&#41; > 0&#41; &#123;
        $fp = fopen&#40;$filename, "a"&#41;;
    
        if &#40;$fp&#41; &#123;
          fwrite&#40;$fp, date&#40;" d-M-Y H&#58;i "&#41; . " \t" . $motore . " \t" . $ag . " \t" . $page ."\n"&#41;;
          fclose&#40;$fp&#41;;
          break;
        &#125;
      &#125;
    &#125;
    ?>
    se volete aiutarmi a tenere aggiornati gli agents ve ne sono grato bye

  11. #11
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    40,078
    Visita il canale Youtube di Giorgiotave
    Per me va benissimo.

    webfil, possiamo fare un bel topic con tutta la lista degli spider nella sezione motori di ricerca
    Giorgio Taverniti Blog. FastForward: su YouTube ogni Martedì (SEO) e Giovedì (Social)!

    Tutta la SEO in 23 ore: 9 diversi moduli tematici, 34 lezioni, questo è il Videocorso SEO del 2017!


  12. #12
    Utente Premium L'avatar di Tuonorosso
    Data Registrazione
    Mar 2005
    Località
    Lecco
    Messaggi
    1,997
    giorgio, piu tardi ti posto il mio..è una bomba!!

    Anzi...spesso devo disabilitarlo perchè slurp mi spiderizza trooppo in fretta

  13. #13
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    40,078
    Visita il canale Youtube di Giorgiotave
    Citazione Originariamente Scritto da Tuonorosso
    giorgio, piu tardi ti posto il mio..è una bomba!!

    Anzi...spesso devo disabilitarlo perchè slurp mi spiderizza trooppo in fretta
    Giorgio Taverniti Blog. FastForward: su YouTube ogni Martedì (SEO) e Giovedì (Social)!

    Tutta la SEO in 23 ore: 9 diversi moduli tematici, 34 lezioni, questo è il Videocorso SEO del 2017!


  14. #14
    Utente Premium L'avatar di Tuonorosso
    Data Registrazione
    Mar 2005
    Località
    Lecco
    Messaggi
    1,997
    Codice:
    pagina 1&#58; 
    <?php  
    /* ------------------------------------------------------------ */ 
    /* Spider-Sense                                                                                                    */ 
    /* Detects bot activity and alerts you to their presence                */ 
    /* By Shawn Raloff                                                                                                */ 
    /* http&#58;//www.side2.com                                                                                 */ 
    /* ------------------------------------------------------------ */ 
    
    /* ---------- You must set these variables ---------- */ 
    $domain = "www.tuosito.it"; 
    $email = "info@tuosito.it"; 
    
    
    /* ---------- No need to edit beyond this point ---------- */ 
    $bot = $_SERVER&#91;'HTTP_USER_AGENT'&#93;; 
    $page = $_SERVER&#91;'PHP_SELF'&#93;; 
    
    /* ---------- Look for bots ---------- */ 
    ini_set&#40;"sendmail_from",'info@tuosito.it'&#41;; 
    
    //mail&#40;"$email", "aaaa", "aaa"&#41;; 
    $myFile = fopen&#40;"spider-sense.dat","r"&#41;; 
    while&#40;!feof&#40;$myFile&#41;&#41;  
    &#123; 
        $myLine = chop&#40;fgets&#40;$myFile, 255&#41;&#41;; 
        list&#40;$agent,$url&#41; = split&#40;"&#91;|&#93;", $myLine&#41;; 
        if&#40; eregi&#40;$agent,$bot&#41; &#41; 
        &#123;  
            mail&#40;"$email", "$agent detected on $domain", "$agent has crawled $page on $domain"&#41;;  
        &#125; 
    &#125; 
    
    fclose&#40;$myFile&#41;; 
    
    //echo "Powered By Side2.com"; 
    ?>

    spider-sense.dat:

    Codice:
    AbachoBOT|www.abacho.com 
    abcdatos_botlink|www.abcdatos.com 
    AESOP_com_SpiderMan|www.aesop.com 
    ah-ha.com crawler|www.ah-ha.com 
    ia_archiver|www.alexa.com 
    Scooter|www.altavista.com 
    AltaVista-Intranet|www.altavista.co.uk 
    FAST-WebCrawler|www.alltheweb.com 
    Acoon Robot|www.acoon.de 
    antibot|www.antisearch.net 
    Atomz|www.atomz.com 
    Buscaplus Robi|www.buscaplus.com 
    CanSeek|www.canseek.ca 
    ChristCRAWLER|www.christcrawler.com 
    Crawler|www.crawler.de 
    DaAdLe.com ROBOT|www.daadle.com 
    RaBot|www.daum.net 
    DeepIndex|www.en.deepindex.com 
    DittoSpyder|www.ditto.com 
    Jack|domanova.co.uk 
    Speedy Spider|www.entireweb.com 
    ArchitextSpider|www.excite.com 
    Arachnoidea|www.euroseek.net 
    EZResult|www.ezresults.com 
    Fast PartnerSite Crawler|www.fastsearch.net 
    KIT-Fireball|www.fireball.de 
    FyberSearch|www.fybersearch.com 
    GalaxyBot|www.galaxy.com 
    geckobot|www.geckobot.com 
    GenCrawler|www.gendoor.com 
    GeonaBot|www.geona.com 
    Googlebot|www.google.com 
    Aranha|www.girafa.com 
    Slurp|www.inktomisearch.com 
    Toutatis|hoppa.com 
    Hubater|www.hubat.com 
    IlTrovatore-Setaccio|www.iltrovatore.it 
    IncyWincy|www.incywincy.com 
    UltraSeek|www.infoseek.com 
    Mole2|www.intags.de 
    MP3Bot|mp3bot.de 
    C-PBWF-ip3000.com-crawler|www.ip3000.com 
    kuloko-bot|www.kuloko.com 
    LNSpiderguy|www.lexis-nexis.com 
    NetResearchServer|www.look.com 
    MantraAgent|www.looksmart.com 
    NetResearchServer|www.loopimprovements.com 
    Lycos_Spider|www.lycos.com 
    JoocerBot|www.joocer.com 
    HenryTheMiragoRobot|www.mirago.co.uk 
    mozDex|www.mozdex.com 
    MSNBOT|search.msn.com 
    Gulliver|www.northernlight.com 
    ObjectsSearch|www.objectssearch.com 
    PicoSearch|www.picosearch.com 
    PJspider|www.portaljuice.com 
    DIIbot|www.powerinter.net 
    nttdirectory_robot|navi.ocn.ne.jp 
    NationalDirectory-SuperSpider|www.nationaldirectory.com 
    Openfind piranha,Shark|www.openfind.com 
    psbot|www.picsearch.org 
    CrawlerBoy Pinpoint.com|www.pinpoint.com 
    AlkalineBOT|www.vestris.com 
    Fluffy the spider|www.searchhippo.com 
    Scrubby|www.scrubtheweb.com 
    asterias|www.singingfish.com 
    Kototoi|www.s.u-tokyo.ac.jp 
    Searchspider|www.searchspider.com 
    SightQuestBot|www.sightquest.com 
    Spider_Monkey|www.spidermonkey.ca 
    Surfnomore Spider|www.surfnomore.com 
    &#91;email&#93;Robot@SuperSnooper.Com&#91;/email&#93;|www.supersnooper.com 
    teoma|www.teoma.com 
    Teradex_Mapper|mapper.teradex.com 
    ESISmartSpider|www.travel-finder.com 
    Spider TraficDublu|www.traficdublu.ro 
    Tutorial Crawler|www.tutorgig.com 
    UK Searcher Spider|www.uksearcher.co.uk 
    Vivante Link Checker|www.vivante.com 
    appie|www.walhello.com 
    Nazilla|www.websmostlinked.com 
    www.WebWombat.com.au|www.webwombat.com.au 
    marvininfoseek|www.webseek.de 
    MuscatFerret|www.webtop.com 
    WhizBang! Lab|www.whizbanglabs.com 
    ZyBorg|www.wisenut.com 
    WIRE WebRefiner|www.wire.co.uk 
    WSCbot|www.worldsearchcenter.com 
    Yandex|www.yandex.com 
    Yellopet-Spider|www.yellowpet.com

  15. #15
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    40,078
    Visita il canale Youtube di Giorgiotave
    Puoi aprire lo stesso in motori?

    Ti do l'autorizzazione a farlo, visto che serve per far commentare e nel caso serve (non credo ) si può implementare.
    Giorgio Taverniti Blog. FastForward: su YouTube ogni Martedì (SEO) e Giovedì (Social)!

    Tutta la SEO in 23 ore: 9 diversi moduli tematici, 34 lezioni, questo è il Videocorso SEO del 2017!


  16. #16
    Utente Premium L'avatar di Tuonorosso
    Data Registrazione
    Mar 2005
    Località
    Lecco
    Messaggi
    1,997
    k...

  17. #17

    Data Registrazione
    Apr 2005
    Messaggi
    155
    Io uso questo funziona perfettamente! Proprio oggi mi hanno visitato 4 pagine...e mi sono arrivate 4 email. Forse l'unica cosa che non va è proprio questo....le troppe email. Registrare il tutto in file di testo l'approvo al 100%!!! Però mi è sembrato sempre utile postare il codice che uso io....


    Codice:
    <?
    
    if&#40;eregi&#40;"googlebot",$HTTP_USER_AGENT&#41;&#41;
    	&#123;
    	if &#40;$QUERY_STRING != ""&#41;
    		&#123;$url = "http&#58;//".$SERVER_NAME.$PHP_SELF.'?'.$QUERY_STRING;&#125;
    	else
    		&#123;$url = "http&#58;//".$SERVER_NAME.$PHP_SELF;&#125;
    	$today = date&#40;"F j, Y, g&#58;i a"&#41;;
    	mail&#40;"you@youremail.com", "Googlebot detected on http&#58;//$SERVER_NAME", "$today - Google crawled $url"&#41;;
    	&#125; 
    
    ?>

  18. #18
    User
    Data Registrazione
    Jan 2005
    Località
    Ghiacciaio Marittima
    Messaggi
    114

    mod

    Non so dove, ma tempo fa avevo visto un apposito Mod per phpbb che ti faceva inviare una email quando google passava per il forum.
    Sapete dove lo posso ritrovare? E magari può esservi d'aiuto per determinare il codice che volete scrivere.
    Fabio.
    verifica regole firma

  19. #19

    Data Registrazione
    Apr 2005
    Messaggi
    155
    Comunque puoi usare anche il codice che ho postato sopra...anche per il forum phpBB.

  20. #20
    User
    Data Registrazione
    Jan 2005
    Località
    Ghiacciaio Marittima
    Messaggi
    114
    Citazione Originariamente Scritto da Sugnu Beddu
    Comunque puoi usare anche il codice che ho postato sopra...anche per il forum phpBB.
    Si ma non so dove inserirlo. Ci sono i file tpl ed i file php Avevo trovato il mod che in meno di 30 righe ti diceva che file modificare e come ma non lo ritrovo

    Grazie.
    verifica regole firma

  21. #21

    Data Registrazione
    Apr 2005
    Messaggi
    155



    Puoi inserirlo in alto....nei seguenti file:

    - index.php

    - viewforum.php

    - viewtopic.php




  22. #22
    Utente Premium L'avatar di Tuonorosso
    Data Registrazione
    Mar 2005
    Località
    Lecco
    Messaggi
    1,997
    se lo metti nell'header fai prima e lo metti in un solo punto..

  23. #23
    User
    Data Registrazione
    Jan 2005
    Località
    Ghiacciaio Marittima
    Messaggi
    114
    Ecco vedi, cosa succede se lo metto nel file overall_header.tpl?
    Non c'è un file.php che compare in tutte le pagine?
    Ciao e grazie.
    verifica regole firma

  24. #24
    User
    Data Registrazione
    Jan 2005
    Località
    Ghiacciaio Marittima
    Messaggi
    114
    Citazione Originariamente Scritto da Tuonorosso
    se lo metti nell'header fai prima e lo metti in un solo punto..
    () Non svevo letto la tua risposta...
    Che header? Nei file tpl il php non viene compilato
    verifica regole firma

  25. #25

    Data Registrazione
    Apr 2005
    Messaggi
    155
    Ascolta me....mettili dove ti ho detto io prima che funziona!

    Poi quando trovi un'altro metodo poi cambi...


  26. #26
    Utente Premium L'avatar di Tuonorosso
    Data Registrazione
    Mar 2005
    Località
    Lecco
    Messaggi
    1,997
    vi sbagliate,
    io ho messo tranquillamente del php alla fine dell'overall_footer.tpl

    basta mettere


    <?php

    il tuo script

    ?>


  27. #27
    User
    Data Registrazione
    Jan 2005
    Località
    Ghiacciaio Marittima
    Messaggi
    114
    Mi ricordo che tempo fa provai a mettere del codice php in una pagina tpl, mi sembra proprio nell'overall_footer ma questo mi appariva non compilato. Comunque posso riprovare

    Ma con il codice che hai messo tu, sugnu beddu, ti arriva una email per ogni pagina visitata?

    Grazie.
    verifica regole firma

  28. #28
    User
    Data Registrazione
    Jan 2005
    Località
    Ghiacciaio Marittima
    Messaggi
    114
    Wow, adesso mi sembra che il codice php inserito nel file tpl venga compilato. Beh aspetto le email del passaggio del googlebot.

    Probabilmente l'altra volta non mi funzionavano perchè il codice php serviva per fare delle cose sul database

    Se funziona, vi ringrazio. Ho usato il codice messo da sugnu beddu
    verifica regole firma

  29. #29

    Data Registrazione
    Apr 2005
    Messaggi
    155
    Brrrravo!!




    P.S. Ma che siti hai?...x curiosità.

  30. #30
    User
    Data Registrazione
    Jan 2005
    Località
    Ghiacciaio Marittima
    Messaggi
    114
    www.skiforum.it
    Ho messo il codice già ieri ma non mi è arrivata nessuna email, nonostante dall'admin panel abbia beccato il googlebot già diverse volte
    verifica regole firma

  31. #31
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    40,078
    Visita il canale Youtube di Giorgiotave
    Citazione Originariamente Scritto da Tuonorosso
    vi sbagliate,
    io ho messo tranquillamente del php alla fine dell'overall_footer.tpl

    basta mettere


    <?php

    il tuo script

    ?>

    Ci stavo pensando oggi e mi sono detto: ma che cretino che sono gli ho suggerito di metterlo in mille file invece basta uno

    Chiedo venia per il suggerimento peggiore
    Giorgio Taverniti Blog. FastForward: su YouTube ogni Martedì (SEO) e Giovedì (Social)!

    Tutta la SEO in 23 ore: 9 diversi moduli tematici, 34 lezioni, questo è il Videocorso SEO del 2017!


  32. #32
    User L'avatar di deste
    Data Registrazione
    Mar 2005
    Località
    Trezzo Sull'Adda
    Messaggi
    261
    Segui deste su Twitter
    anche a me non arriva alcuna email

  33. #33
    User
    Data Registrazione
    Mar 2005
    Località
    Roma
    Messaggi
    387
    a me funziona perfettamente

    avessi voglia potrei creare anche la versione con un database, soltanto che questo script fa solo un controllo sull'agent e non sull'ip, perché altri lo fanno anche sull'ip ? ci sono bot ke si spacciano per google in giro?
    verifica regole firma

  34. #34
    User
    Data Registrazione
    May 2005
    Messaggi
    10
    Ciao a tutti, sono nuovo.
    Ho trovato il forum cercando una soluzione per piazzare una checkbox in una pagina php, e poi ho trovato questa discussione interessante...

    Quale dei due codici proposti utilizzate voi?
    Io ho usato il secondo e più semplice... e l'ho messo nell'index.php in questo modo, propio in cima:

    <?php
    /**
    * @version $Id: index.php,v 1.41 2004/09/23 23:09:23 rcastley Exp $
    * @package Mambo_4.5.1
    * @copyright (C) 2000 - 2004 Miro International Pty Ltd
    * @license http://www.gnu.org/copyleft/gpl.html GNU/GPL
    * Mambo is Free Software
    */

    if(eregi("googlebot",$HTTP_USER_AGENT))
    {
    if ($QUERY_STRING != "")
    {$url = "http://".$SERVER_NAME.$PHP_SELF.'?'.$QUERY_STRING;}
    else
    {$url = "http://".$SERVER_NAME.$PHP_SELF;}
    $today = date("F j, Y, g:i a");
    mail("you@youremail.com", "Googlebot detected on http://$SERVER_NAME", "$today - Google crawled $url");
    }

    /** Set flag that this is a parent file */
    define( '_VALID_MOS', 1 );

    E' corretto? Funge così?
    Non ho ben capito la differenza tra i due codici proposti, questo manda una mail e l'altro salva tutto in un file di testo, è solo questa la differenza?
    Ciao!
    MetalZena - Il portale genovese sulla musica rock hard rock e metal.

  35. #35
    User
    Data Registrazione
    Mar 2005
    Località
    Roma
    Messaggi
    387
    il codice da te postato riconosce solo google, quello che sta qualche pagina dietro riconosce tutti i bot, direi che decisamente meglio
    verifica regole firma

  36. #36
    User
    Data Registrazione
    May 2005
    Messaggi
    10
    Aaaa, ma l'altro come si usa? Cioè in che file e posizione bisogna metterlo?

    Grazie per la risposta cmq.
    MetalZena - Il portale genovese sulla musica rock hard rock e metal.

  37. #37
    User
    Data Registrazione
    Mar 2005
    Località
    Roma
    Messaggi
    387
    basta che lo copi un file esterno e poi fai un include in tutti quelli che ti servono.

    o altrimenti fai come per l'altro e lo metti in cima alla index. così facendo cmq ti avvisa solo quando il bot passa sulla index.
    verifica regole firma

  38. #38
    User
    Data Registrazione
    May 2005
    Messaggi
    10
    Scusami, sono piuttosto inesperto di php...
    Un include cioè? Puoi spiegarmi la sintassi e dove va piazzato nel corpo delle pagine (tipo nell'head...) ?
    MetalZena - Il portale genovese sulla musica rock hard rock e metal.

  39. #39
    User
    Data Registrazione
    May 2005
    Messaggi
    10
    Rieccomi, mi serve qualche info sul bot che ha postato TuonoRosso a pagina 1 e di cui questo è uno spaccato di codice:

    Codice:
    pagina 1:
    <?php
    /* ------------------------------------------------------------ */
    /* Spider-Sense */
    /* Detects bot activity and alerts you to their presence */
    /* By Shawn Raloff
    Io ho messo tutto quello che c'è nel primo riquadro in un file chiamato spider-sense.php e quello nel secondo quadrato in un altro file spider-sense.dat è corretto?
    Poi nell'index ho scritto: include( 'spider-sense.php' );

    Però mi da un errore... è giusto fare così?
    MetalZena - Il portale genovese sulla musica rock hard rock e metal.

  40. #40
    User
    Data Registrazione
    Mar 2005
    Località
    Roma
    Messaggi
    387
    è giusto se i due file li metti nella stessa directory in cui metti l'include, altrimenti devi dargli una posizione diversa, o altrimenti vai nel primo forum dove ho postato il codice modificato
    verifica regole firma

  41. #41
    User Attivo
    Data Registrazione
    Dec 2004
    Località
    abito sulla luna e ogni volta che mi telefono è un'interrurbana
    Messaggi
    2,413
    sto modificando lo script che uso per fare in modo che al posto che inviare una mail registri i dati in una tabella (mysql) in modo da poter avere i dati in un report di più agevole consultazione.

    quando cominci ad avere un po' di siti con qualche centinaio di pagine l'uno e ti fai mandare una mail per ogni bot... praticamente passi la giornata a cancellare email ed arrivi al punto di disabilitare lo script per la disperazione.

    invece quelle info sono importantissime

  42. #42
    User
    Data Registrazione
    May 2005
    Messaggi
    10
    Io però credevo che non si vedesse la modifica all'index (è qui che ho messo l'include), invece appare uno spazio vuoto in cima alla pagina e ho scoperto che selezionandolo si scoprono delle scritte che hanno lo stesso colore dello sfondo e che riportano un errore.

    Warning: eregi(): REG_EMPTY in /web/htdocs/www.metalzena.it/home/spider-sense.php on line 27

    Alla riga 27 trovo:
    if( eregi($agent,$bot) )
    {
    mail("$email", "$agent detected on $domain", "$agent has crawled $page on $domain");
    }

    Ma non capisco dov'è il problema se dite che è giusto. Tra l'altro i file sono nella stessa directory dell'ndex.php
    MetalZena - Il portale genovese sulla musica rock hard rock e metal.

  43. #43
    User
    Data Registrazione
    May 2005
    Messaggi
    10
    Scusate i post ravvicinati, ma ho modificato il bot trovato a pagina 1 aggiungendogli la funzione per mandare i report per mail.

    Ecco il codice

    <?

    $agents = array(
    "ultraseek" => "Infoseek",
    "sidewinder/" => "Infoseek",
    "ia_archiver" => "Alexa",
    "arianna.iol.it" => "Arianna",
    "ask jeeves" => "Ask jeeves",
    "fast-webcrawler/" => "Fast",
    "googlebot-" => "Google Immagini",
    "googlebot/" => "Google",
    "mercator-" => "Altavista",
    "scooter/" => "Altavista",
    "scooter-" => "Altavista",
    "arachnoidea" => "Arachnoidea",
    "yhaoo" => "Yahoo",
    "slurp" => "Inkomi",
    "gulliver/" => "NorthernLight",
    "lycos_spider_(t-rex)" => "Lycos",
    "architextspider" => "Excite",
    "libwww-perl/" => "Excite",
    "almaden.ibm.com" => "Ibm Resarch"
    );

    $filename = "motori.txt";
    $ua = $_SERVER["HTTP_USER_AGENT"];
    $page = $_SERVER['PHP_SELF'];


    foreach ($agents as $ag => $motore) {
    //print date(" d-M-Y H:i ") . " \t" . $motore . " \t" . $ag . " \t" . $page ."\n";
    if (strpos (strtolower (" " . $ua), $ag) > 0) {
    $fp = fopen($filename, "a");

    if ($fp) {
    fwrite($fp, date(" d-M-Y H:i ") . " \t" . $motore . " \t" . $ag . " \t" . $page ."\n");
    fclose($fp);
    break;
    }
    }
    $today = date("F j, Y, g:i a");
    mail("gabryk91@hotmail.com", "$motore detected on $page", "$today - $motore è passato su $page");
    }

    ?>


    Penso che poi aggiungerò gli altri spider elencati dal bot in 2 file.
    MetalZena - Il portale genovese sulla musica rock hard rock e metal.

  44. #44
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    40,078
    Visita il canale Youtube di Giorgiotave
    Gabryk, bravo!
    Giorgio Taverniti Blog. FastForward: su YouTube ogni Martedì (SEO) e Giovedì (Social)!

    Tutta la SEO in 23 ore: 9 diversi moduli tematici, 34 lezioni, questo è il Videocorso SEO del 2017!


  45. #45
    User
    Data Registrazione
    May 2005
    Messaggi
    10
    Gente funziona anche troppo!
    Arrivano ventine di email al minuto...
    MetalZena - Il portale genovese sulla musica rock hard rock e metal.

  46. #46
    User
    Data Registrazione
    Mar 2005
    Località
    Roma
    Messaggi
    387
    non ho ben capito dove sta la differenza? ci metti la data?

    bè cmq nn lho fatto in sql perché per le stats uso phpstats anche se con i motori non mi pare funzionare granché bene, almeno per il forum : |

    se ho tempo e voglia metto su qualche stats dedicata ai bot
    verifica regole firma

  47. #47
    User
    Data Registrazione
    May 2005
    Messaggi
    10
    No, la differenza è che prima quel bot non mandava mail, ma archiviava tutto su txt. Adesso fa entrambe.
    MetalZena - Il portale genovese sulla musica rock hard rock e metal.

  48. #48
    User Newbie
    Data Registrazione
    May 2006
    Messaggi
    6
    Citazione Originariamente Scritto da Gabryk
    Gente funziona anche troppo!
    Arrivano ventine di email al minuto...
    Sì, è perchè ti è sfuggita una parentesi, il codice corretto dovrebbe essere:

    foreach ($agents as $ag => $motore) {
    //print date(" d-M-Y H:i ") . " \t" . $motore . " \t" . $ag . " \t" . $page ."\n";
    if (strpos (strtolower (" " . $ua), $ag) > 0) {
    $fp = fopen($filename, "a");

    if ($fp) {
    fwrite($fp, date(" d-M-Y H:i ") . " \t" . $motore . " \t" . $ag . " \t" . $page ."\n");
    fclose($fp);
    break;
    }
    $today = date("F j, Y, g:i a");
    mail("gabryk91@hotmail.com", "$motore detected on $page", "$today - $motore è passato su $page");
    }
    }

    ?>

    ciao, ciao

  49. #49
    Utente Premium L'avatar di vinarcid0810
    Data Registrazione
    Oct 2006
    Località
    catania
    Messaggi
    400
    Segui vinarcid0810 su Twitter Aggiungi vinarcid0810 su Google+ Aggiungi vinarcid0810 su Facebook Aggiungi vinarcid0810 su Linkedin
    ragazzi io ho integrato lo script postato da Tuonorosso
    nel mio footer però ho un problem

    <?php
    /* ------------------------------------------------------------ */
    /* Spider-Sense */
    /* Detects bot activity and alerts you to their presence */
    /* By Shawn Raloff */
    /* http://www.side2.com */
    /* ------------------------------------------------------------ */

    /* ---------- You must set these variables ---------- */
    $domain = "http://vinarcid0810.altervista.org/";
    $email = "vinarcid1@virgilio.it.it";


    /* ---------- No need to edit beyond this point ---------- */
    $bot = $_SERVER['HTTP_USER_AGENT'];
    $page = $_SERVER['PHP_SELF'];

    /* ---------- Look for bots ---------- */
    ini_set("sendmail_from",'vinarcid1@virgilio.it.it' );

    //mail("$email", "aaaa", "aaa");
    $myFile = fopen("spider-sense.dat","r");
    while(!feof($myFile))
    {
    $myLine = chop(fgets($myFile, 255));
    list($agent,$url) = split("[|]", $myLine);
    if( eregi($agent,$bot) )
    {
    mail("$email", "$agent detected on $domain", "$agent has crawled $page on $domain");
    }
    }

    fclose($myFile);

    //echo "Powered By Side2.com";
    ?>

    la pagina footer viene richiamata da tutte le altre pagine del sito
    mettendo nello script l'indirizzo del sito
    http://vinarcid0810.altervista.org

    nella home nn ho problemi mentre nelle altre mi da errore

    Fatal error: Maximum execution time of 15 seconds exceeded in /membri/vinarcid0810/footer.php on line 52

    cosa devo fare lo devo integrare in ogni singola pagina?????

  50. #50
    User
    Data Registrazione
    Mar 2006
    Messaggi
    130
    Scusate la domanda... fare un analisi del log no?... io credo che questo genere di operazione/analisi vada fatta offline perche' su un sito molto visitato diventa troppo pesante e rischia di rallentare il server...

    bho...

+ Rispondi alla Discussione
Pagina 1 di 2 12 UltimaUltima

Tag per Questa Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB è Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] è Attivato
  • Il codice [VIDEO] è Attivato
  • Il codice HTML è Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.