• User Newbie

    Log modifica .htaccess e/o robots.txt: posso recuperarlo?

    Ciao a tutti!
    Sono ormai 10 giorni che ho un problema col mio sito (su Wordpress 4.7.3): i file .htaccess e robots.txt vengono automaticamente modificati da un qualcosa (plugin?) almeno ogni giorno.
    Per spiegarmi meglio: il mio file robots.txt normalmente ha questo contenuto:

    User-agent: *
    Sitemap: ...medicinapertutti.altervista.org/sitemap-index.xml
    
    

    ma qualcosa lo modifica in:

    User-agent: *
    **Disallow: /**
    Sitemap: ...medicinapertutti.altervista.org/sitemap-index.xml
    
    

    Per l'.htaccess ho qualcosa di simile (non lo riporto perchè non so se si può).
    Ecco, a me servirebbe qualche plugin o qualunque cosa mi permetta di sapere cosa ha avuto accesso a quei due file.
    Si può fare?

    Grazie!


  • User Attivo

    Ciao i file di log tengono traccia di tutto ciò che viene modificato e quando.

    Attento perchè se nel file htaccess hai qualche regola per proteggere lato sicurezza del sito e trovi delle modifiche, può essere anche legato ad un attacco. Ti consiglio di procedere in questo modo:

    • Analizza il file di log se ne hai accesso;
    • Posta il contenuto del htaccess originale e modificato;
    • Dicci quali plugin hai installato;

    Buona serata


  • User Newbie

    Grazie della risposta!
    Al file di log non ho accesso ma ho già contattato l'host (Altervista) che al momento non rileva nulla di anomalo.
    Invece posso scrivere tutto il resto che è abbastanza lungo ma lo è perchè cerco di non omettere nulla.

    Premetto che prima dell'inizio del problema NON ho modificato nulla nel mio sito (http: //medicinapertutti.altervista.org/) da mesi.
    Ho sempre aggiornato Wordpress (attualmente alla versione 4.7.3) e i plugin installati con tema Altervista Keith (mai cambiato).
    I plugin installati da sempre sono:

    • Coming Soon Page & Maintenance Mode by SeedProd
    • Disqus Comment System
    • Dynamic Widgets
    • Post Type Switcher
    • Redirection
    • Republish Old Posts Pro
    • TinyMCE Advanced
    • Yet Another Related Posts Plugin
    • Yoast SEO

    Descrivo il problema...
    Tutto inizia lo scorso 31 marzo quando, accedendo al pannello di controllo di Wordpress o al sito, compariva il seguente messaggio:

    medicinapertutti.altervista.org ti ha reindirizzato troppe volte.
    Prova a cancellare i cookie.
    ERR_TOO_MANY_REDIRECTS
    
    

    Provai a cancellare i cookie e la cache del sito e del browser, ma senza risultato, finché ripristinai il file .htaccess da un precedente backup che avevo (del 23 marzo).
    Il contenuto dell'.htaccess ripristinato (identico da anni) era il seguente:

    RewriteEngine on
    RewriteCond %{HTTP_HOST} !=medicinapertutti.altervista.org
    RewriteRule (.*) http: //medicinapertutti.altervista.org/$1 [L,R=301]
    # BEGIN WordPress
    <IfModule mod_rewrite.c>
    RewriteEngine On
    RewriteBase /
    RewriteRule ^index\.php$ - 
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule . /index.php 
    </IfModule>
    
    
    # END WordPress
    
    
    # # av:php5-engine
    AddHandler av-php54 .php
    
    

    Tutto sembrava sistemato ma valutando gli accessi nei giorni successivi ho notato un calo progressivo delle visite. Facendo qualche controllo qua e là ho notato che molte pagine del mio sito (normalmente in prima pagina nella SERP Google) erano scomparse. Per scomparse non intendo dire che hanno perso posizioni, magari scalando di pagina, ma proprio scomparse dalla SERP.
    Contestualmente ho trovato errori nella sitemap, ossia dagli strumenti per webmaster di Google leggevo che alcuni URL erano bloccati dal file robots.txt; in più tutti i redirect che nel tempo avevo inserito tramite il plugin Redirection erano scomparsi.

    Ho quindi controllato il contenuto dei suddetti file e ho trovato che il file robots.txt presentava il seguente contenuto (in neretto quello aggiunto automaticamente):

    User-agent: *
    **Disallow: /**
    Sitemap: http: //medicinapertutti.altervista.org/sitemap-index.xml
    
    

    mentre l'.htaccess presentava questo contenuto (in neretto quello aggiunto automaticamente):

    RewriteEngine on
    RewriteCond %{HTTP_HOST} !=medicinapertutti.altervista.org
    RewriteRule (.*) http: //medicinapertutti.altervista.org/$1 [L,R=301]
    # BEGIN WordPress
    <IfModule mod_rewrite.c>
    RewriteEngine On
    RewriteBase /
    RewriteRule ^index\.php$ - 
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule . /index.php 
    </IfModule>
    
    
    # END WordPress
    
    
    # # av:php5-engine
    AddHandler av-php54 .php
    
    
    **RewriteEngine on**
    **RewriteCond %{HTTP_USER_AGENT} ^BadBot [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^EvilScaper [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^Googlebot [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^Googlebot-Image [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^Googlebot-Mobile [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^Mediapartners-Google [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^Yahoo-Blogs [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^msnbot [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^FakeUser **
    **RewriteRule ^(.*)$ http: //all.away/**
    
    

    Ignaro di chi o cosa potesse aver aggiunto il codice che ho messo in grassetto, ho deciso di ripristinare il sito al vecchio backup del 23 marzo (quando il problema non si era ancora presentato).
    Ho quindi cancellato il database (ma non file e cartelle) e ripristinato lo stesso con un dump.
    Il contenuto dei file robots.txt e .htaccess è ovviamente ritornato "normale", ho quindi inviato a Google la nuova sitemap e fatta richiesta di indicizzazione.

    Il giorno dopo sono andato a controllare la situazione e ho trovato che il file robots.txt conteneva:

    
    
    User-agent: *
    **Disallow: /**
    Sitemap: http: //medicinapertutti.altervista.org/sitemap-index.xml
    
    

    mentre l'.htaccess conteneva

    RewriteEngine on
    RewriteCond %{HTTP_HOST} !=medicinapertutti.altervista.org
    RewriteRule (.*) http: //medicinapertutti.altervista.org/$1 [L,R=301]
    # BEGIN WordPress
    <IfModule mod_rewrite.c>
    RewriteEngine On
    RewriteBase /
    RewriteRule ^index\.php$ - 
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule . /index.php 
    </IfModule>
    
    
    # END WordPress
    # # av:php5-engine
    AddHandler av-php5 .php
    
    
    **# av:AntiHotlink**
    **RewriteEngine on**
    **RewriteBase /**
    **RewriteCond %{REQUEST_URI} \.(gif|jpe?g|png)$ **
    **RewriteCond %{HTTP_REFERER} !^$**
    **RewriteCond %{HTTP_REFERER} !^https?: //([a-z0-9\-\.]*)medicinapertutti\.altervista\.org**
    **RewriteCond %{REQUEST_URI} !^\/_altervista_ht\/**
    **RewriteCond %{HTTP_REFERER} !^https?://([a-z0-9\-\.]+)google\.**
    **RewriteRule .*$ http: //hl.altervista.org/split.php?http: //%{HTTP_HOST}%{REQUEST_URI} [R,L]**
    **# AntiHotlink**
    
    **RewriteEngine on**
    **RewriteCond %{HTTP_USER_AGENT} ^BadBot [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^EvilScaper [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^Googlebot [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^Googlebot-Image [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^Googlebot-Mobile [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^Mediapartners-Google [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^Yahoo-Blogs [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^msnbot [NC,OR]**
    **RewriteCond %{HTTP_USER_AGENT} ^FakeUser **
    **RewriteRule ^(.*)$ http: //all.away/**
    
    ```**Addirittura, quindi, l'.htaccess conteneva ancora più direttive!**
    
    Nei giorni successivi ho fatto un sacco di altre prove. Tutte le volte che ripristinavo i file robots.txt e .htaccess, dopo qualche ora me li ritrovavo con quel codice... In più da stamattina ho un ulteriore problema: improvvisamente **scompaiono i titoli delle pagine**. Aprendo un qualunque articolo, il contenuto è presente ma il titolo no. Il titolo scompare anche nell'anteprima degli articoli in homepage.
    
    Ho quin&#8203;di effettuato tutta una serie di prove che non racconto qui per non dilungarmi ancora ma l'ultima prova che ho fatto, la più drastica, quella che pensavo non avesse motivo di fallire, è quella di oggi pomeriggio e che riporto:
    - ho esportato il file XML dei soli contenuti (articoli, pagine, commenti) tramite l'apposita funzione di Wordpress;
    - ho cancellato database, file e cartelle e rifatto **una nuova installazione di Wordpress da zero**;
    - ho modificato solo le impostazioni di base del sito (nome, descrizione, formato data, ecc.);
    - ho configurato il tema Altervista Keith (impaginazione, favicon, ecc.);
    - ho configurato Yoast SEO (che viene installato di base con l'installazione di Wordpress);
    - ho importato il file XML dei soli contenuti (pagine/articoli/commenti);
    - attivato la cache di Altervista;
    - NON ho attivato il pilota automatico nè inserito alcuna pubblicità.
    
    
    Ho praticamente il sito **nella configurazione base con solo gli articoli dentro**.
    
    Tutto questo l'ho completato alle ore 17:50.
    Poco fa ho fatto l'accesso allo spazio web via FTP e ho notato che c'è stata una modifica del file .htaccess alle ore 19:36:27 e del file robots.txt alle 19:35:53. Ovviamente io non ho mai modificato quei file e già sapevo cosa significava... Controllando il loro contenuto ho ritrovato il codice estraneo che ho scritto sopra...
    
    E' passata più di una settimana da quando tutto è iniziato e ormai non so più che fare...
    
    Grazie in ogni caso, anche solo per aver perso tempo a leggere tutto il papiro!
    
    P.S.: faccio l'accesso al sito solo con il mio PC che ho scansionato (ESET Nod32) e risulta pulito. Ho pure cambiato più volte in questi giorni la password di Wordpress e di Altervista.