Link da siti strani a pagine non esistenti del mio sito
Ciao,
ho notato nel webmastertool di ricevere molti link da alcuni siti molto strani.
Questi link sono in div nascosti e puntano a pagine del mio sito che non esistono, o meglio, che io non ho creato e che fisicamente non sono sul mio server.
Però se le digito, appaiono! Com'è possibile e come posso fare per eliminarli?
Ho già modificato il file .htaccess ma temo non sia sufficiente..
un esempio javiermiyares. com/2009/10/31/new-york-street-ad-takeover-cogweb-archive-public-ad-campaign/ riga 113
Link
Collegamento Ipertestuale
Server
Ogni coppia hardware-software che fornisce appunto servizi ad utenti chiamati tradizionalmente clienti (clients) attraverso una rete.
E' possibile che questi link siano tentativi di danneggiarti.
Il tuo sito comunque non è configurato bene perchè in questi casi dovrebbe rispondere un 404 per le pagine che non esistono invece risponde 301 (pagina spostata permanentemente). Questo non è corretto perchè stai dicendo al motore: quella pagina esisteva ma non è più lì, invece si trova qui (e mandi in home se non sbaglio).
1) Crei una pagina di errore dove mandare chi clicca su una pagina non esistente. In questa pagina puoi per esempio inserire un elenco delle principali categorie del sito e/o un invito a contattarti (con form etc)
2) Tecnicamente aggiungi nel file .htaccess questa direttiva
dove la parte finale indica il percorso della pagina di errore (con il nome che vuoi tu, io ho messo 404.html ma il nome lo decidi tu)
3) rimuovi i 301 che hai fatto artificiosamente per gestire queste pagine non esistenti
In questo modo i crawler sapranno che queste pagine non esistono e non le indicizzeranno.
HTML
HTML (HyperText Markup Language) nasce per mano di Tim Berners-Lee, il costruttore del primo webserver e del primo browser, come estensione di SGML (Standard Generalized Markup Language) nel 1990.
Crawler
Programma in costante circolazione nel Web (World Wide Web) alla ricerca di dati, metadati e relativi aggiornament
Ho rimesso la 404, il problema è che alcune pagine, anche se non esistono fisicamente sul mio hosting, vengono visualizzate lo stesso!
Cosa potrebbe essere?
Hosting
Servizio che consiste nell'allocare su un server web le pagine di un sito web, rendendolo cosí accessibile dalla rete internet.
Tu lamenti il fatto di ricevere link da strani siti a pagine del tuo dominio (pagine che non esistono).
Tipo quella che indichi nel primo messaggio:
ecogiochi (dot) it (slash) watch (slash) skyline-download
e lamenti il fatto che, queste pagine che non esistono, vengano poi indicizzate da Google.
Io ti rispondo che il problema risiede nella probabile cattiva configurazione iniziale del tuo spazio web che *non* ha restituito dei 404 a Google che ha seguito quei link farlocchi quando sono apparsi (e quindi li ha inseriti nell'indice).
Se una pagina non esiste il server dovrebbe restituire 404 così i motori non la indicizzano (e sperabilmente poi le deindicizzano).
Invece nel tuo caso queste pagine, che non esistono e pertanto dovrebbero dare 404, ora restituiscono 301 verso la Home (immagino sia un'operazione postuma che hai fatto tu).
Tu dici di aver fatto delle modifiche ma se io provo l'URL di cui sopra con un qualsiasi tool (come web - sniffer (dot) net), invece di restituire 404 il tuo url mi restituisce un:
Status: HTTP/1.1 301 Moved Permanently
verso la home ...
Google
Google (pronuncia gùgol) è un motore di ricerca per Internet.
Link
Collegamento Ipertestuale
URL
(Uniform Resource Locator) è un indirizzo di una risorsa in Internet
Server
Ogni coppia hardware-software che fornisce appunto servizi ad utenti chiamati tradizionalmente clienti (clients) attraverso una rete.
http
Protocollo progettato per migliorare la qualità e ottimizzare le prestazioni di sistemi distribuiti per la collaborazione e la condivisione delle informazioni. Utilizzato anche come protocollo generico nelle connessioni internet che devono attraversare strati software quali proxy e gateway.
Hai ragione, ho sistemato il file .htaccess e ora restituisce un 404.
Ma la mia domanda è: questi link (numerosissimi) che arrivano da siti strani, anche spam/hack, e puntano a pagine inesistenti, mi posssono penalizzare nelle serp?
Serp
SERP è un acronimo che sta appunto per "Search Engines Results Page" (pagina dei risultati del motore di ricerca).
Link
Collegamento Ipertestuale
Spam
Lo Spam, nei termini informatici (in altri significa carne in scatola) lo si può definire in modo generale come un messaggio non desiderato, molte volte è un messaggio pubblicitario.