• User Newbie

    Google newscrawler e firewall

    Sto uscendo pazzo con una anomalia di Google News.
    Google indicizza puntualmente tutti i nostri contenuti (quasi 100k pagine indicizzate fin'ora) mentre Google News sembra operare una selezione arbitraria, scegliendo tra l'altro spesso e volentieri i contenuti peggiori.
    Ho scritto al supporto di Google News per capire se ciò fosse dovuto ad una "cattiva" progettazione del sito o disposizione degli articoli e invece con grande sorpresa ecco la risposta:

    La ringraziamo per la segnalazione. Dopo alcune ricerche, abbiamo riscontrato che Google News ha delle difficoltà con l'indicizzazione di alcuni dei suoi articoli poiché qualcosa sembra bloccare l’accesso al nostro sistema di rilevamento informatico. Per poter includere tutti i suoi articoli su Google News, il nostro crawler deve essere infatti in grado di esaminare ciascun articolo.
    Le consigliamo di controllare che i suoi firewall siano configurati correttamente e che non ostacolino l'accesso al suo sito da parte del nostro crawler. Se riuscisse ad apportare le modifiche necessarie al suo sito Google News dovrebbe automaticamente indicizzare tutti i contenuti del suo sito.

    Non soddisfatto ovviamente della risposta ho chiesto ulteriori dettagli su come tali utenti possano aver risolto. Ed ecco la seconda risposta:

    La ringraziamo per averci contattato nuovamente. Altri utenti ci hanno informato di avere risolto problemi simili riconfigurando alcune applicazioni dei firewall usati. Le consigliamo di controllare che i suoi firewall siano configurati correttamente e che non ostacolino l'accesso al suo sito da parte del nostro crawler.
    Siamo spiacenti di non poter offrire ulteriore assistenza in merito ed apprezziamo sinceramente l'interesse mostrato verso Google News.

    Altrettanto generica. Vista l'importanza della questione, sono quindi qui per chiedervi se siete tra quei fortunati utenti di cui parla il supporto Google News che sono riusciti a configurare "correttamente" il loro firewall.... :arrabbiato:

    Sito*: www.terninrete.it

    Motori*: Google

    Prima indicizzazione o attività*: No

    Sito realizzato con?*: Asp

    Sitemaps: Si

    Url Rewrite: No

    Chiavi: