• User Attivo

    "Il lato oscuro del web"

    Ciao ragazzi,
    scusate il titolo molto affine con un noto album dei Pink Floyd....

    Ma vi chiedo,
    c'è un modo per scoprire i siti che non stati mai indicizzati dai motori e per questo motivo "oscuri"????

    :ciauz:


  • User Attivo

    Se ho capito bene... capire se ci sono dei siti in giro per il web non esistenti nei motori di ricerca o directory? Beh! forse la polizia postale qualche stratagemma lo possiede, ma se esistesse un qualcosa di pubblico credo che avremmo risolto il problema dei siti pedopornografici e di pirateria... ()


  • User Attivo

    @Schiappa said:

    Se ho capito bene... capire se ci sono dei siti in giro per il web non esistenti nei motori di ricerca o directory? Beh! forse la polizia postale qualche stratagemma lo possiede, ma se esistesse un qualcosa di pubblico credo che avremmo risolto il problema dei siti pedopornografici e di pirateria... ()

    No, non volevo arrivare a questo!!!!

    Intendevo anche siti normalissimi!!!! Che però non sono indicizzati 😉


  • Super User

    se ci fosse un elenco, quei siti sarebbero nei motori di ricerca, no? :sbonk:

    cmq, la realtá (meglio, la triste realtá) é che é semplicemente pieno di siti sconosciuti ai motori di ricerca.

    per caritá, spesso é un bene, visto che si tratta di autentiche schifezze, ma il fatto che siano proprio sconosciuti é comunque un fatto che deve far riflettere (in primis i proprietari di quei siti web).


  • User Attivo

    @must said:

    se ci fosse un elenco, quei siti sarebbero nei motori di ricerca, no? :sbonk:

    cmq, la realtá (meglio, la triste realtá) é che é semplicemente pieno di siti sconosciuti ai motori di ricerca.

    per caritá, spesso é un bene, visto che si tratta di autentiche schifezze, ma il fatto che siano proprio sconosciuti é comunque un fatto che deve far riflettere (in primis i proprietari di quei siti web).

    Quoto quanto dici, la morale di questo topic per me è ststa questa. 😄

    Ovviamente chiedevo se c'era un elenco di soli url e non di link agli url

    :ciauz:


  • Super User

    @saayd said:

    Ovviamente chiedevo se c'era un elenco di soli url e non di link agli url

    che differenza pensi possa esserci per Google? ;):)


  • User Attivo

    @must said:

    che differenza pensi possa esserci per Google? ;):)

    Google segue il link e poi lo indicizza. Se inserisco un elenco di **solo testi ** (non link) con indirizzi dei siti in una pagina non indicizzata, non penso questi url compariranno su Google!!!

    😉


  • Super User

    se ci fosse un elenco "ufficiale" di siti sconosciuti ai motori di ricerca, google avrebbe giá messo un ragazzino a scrivere 10 righe di codice per prendere quel testo e trasformarlo in url 😉

    in realtá, un elenco non c'é (mi azzarderei a dire "per definizione"). e non é un caso se google ora é anche mantainer. é l'unico modo che ha per sapere dell'esistenza di domini anche senza che questi vengano linkati o visitati da utenti con google toolbar.


  • User Attivo

    I understand 😄

    Grazie per la tua disponibilità 🙂


  • Super User

    per cosí poco? 🙂

    :ciauz:


  • User Attivo

    Se vuoi levarti la curiosita' scaricati l'elenco mondiale dei siti, credo sia pubblico, forse iana o compagnia bella.

    Con 2 righe di software spiderizzi il robots.txt di ogni dominio e memorizzi tutti quelli che presentano al suo interno:

    User-agent: *
    Disallow: /

    In teoria se anche fossero stati indicizzati in passato ora non dovrebbero piu' comparire nei motori.


    Poi se vuoi divertirti spiderizzi a tua volta tutti quelli che prevedono l'esclusione degli spider, fregandone altamente del loro robots.txt, tanto non ha nessun valore legale (come spesso fanno i motori "seri").

    Poi fai un semplice motore (o ti compri una script base) e sfrutti quel db diverso e "sconosciuto" a tutti gli altri motori, e chi non trova qualcosa altrove magari lo cerchera' da te.

    Questa e' la sottile differenza tra legale e morale. Se la morale la lasci sotto i tacchi, fai presto ad incassare soldi facili, soprattutto sul web.

    Al massimo leva da in casa gli specchi.


  • Super User

    @must said:

    per caritá, spesso é un bene, visto che si tratta di autentiche schifezze, ma il fatto che siano proprio sconosciuti é comunque un fatto che deve far riflettere (in primis i proprietari di quei siti web).

    MUST, ti voglio come capo!!!! :sbonk: :sbonk:

    (nel senso, alcuni dei nostri siti sono "MOLTOPOCO conosciuti" ai mdr)


  • Super User

    @Tambu said:

    MUST, ti voglio come capo!!!! :sbonk: :sbonk:

    (nel senso, alcuni dei nostri siti sono "MOLTOPOCO conosciuti" ai mdr)

    :mmm: non ho mica colto sai :sbonk:


  • Super User

    non era da cogliere 😄 era una constatazione sullo stato dei siti del mio ufficio. se i miei capi la pensassero come te saremmo messi meglio, invece nada. tutto qua 😉


  • Super User

    ah ok 😄

    pensa che ho visto dei cms proprietari dal costo di xx.000 euro fatti completamente in flash + javascript. e zero BL.:sbonk:
    non serve aggiungere altro, no? :impiccato: