+ Rispondi alla Discussione
Risultati da 1 a 4 di 4

Estrazione URL da variabile

Ultimo Messaggio di massy il:
  1. #1
    User
    Data Registrazione
    Apr 2006
    Messaggi
    34

    Estrazione URL da variabile

    ciao a tutti, io ho una variabile di tipo stringa che contiene il testo di una pagina html, e vorrei estrarre tutti gli url validi presenti in quella pagina utilizzando uno script in php, magari mettendoli in un array...mi sembra di aver capito che si potrebbe usare la funzione preg_match_all ma non ho una grande dimestichezza con le espressioni regolari. Anche se si tratta di una pagina html vorrei estrarre gli url indipendentemente dal tag href, semplicemente estrapolando tutte le stringhe che iniziano per "http://" e che terminano con ".html" o ".htm" o altre estensioni. qualcuno mi sa aiutare? grazie!

  2. #2
    User Attivo L'avatar di massy
    Data Registrazione
    Mar 2006
    Località
    Pico
    Messaggi
    1,020
    Ciao
    ^(http://)([a-zA-Z0-9_\.-])(\.html|\.htm)$

    dovrebbe fare ciò che ti serve.

  3. #3
    User
    Data Registrazione
    Apr 2006
    Messaggi
    34
    uhm ho provato ad inserire l'espressione regolare ma mi da questo errore:

    Warning: preg_match_all(): No ending delimiter '^' found on line 17

    questo è il mio script, la linea 17 è quella della preg_match_all, lo script termina ma non trova nessun url e l'array è vuoto

    $mystring="esempio di stringa con url http://www.miosito.it/a.html http://tuosito.com/index.php";
    $rex = '^(http://)([a-zA-Z0-9_\.-])(\.html|\.htm)$';
    preg_match_all($rex,$mystring,$mth); //inserisco tutte le occorrenze nell'array $mth
    echo '<pre>';
    print_r($mth[0]); //stampo l'array

    forse il forum ha storpiato l'espressione non visualizzando qualche carattere?
    qualcuno mi saprebbe dare una mano? grazie!

  4. #4
    User Attivo L'avatar di massy
    Data Registrazione
    Mar 2006
    Località
    Pico
    Messaggi
    1,020
    Non è il forum... colpa mia :-P

    prova a mettere $rex = "/(http:\/\/[a-zA-Z0-9-_.\/]*[.html|.htm|.php])/";
    sperando sia cià che ti serva


+ Rispondi alla Discussione

Tag per Questa Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB è Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] è Attivato
  • Il codice [VIDEO] è Attivato
  • Il codice HTML è Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.