+ Rispondi alla Discussione
Risultati da 1 a 4 di 4

GUIDA: come usare Google Spreadsheet per fare scraping a fini SEO

Ultimo Messaggio di Giorgiotave il:
  1. #1
    User L'avatar di SEOProf
    Data Registrazione
    Jun 2019
    Località
    Bergamo
    Messaggi
    13
    Aggiungi SEOProf su Facebook Aggiungi SEOProf su Linkedin

    GUIDA: come usare Google Spreadsheet per fare scraping a fini SEO

    Ho deciso di scrivere questa breve guida (ma a mio avviso utile) per rispondere ad una esigenza particolare che ho riscontrato parlando con chi si occupa di SEO da qualche anno e non è più un principiante.

    Poniamo il caso di avere già una lista pronta di 300 URLs e aver bisogno di conoscerne il tag <title> per fare le nostre considerazioni.

    Per svolgere questo compito, abbiamo sostanzialmente 3 opzioni:
    1) Usare un servizio API esterno (probabilmente a pagamento)
    2) Creare il nostro web scraper in Python o Go
    3) Senza saper programmare né acquistare crediti per utilizzo di API, possiamo scrivere una semplice formula in Google Spredsheet.

    Analizzando la terza soluzione, basta usare una XPath query (in questo caso //title) all'interno della formula:
    =IMPORTXML(A2;"//title")
    Riporto un esempio di uso di questa formula applicata a 2 URLs.



    Utilizzando le XPath queries ci sono moltissimi altri utilizzi possibili in chiave SEO.

    Potremmo voler recuperare la meta description e sarà sufficiente usare la seguente formula:

    =IMPORTXML(A2;"//meta[@name='description']/@content")
    Se invece ci servisse il tag H1, basterà usare:
    =IMPORTXML(A2;"//h1")
    E se volessimo estrarre un tag particolare, quale query andrebbe usata?

    Ci viene in aiuto Google Chrome, perché basta selezionare l’elemento che ci interessa nella pagina e poi andare su “Ispeziona elemento > Clic con tasto destro > Copia > Copia XPath”. In questo modo abbiamo davvero una grande flessibilità nell’estrare quello che ci interessa dalla pagina.



    Spero che queste funzionalità possano facilitare il lavoro SEO di qualche lettore se non ne fosse ancora a conoscenza.
    SEOProf.it - Nuovi Strumenti SEO e corso 2020 gratuito.

  2. #2
    Moderatore L'avatar di Sermatica
    Data Registrazione
    Oct 2016
    Località
    Maleo
    Messaggi
    4,381
    Aggiungi Sermatica su Facebook
    Ciao
    grazie per gli ottimi spunti, ma l'opzione 4? Il fantastico coltellino svizzero Screaming Frog? Basta incollare le url ed escono tutte le info che servono e non solo il Title.
    MODHelp Center: consigli per il tuo progettoMODE-Commerce
    Consulente con P.IVA: SEO / SEM / Google Business / Amazon - Sermatica.it


  3. #3
    User L'avatar di SEOProf
    Data Registrazione
    Jun 2019
    Località
    Bergamo
    Messaggi
    13
    Aggiungi SEOProf su Facebook Aggiungi SEOProf su Linkedin
    Screaming Frog è un ottimo software, ma il vantaggio di Google Spreadsheet è di avere tutto nella stessa schermata, senza fare export e import tra software diversi.

    Soprattutto possiamo anche mettere condizioni per vedere a colpo d'occhio se una pagina HTML contiene una determinata keyword e ordinare i risultati, ma si può fare molto molto altro.

    Insomma si può dare spazio alla creatività all'interno di un'unica schermata.

    D'altra parte Screaming Frog è nativamente progettato per il crawling e (per questioni di performance) probabilmente è preferibile nel caso di progetti con migliaia e migliaia di URLs da scansionare.
    SEOProf.it - Nuovi Strumenti SEO e corso 2020 gratuito.

  4. #4
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    42,755
    Visita il canale Youtube di Giorgiotave
    Questa è un'ottima risorsa, grazie

    Dovremmo fare un topic in rilievo per raccoglierle tutte
    Controlla i corsi base di Search On: SEO, Google Ads e Web Analytics.
    Se ti interessa qualcosa di più avanzato ti consiglio il Social Media Strategies e il Search Marketing Connect.

+ Rispondi alla Discussione

Tag per Questa Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB è Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] è Attivato
  • Il codice [VIDEO] è Attivato
  • Il codice HTML è Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.