• User Attivo

    Joomla e Strumenti per i Webmaster di Google

    Ciao a tutti
    al fine di manutenere il mio sito in Joomla e cercare sto navigando tra gli strumenti per i Webmaster di Google ma, una volta entrato nella sezione Aspetto per la ricerca-> miglioramenti HTML mi trovo alcuni errori che non riesco a comprendere come per esempio delle descrizioni dupilicate.
    Andando a vedere nello specifico l'errore vedo che trovo due URL validi che puntano alla stessa pagina ma mentre uno è quello che utilizzo io all'interno del sito l'altro inizia con /component... e punta comunque alla pagina valida.
    Come è possibile?
    devo inserire /component nel robot.txt (in cui è presente /components)?

    Ma soprattutto, per risolvere questo problema cosa devo fare?

    Grazie in anticipo


  • Moderatore

    Ciao PietroR.
    Talvolta Joomla crea queste pagine legate alle estensioni, le riconosci anche dagli url perché nella stringa c'è component.
    Il problema non è tanto il meta duplicato quanto il fatto che questi url non hanno valore per l'utente e quindi sarebbe bene che non venissero rilevati, o almeno che non facessero danni.

    Come trattare queste pagine? Se la pagina è un contenuto duplicato (intendo pagina identica e non pagina che condivide alcuni elementi, come di solito capita con l'url legato al componente) si può scegliere di usare il rel=canonical intervenendo con istruzioni via php tramite una regex. Pro: leggero, non devi installare nulla. Contro: devi smanettare nei file e se non sei esperto non è il massimo dal lato della manutenibilità, ad esempio per gli aggiornamenti.
    Esistono anche plugin, non so se nella fattispecie risolvano il problema ma vale la pena verificare (dovrebbero, comunque).
    Teoricamente potresti anche svuotare il meta description (intendo oltre al rel = canonical), ma penso che la cosa più facile sia usare estensioni.

    Se usi il rel=canonical non mettere il noindex.

    Prima di proseguire, se ti fa piacere avere l'opinione di altri utenti, specifica per piacere quale versione di Joomla hai in uso e se sono installate estensioni SEO/SEF. Sarebbe utile anche che ci mostrassi un paio di coppie di url che ti vengono segnalate (inserisci gli url inattivi sul forum).

    *Francesco *:)


  • User Attivo

    Ciao
    Per prima cosa grazie della risposta. Io utilizzo Joomla 2.5 e come componente SEO uso quello installato di base. In che senso url inattivi?
    Purtroppo ho scoperto che l'url "indesiderato" punta comunque alla pagina che utilizzo.
    Se può andare ti posto una coppia di questi url, dimmi te.
    Grazie


  • Moderatore

    Intendevo inattivi qui sul forum, toglici http e www.
    Sì, se li posti gli do un occhio. :wink3:


  • User Attivo

  • Moderatore

    Ciao Pietro.
    Ti consiglio di procedere con l'installazione di Metagenerator, un plugin che gestisce il rel=canonical per il com_content (articolo, categoria e view).
    Lo scarichi da qui per Joomla 2.5: shikle.com/metagenerator.htm
    Puoi anche disabilitare le altre funzioni, l'importante è che attivi (Yes) l'opzione Add canonical url meta tag (nella finestra del plugin in basso, la penultima voce).

    In questo modo Google dovrebbe capire la situazione, anche se potrebbe servire tempo.

    Tienici aggiornati. 😉

    Francesco


  • User Attivo

    Ciao
    grazie per l'info. Ho installato il plugin con questa configurazione, visibile a questo link

    studiofontanabertoli.it/varie/configurazione.png

    può andare?
    Ma soprattutto posso "svegliare" Google in qualche modo oppure ci pensa automaticamente lui?
    Grazie

    Pietro


  • Moderatore

    Ciao Pietro.

    Se non hai il meta name keywords e il meta name description, Metagenerator provvede a inserirli estraendoli dal testo, una modalità che a me non piace.
    Sul meta description il problema non si pone se provvedi tu a inserirlo, cosa che dovresti già fare (nelle pagine che mi hai mostrato c'era).
    Sul meta keywords, se non vuoi usarlo (e io ti consiglio di non usarlo) imposta a 0 (zero) le voci minimum length e max number of keywords.

    Frequenza e profondità di scansione le decide Google. Probabile che "si svegli" prima se tu aggiorni frequentemente il tuo sito, sia aggiungendo nuovi contenuti sia modificando gli esistenti; poi condividi i link e aggiorna la sitemap, che sottoporrai di nuovo tramite Strumenti di Webmaster.

    Verifica il sorgente di quegli url, quel che conta è che ci siano i *rel = canonical *verso le pagine "originali".

    Purtroppo vedo che Metagenerator risolve solo per alcuni tipi di pagine. Questa coppia ad esempio non viene risolta:
    studiofontanabertoli.it/component/content/article/13-team/24-riccardo-quarenghi.html
    studiofontanabertoli.it/team/13-team/24-riccardo-quarenghi.html

    In verità è una tripla, perché la pagina "originale" dovrebbe essere:
    studiofontanabertoli.it/team/13-team/24-riccardo-quarenghi.html

    Nota che nel sorgente del primo url c'è questa riga:

    
    <link href="http://www.studiofontanabertoli.it/component/content/article/13-team/24-riccardo-quarenghi.html" rel="canonical" />
    
    

    ma si tratta di errato funzionamento, in quanto la riga da stampare nel head è:

    
    <link href="http://www.studiofontanabertoli.it/13-team/24-riccardo-quarenghi.html" rel="canonical" />
    
    

    Se puoi testa altri url e segnala in questo topic le coppie per le quali il rel=canonical non funziona correttamente.
    Se sviluppiamo soluzioni le trovi qui. 🙂

    Francesco


  • Moderatore

    C'è qualcosa che non capisco, persistono troppi problemi ed è strano perché su un altro sito il plugin mi funziona con questa tipologia di url.
    Così non va e rischia di fare danni, disabilitalo.

    Ho visto anche che questo url:
    studiofontanabertoli.it/component/content/category/index.php?option=com_content&view=article&id=24:lo-staff&catid=13:team

    presenta il solito link con rel = canonical errato:

    
    <link href="http://www.studiofontanabertoli.it/component/content/article/13-team/24-riccardo-quarenghi.html" rel="canonical" />
    
    

    Ho anche verificato che il link che io chiamo "originale" - studiofontanabertoli.it/13-team/24-riccardo-quarenghi.html - è sprovvisto di rel = canonical.

    Per una soluzione parziale puoi redirezionare questi tipi di url:
    studiofontanabertoli.it/team/13-team/24-riccardo-quarenghi.html
    studiofontanabertoli.it/component/content/article/13-team/24-riccardo-quarenghi.html

    a questo: studiofontanabertoli.it/13-team/24-riccardo-quarenghi.html

    mediante un'istruzione tramite htaccess o php. Questo non risolve tutti i problemi ma risolve queste tipologie di url.

    Francesco


  • User Attivo

    Ciao
    Ho disabilitato il plugin, grazie delle dritte.
    Tra l'altro non ho ancora capito il motivo per cui si sono generati questi doppioni (che ovviamente non compaiono nella mia sitemap). C'è un modo per evitare di farli in futuro?Io in questo momento i link li ho fatti tramite la maschera di joomla in cui, quando inserisco un link, apro i miei contenuti, vado nella categoria desiderata e scelgo l'articolo.

    Ma il redirect lo faccio tramite componenti->Redirect, può andare bene?

    Grazie
    Pietro


  • Moderatore

    ... non ho ancora capito il motivo per cui si sono generati questi doppioni ...

    Alcuni url sono inevitabili, come le query string, che sono potenzialmente infinite.

    Per altri la responsabilità è di Joomla, nel senso che per come è implementato genera di suo questi url legati ai componenti. E questo tra l'altro è uno dei problemi dibattuti anche su questo forum nella sezione Joomla: la difficoltà di reperire un unico plugin che, installato con un clic, risolva l'80% dei problemi nell'80% dei casi, che è poi quello che accade ad esempio con i 2/3 principali plugin SEO/SEF di WordPress. Magari le percentuali non sono queste ma rendono l'idea della necessità di un contributo che renda più friendly una parte della SEO relativa al CMS.

    In altri casi può dipendere dalla configurazione (una direttiva nell'htaccess, un'estensione in conflitto, un file modificato, ...).

    ... il redirect lo faccio tramite componenti->Redirect ...

    Va bene se il plugin è attivo e se non hai altri plugin per il redirect che vanno in conflitto.
    Considera però che quel componente non ti fa scrivere regex, serve a reindirizzare il singolo url verso un altro url.
    Per risolvere il problema di singoli url va bene, ma non risolvi su tutti gli url di una stessa tipologia.

    Se vuoi risolvere su tutti gli url di una stessa tipologia, ad esempio tutti gli url con /component/content/article/13-team/titoloarticolo verso /13-team/titoloarticolo, usa una direttiva htaccess oppure procedi via php. Se preferisci non toccare i file di Joomla vai via htaccess. Se vuoi una mano a scrivere le direttive, posta qui la domanda (cioè indica quali url vuoi reindirizzare e verso quali), oppure chiedi nella sezione http://www.giorgiotave.it/forum/mod-rewrite-e-tecniche-di-url-redirect/

    Per la tipologia indicata sopra, se ti serve un aiuto ti posto qui la riga da inserire. 🙂

    Francesco


  • User Attivo

    Grazie della risposta.
    Beh se riesci a darmi qualche dritta per la modifica dell'htaccess te ne sarei grato, sinceramente non l'ho mai fatto e non saprei da che parte girarmi.
    Quindi, in caso di nuovi siti web consiglieresti Wordpress piuttosto che Joomla?


  • Moderatore

    Ciao Pietro.
    Appena riesco ti posto le istruzioni qui.

    Per me Joomla funziona bene, ma in fase di realizzazione occorre fare attenzione a tante cose, perché poi è più difficile intervenire dopo un po' di tempo.
    È mia opinione, ma magari c'è chi la pensa diversamente, che WordPress sia più facile per chi è alle prime armi oppure per chi non riesce a dedicare sufficiente tempo alla configurazione. Per capirci, un blogger con poche nozioni da webmaster riesce a fare il suo bel sito in WP, mentre in Joomla incontra più difficoltà. La scelta sta a te, io li uso entrambi e trovo Joomla addirittura superiore per potenzialità, ma lato utente e per chi ha meno tempo a disposizione WP facilita la vita.

    Sul confronto tra Joomla e WordPress, se ti interessa ne abbiamo parlato qui: http://www.giorgiotave.it/forum/joomla/217592-joomla-puo-essere-una-piattaforma-di-blogging-alternativa-wordpress.html

    A più tardi, :smile5:

    Francesco


  • User Attivo

    Perfetto leggerò sicuramente il confronto.
    Attendo le istruzioni.
    Grazie


  • Moderatore

    Ciao Pietro.
    Prova nell'htaccess queste istruzioni RedirectMatch 301 e Redirect 301 da aggiungere in coda:

    
    RedirectMatch 301 /component/content/article|category(?!/team)(?!/index)/(.*) http://www.studiofontanabertoli.it/team/$1
    RedirectMatch 301 /component/content/article|category(?=/team)/(.*) http://www.studiofontanabertoli.it/$1
    Redirect 301 /13-team.html http://www.studiofontanabertoli.it/team/13-team.html
    
    

    Una volta salvato l'htaccess fai qualche prova per verificare se i redirect sono corretti.

    (Nota: per trovare gli url ho provato a lanciare Visual SEO Studio ma dice che il tuo robots lo blocca, a me non sembra. Comunque non ci sono riuscito, non so se questo blocco dipenda da me, dal software oppure sia volontario.)

    Restano fuori alcune situazioni, come:
    studiofontanabertoli.it/component/content/category/index.php?option=com_content&view=article&id=20:lo-staff&catid=13:team&Itemid=121
    studiofontanabertoli.it/component/content/
    studiofontanabertoli.it/component/content/?view=featured

    Queste secondo me vanno trattate diversamente, voglio prima verificare con Joomla 2.5 e se trovo una soluzione facile te la posto qui.

    Fammi sapere come va. 🙂

    Francesco


  • User Attivo

    Ciao Francesco
    per prima cosa grazie, ho aggiunto questi file in fondo al file .htaccess e re invio subito la sitemap a google, sperando che succeda qualcosa.
    Ti informo che ho provato ad installare Visual SEO Studio (che non conoscevo e che mi studierò) e ad utilizzare la funzione "Esplora un sito" riesco ad esploarare il sito senza che il robots blocchi nulla e,soprattutto, non trovo "url" strani.

    Resto in attesa di eventuali soluzioni con Joomla
    Grazie

    Pietro


  • Moderatore

    Ciao Pietro.

    I redirect 301 per gli altri url prevedono la rimozione della query string e pertanto in .htaccess possono essere fatti con il mod_rewrite, cioè usando le istruzioni RewriteCond e RewriteRule così come ho scritto in questo topic: http://www.giorgiotave.it/forum/mod-rewrite-e-tecniche-di-url-redirect/218875-rimuovere-query-string-e-redirect-301-con-htaccess-e-mod_rewrite.html

    Incolla le istruzioni alla fine del tuo file htaccess e verifica che tutto fili liscio. Considera che a volte le istruzioni non vanno a causa della presenza di altre istruzioni, quindi devi necessariamente provarle sul sito.

    Ti volevo anche dire che ho provato a inserire il numero minimo di redirect 301, cioè per le sole poche url rilevate con problemi. Al di là di questa cosa che abbiamo fatto, un sito in Joomla dovrebbe essere configurato bene e prevedere il rel = canonical sulle pagine con contenuti duplicati, quindi diciamo che abbiamo tamponato.

    Bene per Visual SEO Studio, evidentemente si è trattato di un problema momentaneo.

    Aggiornaci. :smile5:

    Francesco


  • User Attivo

    Perfetto, grazie!
    Per prima cosa mi leggo bene l'articolo e poi vedo di completare ciò che manca senza fare troppi danni e poi vi informo!

    Al di là di questa cosa che abbiamo fatto, un sito in Joomla dovrebbe essere configurato bene e prevedere il rel = canonical sulle pagine con contenuti duplicati, quindi diciamo che abbiamo tamponato.
    Ma i rel = canonical devo inserirli in fase di costruzione della voce di menu?


  • Moderatore

    Ciao Pietro.

    Ma i rel = canonical devo inserirli in fase di costruzione della voce di menu?

    Joomla 2.5 non presenta già nel core questa funzionalità e occorre aggiungere un'estensione.
    Al momento non ne conosco una free che risolve tutte le situazioni, cioè che applica sempre bene il rel = canonical.
    Vediamo se Maurizio Zio Pal può suggerirci qualcosa. :smile5:

    Francesco


  • User Attivo

    Ciao Francesco
    ti informo che alcuni dei problemi sono stati risolti ma questo

    /co​mpo​nen​t/c​ont​ent​/ar​tic​le/​13-​tea​m/2​3-g​ius​epp​e-c​ala​utt​i.h​tml

    /te​am/​13-​tea​m/2​3-g​ius​epp​e-c​ala​utt​i.h​tml

    per esempio no, non dovrebbe comunque essere contenuto nella casistica che mi hai fatto inserire nel .htaccess?
    Grazie