• Super User

    TSW sul SEO odierno [parametri nell'url]

    ce l'avrete quasi tutti nei feed, cmq:
    [url=http://blog.tsw.it/seo/seo-piu-facile-o-piu-difficile/]TSW Blog » Blog Archive » SEO: più facile o più difficile?

    mi interessa in particolare la vostra opinione sul primo punto della lista, quello relativo al numero dei parametri. Lo dico perchè nonostante tutti mi dicessero NON METTERE PIU' DI UN PARAMETRO, per esigenze di progetto ho dovuto fare un sito con due parametri, ma è regolarmente su Google in ogni suo anfratto (segnalazione agli spider + sitemap xml + un paio di backlink deboli che potevo mettere io in giro). Cioè non pensavo che google potesse NON indicizzarlo, ma che magari potesse avere "più difficoltà"... invece mi pare proprio di no.

    voi che ne dite?


  • Super User

    la regola credo sia tutt'ora grosso modo valida, e anche in quel post infatti si fa distinzione tra indicizzazione e posizionamento. ad ogni modo, anche io ho notato dei cms (era mambo) senza url rewriting, quindi pieno di parametri, perfettamente indicizzati. certo che ci è voluto più tempo del solito, a parità di PR ricevuto.

    secondo me la parte più importante di quel post è la pubblicità occulta pro-recruiting 😄
    se vivessi ancora lì, manderei pure il CV, figurati 🙂

    p.s. ti ho modificato l'url, che le accentate erano andate a donnine 🙂


  • User Attivo

    Riporto un'esperienza di questi giorni, non c'entra propriamente con la questione parametri, ma credo sia interessante.

    Ho crato in un mio sito una dir, chiamiamola portale/

    Poi nella dir portale/ oltre alla index.html ho messo un'altra pagina, chiamata categoria.html

    Nella pagina portale/index.html sono elencate-lincate le categorie, in questo modo:

    categoria.htm?cani
    categoria.htm?gatti
    categoria.htm?pesci

    ecc ecc

    Di fatto la index linca sempre le (la ??) url categoria.html?variabile

    La pagina categoria.html se non e' seguita dal "?variabile" e' una pagina vuota, senza contenuto (non elenca infatti nessun componente di una categoria.)

    Passa G e tempo un paio di settimane legge le 2 pagine ed assegna il seguente pr:

    portale/ (pr6)
    portale/categoria.html (pr5)
    portale/categoria.html? (pr3)
    portale/categoria.html?variabile-esistente (pr3)
    portale/categoria.html?variabile-inesistente (no pr)

    E' una finezza, ma se si osserva bene e' molto interessante.

    Di fatto non esiste nessun link verso:
    portale/categoria.html (pr5)

    ma solo molti link verso:
    portale/categoria.html?variabile-esistente (pr3)

    Pertanto G riconosce-intercetta categoria.html come pagina "portante" anche se url non lincata direttamente.

    Per capirci se linco tuosito.com/articolo1.htm?sottoarticolo1 passo pr sia a tuosito.com/articolo1.htm che a tuosito.com/articolo1.htm?sottoarticolo1, non so in che proporzione.

    Siccome nel mio caso, per dire, lincavo 1 sola volta ogni articolo1.htm?sottoarticolo_xyz (dove xyz un numero da 1 a 40) ecco che articolo1.htm ha preso 40 volte pr, mentre 1 solo pr (dimezzato??) per ogni sottoarticolo_xyz, da qui pr5 per articolo1.htm e pr3 per i sottoarticoli.


    Puo' darsi che G assegni un valore ad albero, anche se linco il frutto ecco che anche il ramo ed il tronco prendono valore, senza che nessuno lincasse direttamente l'url tronco e' l'url ramo.

    Per questo (azzardo) che url con molti parametri sembrano avere peso basso o nullo, perche' in realta' (nel caso di G) non linco l'url dinamica in modo assoluto, ma e' come se lincassi piu' url in una.


    G considera l'url per quello che e', un valore univoco.

    Nel caso di una url contenente variabili sembra faccia eccezione (in base al ragionamento sopra), e spacca l'url a pezzi assegnando un po' di valore, portato dal link, ad ogni parte "utile" dell'url, in che proporzione non ho idea.


    Non so cosa ne pensino i colleghi, magari ho fatto delle deduzioni sbagliate o risapute, ma certifico in modo assoluto i valori riportati, pr compresi.

    E' la prima volta che vedo una url prendere pr5 senza che nessuno la linchi, ma solo perche' facente parte di url che la contengono.


    Se Gb estendesse anche per le url statiche questo tipo di valutazione, e' come se un domani creassi miosito.com poi creassi miosito.com/1.html, miosito.com/2.html, ecc fino a 100, linco 1 volta da fuori ogni pagina interna meno la index.html (che non avrebbe ne link esterni ne interni) e dopo un mese trovassi che ogni pagina interna ha pr1, mentre la home ha pr6.... home senza un solo backlink.

    Ovvio che avere variabili o non averle e' cosa ben diversa in una url, ed infatti G differenzia tra le 2 situazioni.


  • Community Manager

    Questo lo ha fatto anche con il forum vecchio agoago, assegnando pr alle pagine .php che avevano solo link a .php?

    Secondo le sue politiche per le quali un link di quel tipo è generato automaticamente e quindi in teoria potrebbe avere tantissimi link, lui assegna il PageRank alla pagina pulendola da tutto ritenendola una pagina madre.

    Questo è quello che penso.


  • User Attivo

    @Giorgiotave said:

    Questo lo ha fatto anche con il forum vecchio agoago, assegnando pr alle pagine .php che avevano solo link a .php?

    Secondo le sue politiche per le quali un link di quel tipo è generato automaticamente e quindi in teoria potrebbe avere tantissimi link, lui assegna il PageRank alla pagina pulendola da tutto ritenendola una pagina madre.

    Questo è quello che penso.

    Giorgio, io non usando link dinamici non me ne ero mai accorto, ma tu si e mi confermi che hai potuto verificare lo stesso comportamento sul tuo sito da parte di G.

    Beh, essendo tuo il forum meglio di me sai su cosa vertono il 90% e rotti delle discussioni, questioni pratiche ed utilissime che periodicamente ritornano in auge, sono rare le discussioni solo teoriche, improbabili, a volte al limite dell'assurdo e del no sense.

    Ora qui stiamo dicendo che G, considerando un unico link verso una data url, spacca-divide-fraziona il pr-valore prodotto da quel unico link verso quell'unica url spalmandolo su piu' url nel caso si tratti di una url con variabili al seguito!


    Se tu mi dicessi: se linco "miosito.com/pagina.html?variabile" tutto il valore del link passa a miosito.com/pagina.html (in quanto pagina madre) potrei capirlo, ci sta tranquillamente, ma mi stai confermando che invece il link verso:

    miosito.com/pagina.html?variabile

    porta valore sia a:

    miosito.com/pagina.html

    sia a:

    miosito.com/pagina.html?variabile


    Ma in che proporzione viene assegnato questo valore potenziale?? 50% e 50%?
    E la key link a chi viene attribuita? A tutte e 2 o solo alla url completa di variabile?
    E se le variabili fossero piu' di una?
    E via discorrendo...

    E non potrebbe essere questa la strada per capire se e come e quando usare url a piu' variabili?


    Insomma mi sembra il classico caso dove a forza di cercare pagliuezze si finisce con l'ingnorare i tronchi.


  • Super User

    @agoago said:

    E' la prima volta che vedo una url prendere pr5 senza che nessuno la linchi, ma solo perche' facente parte di url che la contengono.

    Agoago, hai beccato una situazione subdola. 🙂

    I PR3 che vedi sono reali, ovvero calcolati da Google in base ai link.

    Il PR5 della pagina che non riceve link è invece fittizio, mostrato al volo e basato sul PageRank assegnato alla index e sull'URL della pagina.

    Nota che questo fenomeno si manifesta solo in alcune occasioni e che ne esistono di simili. Uno di questi, di facile osservazione, è l'apparente assegnazione di PR alle pagine delle cache di Google.


  • User Attivo

    Ciao all, un dubbio notturno, visto che siamo in sano outing tecnico.

    Un altro effetto curioso è l'incremento del PR mostrato se togli l'ID di sessione dall'url.
    Una pag a PR2 assorbita con ID di sessione, prende PR3 se togli l'ID, anche in un sito in cui praticamente tutte le pagine in SERP sono con url di sessione, quindi con link formalmente evanescenti e volatili. Se togli l'ID di sessione modifichi il PR della pagina verso l'alto.
    SE l'id di sessione è filtrato ai fini della valutazione dei link, come credo ma magari sbaglio, com'è sto fatto che lo ""strumento"" TBPR reagisce se tolgo l'ID di sessione?

    Se facciamo la controprova, tipo
    http://www.microsoft.com/italy/default.aspx
    PR8

    aggiungendoci un id di sessione pescato a caso addirittura in php
    http://www.microsoft.com/italy/default.aspx?PHPSESSID=e22197efed8bdca65
    PR6

    Solo il carattere ?
    http://www.microsoft.com/italy/default.aspx?
    PR6

    ???
    Non me lo spiego, come se ci fosse un PR che insiste sull'URL, fino al primo parametro, e che questo sedimento apparentemente non venga mostrato/passato che in parte, appunto in presenza di parametro. Questo al di la' del fatto che la pagina esista o meno. Capita in presenza del carattere che preannuncia il parametro.... mah.

    Sara' meglio dormirci su, notte.

    Ciao.


  • User Attivo

    @LowLevel said:

    Il PR5 della pagina che non riceve link è invece fittizio, mostrato al volo e basato sul PageRank assegnato alla index e sull'URL della pagina.

    E' esattamente come dici LowLevel, ho controllato ed e' risultato un chiaro pr fittizio, chiaro ora che me lo hai fatto notare 🙂

    Fregato alla grande come un newbie, ma allora la domanda e':

    Capisco che il pr e' fittizio solo perche' come indizio la pagina non risulta nel db di G, ma non risulta proprio perche' nessuno l'ha mai lincata.

    Se la lincassi almeno una volta, cosi' da renderla nota a G, il valore di quella pagina sarebbe unicamente quello derivante da quel link o beneficerebbe anche dei link "intercettati"??

    In teoria solo il link diretto dovrebbe portare valore.

    Questo lo capisco, ma se per caso avessi precedentemente messo un link verso la pagina in questione ora me la troverei nel db di G, ed allora penserei che il suo valore sia realmente un pr5 e non un pr0 o pr1 come in realta' sarebbe se l'avessi lincata solo da una pagina a basso pr.

    Dovrei sbattermi con query su query per rendermi conto che quel pr5 in realta' e' fittizio...

    Perche' pero' G dovrebbe sprecare risorse per calcolare dei pr fittizi?

    Capiamoci. Un conto e' mostrare un pr positivo di una pagina che essendo stata bannata non risulta in serp e non distribuisce valore, un conto mostrare un pr "fittizio" per una pagina in serp che magari linca altre pagine.

    Il primo caso ha una sua logica ben definita, ti dico quale sarebbe il tuo pr reale se solo tu non fossi stato bannato.

    Nel secondo caso invece il buon senso verrebbe meno, ti faccio vedere un potenziale pr, pr prodotto dal calcolo in base alle url dinamiche lincate, url che contengono "te" che sei l'url "madre".


    Sono domande retoriche, vedo-capisco che e' pr fittizio e che molto probabilmente la pagina vale realmente solo in base ai link diretti, non per quelli "intercettati".

    Ma conosco G e so che non si muove mai a caso. Se calcola ed assegna un pr fittizio alla url dinamica madre deve esserci un motivo.

    E se fossero semplici prove di trasmissione?


  • Community Manager

    Io penso il contrario: PR Fittizio ai link dinamici e **PR Reale **alla pagina madre.

    Questo mio ragionamento è l'esatto opposto di quello che dice LowLevel.

    Il mio ragionamento è: come è possibile che un PR Reale venga mostrato in tempo Reale? Scusate il gioco di parole e veniamo all'esempio pratico.

    Forum di Giorgiotave.it prima del cambio board

    gt.it/forum/viewtopic.php PR 5

    gt.it/forum/viewtopic.php?t=1223 **PR3

    **Perchè secondo me è fittizio il PR 3 LowLevel e non il PR 5? Perchè appena si creava una discussione questa prendeva subito PR 3

    Come può una URL appena creata visualizzare il PR?

    Ma sopratutto: come può una URL non vera avere già il PR?

    Sull'esempio di Pieropan, come è possibile che questo sia un PR Reale se è linkato ora per la prima volta?

    Microsoft Italia

    Secondo me è la pagina dinamica che prende il PR al Volo non la madre.

    Oltre a questo ragionamento ne ho fatto un altro: io Google, come faccio ad assegnare il PageRank a pagine che potrebbero essere infinite e che potrebbero non avere una loro struttura logica?

    Semplice e facile. Prendo la pagina madre, gli assegno il PageRank in base ai link che riceve dal sito stesso (cioè, i link dinamici li taglio) e alle pagine figlie gli assegno un PageRank di Default; lo assegno per tutte e risolvo la soluzione.

    LowLevel, mi piacerebbe conoscere il tuo ragionamento o i tuoi test o altro che ti hanno portato a pensare che la pagina figlia riceve il PageRank vero, cosi cambio idea subito 😄

    GT 😉


  • Moderatore

    Effettivamente il discorso di Giorgio potrebbe filare:

    il PR fittizio potrebbe essere quello della pagina dinamica che, teoricamente, dovrebbe essere legata alla pagina madre che, a tal punto, avrebbe il PR reale. (perchè, magari, è un approfondimento di qualche sua parte).

    Potrebbe, IMHO, essere lo stesso discorso del PR5 dato alla home page di un sito e PR4 alle pagine linkate direttamente ad essa, a distanza, quindi, di un solo click da essa.


  • Super User

    per la cronaca, l'extension per firefox che uso io mi mostra:
    [url=http://www.microsoft.com/italy/default.aspx]Microsoft Italia
    PR8
    [url=http://www.microsoft.com/italy/default.aspx?]Microsoft Italia
    PR6
    [url=http://www.microsoft.com/italy/default.aspx?PHPSESSID=e22197efed8bdca65]Microsoft Italia
    PR0
    [url=http://www.microsoft.com/italy/default.aspx?t=sdassssssssssssssssssssssss]Microsoft Italia
    PR0

    giusto per aggiungere un po' di confusione :fagiano:


  • User Attivo

    @must said:

    per la cronaca, l'extension per firefox che uso io mi mostra:
    [url=http://www.microsoft.com/italy/default.aspx]Microsoft Italia
    PR8
    [url=http://www.microsoft.com/italy/default.aspx?]Microsoft Italia
    PR6
    [url=http://www.microsoft.com/italy/default.aspx?PHPSESSID=e22197efed8bdca65]Microsoft Italia
    PR0
    [url=http://www.microsoft.com/italy/default.aspx?t=sdassssssssssssssssssssssss]Microsoft Italia
    PR0

    giusto per aggiungere un po' di confusione :fagiano:
    Ciao, io continuo a vedere i risultati che ho detto, uso FF&search-status. Idem con explorer&toolbar-ufficiale. Tu che estensione usi?


  • Super User

    con l'extension che ho qui (Google Pagerank Status - quella che mostra il n/a se la pagina non ha PR) vedo i PR che vedi tu.

    a casa uso una extension di cui non ricordo ora il nome (:D), ma per intendermi è quella che mostra anche il ranking alexa più altre N funzionalità.
    da qui vedo i PR0. ma che sia un bug di quella extension mi pare, a questo punto, abbastanza evidente.


  • Super User

    @pieropan said:

    Solo il carattere ?
    [url=http://www.microsoft.com/italy/default.aspx?]Microsoft Italia
    PR6

    Nel momento in cui l'URL non è indicizzato da Google, il motore deve stabilire se è in grado di fornire all'utente, solo per ragioni di usabilità, un PR ipotizzato.

    Se il motore decide che è il caso, il calcolo avviene partendo dal PR reale della index e sottraendo "1" ad ogni "livello" di cui si compone l'URL.

    [url=http://www.microsoft.com/]Microsoft Corporation [PR9, reale]
    italy/ [PR8]
    default.aspx [PR7]
    ? [PR6]

    Il "?" (e tutto ciò che segue, se non ricordo male) viene considerato un livello in più.

    Spero che sia chiaro che i PR da 8 a 6 indicati sopra non corrispondono ai reali PR assegnati a quegli URL, ma si tratta solo di un mio modo per mostrare visualmente come la presenza dei "livelli" in un URL influisce sul "calcolo" del PR ipotizzato (e fittizio).

    @agoago said:

    Se la lincassi almeno una volta, cosi' da renderla nota a G, il valore di quella pagina sarebbe unicamente quello derivante da quel link o beneficerebbe anche dei link "intercettati"??

    Unicamente quello derivante dal link.

    La regola è semplice: se ci sono link è possibile calcolare il PageRank, e la toolbar lo mostra. Se non ci sono link allora in alcuni casi la toolbar mostra un PR ipotizzato.

    @agoago said:

    Perche' pero' G dovrebbe sprecare risorse per calcolare dei pr fittizi?

    Ci sono casi in cui un "PR ipotizzato" può essere utile all'utente più di un PR grigio. Tu analizzi il fenomeno, giustamente ed inevitabilmente, dal punto di vista SEO. Ma l'indicatore della toolbar non è stato creato per aiutare i SEO e ci sono scelte che Google prende solo in funzione dell'usabilità; il "PR ipotizzato" è una di queste scelte.

    @Giorgiotave said:

    LowLevel, mi piacerebbe conoscere il tuo ragionamento o i tuoi test o altro che ti hanno portato a pensare che la pagina figlia riceve il PageRank vero, cosi cambio idea subito

    Io non dicevo quello. Madre o figlia, non importa. Il PageRank mostrato è reale o ipotizzato non in base al livello gerarchico nell'URL bensì in base a quali pagine beneficiano del calcolo del vero PageRank.

    Se Google è consapevole dell'esistenza di link che puntano a gt.it/forum/viewtopic.php, allora il PR mostrato è basato sui link e quindi reale.

    Se Google non è (ancora) consapevole dell'esistenza link che puntano a gt.it/forum/viewtopic.php?t=3532131 , allora il PR mostrato è quello "ipotizzato" dalla toolbar.

    Quello che tu osservi per i topic ancora sconosciuti a Google è lo stesso fenomeno che avviene per le pagine delle cache di Google, che apparentemente possiedono un PageRank.

    Nota importante: se avete voglia di mettervi a fare esperimenti, sappiate che le regole di cui sopra variano anche in funzione del tipo di sito. Ad esempio se il dominio ospita un sito considerato mirror di un altro, il PageRank della index potrebbe essere grigio, ma il PR ipotizzato per un URL interno potrebbe essere maggiore di zero. Esistono altre eccezioni, tuttavia.


  • Community Manager

    Grazie Low per le precisazioni, molto interessante 🙂

    Mi togli una curiosità che avevo da tempo 😄


  • Super User

    wow, certo che non si finisce mai di imparare...

    Mi resta pero' un solo dubbio : "ma che interesse ha google a mostrare un PR fittizio ?"


  • Super User

    @nbriani said:

    Mi resta pero' un solo dubbio : "ma che interesse ha google a mostrare un PR fittizio ?"

    Non lo vedere come un PR fittizio, ma come un PR più preciso da fornire all'utente.

    Ci sono casi in cui Google non possiede informazioni sui link che puntano ad un URL e non potrebbe fornire alcuna indicazione sul PR di una pagina. Risultato: barretta grigia per l'utente.

    Invece di mostrare una barretta grigia, in alcuni casi è possibile per la toolbar ipotizzare un PR, in modo da fornire all'utente un'indicazione presumibilmente non corretta ma globalmente (ed in media) più significativa di una barretta grigia.