Un Evento Unico. 5 Sale. 27 Interventi. SEO, SOCIAL, E-Commerce, Mobile, Turismo.
CLICCA QUI e SCOPRI DI PIù X Chiudi
 
Forum GT: Condividiamo idee e conoscenza Forum GT: Condividiamo idee e conoscenza


Condividi questo contenuto nei Social Network:
Ti stiamo aspettando: Registrati subito e gratis. Entra a far parte di una delle comunità più attive in Italia. Se hai dimenticato i tuoi dati li puoi recuperare subito.


Vai indietro   Forum per Webmaster: Condividiamo Idee e Conoscenza > Seo e Tecnologie > Posizionamento Nei Motori di Ricerca > SEO Focus
Benvenuto! Forum Regole FAQ Lista utenti Calendario Segna come letti

SEO Focus Osservatorio Avanzato - [Sezione ad invito]

Hey Amico Visitatore,
Condividi con noi le tue idee e la tua conoscenza Aprendo una nuova discussione nella sezione SEO Focus


Rispondi
 
LinkBack Strumenti di discussione
Vecchio 22-05-07, 13:14   #1 (permalink)
Esperto
 
Data di registrazione: May 2005
Messaggi: 430
Invia un messaggio tramite MSN a gik25
[IR] Google ha molti algoritmi, giusto?

Google ha molti algoritmi, giusto? Questi algoritmi sono lineari? possono essere applicati tramite matrici e vettori? Se si, più sono gli algoritmi e gli elementi presi in considerazione e più è logico presumere che siano il numero di elementi di ogni vettore.

Se, è così al crescere del numero di dimensioni (dimensioni = elementi) del vettore ogni singolo fattore preso singolarmente viene a contare meno. Quindi se è così si dovrebbe riscontrare negli anni un fenomeno ben evidente.

Se questa cosa non si evince dai dati reali, ho trovato due possibili ipotesi:
1) Google utilizza criteri fortemente non lineari o algoritmici
2) Google utilizza una media pesata molto forte verso alcuni fattori
3) I filtri sono applicati in sequenza (risultando in una funzione fortemente non lineare)

Ora mi chiedo:
Chiamata F[x, q] la funzione che associa gli n-mila elementi che caratterizzano una pagina x, e una query q alla sua posizione nella serp per tale query. Cosa possiamo dire di questa funzione? Qualcuno ha mai provato a vedere il posizionamento sotto questo punto di vista?

è linearizzabile? è matriciale? avete mai preso in considerazione un simile punto di vista?
gik25 non in linea   Rispondi citando
Vecchio 22-05-07, 14:06   #2 (permalink)
mix
Banned
 
L'avatar di mix
 
Data di registrazione: May 2006
Ubicazione: puglia/salento/brindisi/mesagne
Messaggi: 1,040
Invia un messaggio tramite MSN a mix Invia un messaggio tramite Yahoo a mix
Io sono convinto che ogni serp darà un risultato a se!

Dobbiamo tener conto anche le serp speciali, quelle che io amo definire "commerciali" dove google in primis ci mette lo zampino e ci mangia.

Approposito ci sono altri malati che la pensano come me sull'esistenza di queste serp "commerciali" ?

Sono solo fantasie mie oppure avete testato e scoperto dell'esistenza di queste serp?
mix non in linea   Rispondi citando
Vecchio 22-05-07, 14:21   #3 (permalink)
Esperto
 
Data di registrazione: May 2005
Messaggi: 430
Invia un messaggio tramite MSN a gik25
Quote:
mix Visualizza il messaggio
Io sono convinto che ogni serp darà un risultato a se!

Dobbiamo tener conto anche le serp speciali, quelle che io amo definire "commerciali" dove google in primis ci mette lo zampino e ci mangia.

Approposito ci sono altri malati che la pensano come me sull'esistenza di queste serp "commerciali" ?

Sono solo fantasie mie oppure avete testato e scoperto dell'esistenza di queste serp?
Le serp in questione sono quelle sul turismo?

Comunque leggevo in un altro 3d che qualcuno la pensa come te a riguardo, del resto la cosa non mi stupirebbe più di tanto: Google adesso è una società per azioni. Se la scelta non penalizza eccessivamente l'utente e gli fa guadagnare soldi potrebbe benissimo adottarla.
gik25 non in linea   Rispondi citando
Vecchio 22-05-07, 14:49   #4 (permalink)
mix
Banned
 
L'avatar di mix
 
Data di registrazione: May 2006
Ubicazione: puglia/salento/brindisi/mesagne
Messaggi: 1,040
Invia un messaggio tramite MSN a mix Invia un messaggio tramite Yahoo a mix
Non parlo solo delle serp di turismo, ci sono svariate serp in cui secondo me google ci mette lo zampino.

La penso esattamente cosi, google è una società per azioni, e deve guadagnare.

Ogni metodo è lecito, l'importante è non "sporcheggiare".
mix non in linea   Rispondi citando
Vecchio 22-05-07, 15:45   #5 (permalink)
Moderatore
 
L'avatar di paocavo
 
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
Il modello di rappresentazione delle informazioni contenute nelle pagine web fa riferimento sicuramente ad un sistema lineare (Vector Space Model). Tutte le pagine contenute nell'intero corpus dei documenti catalogati da GoogleBot sono punti di uno spazio vettoriale N-dimensionale. Ogni documento è a sua volta un sottospazio vettoriale.
Ogni query inviata a GG è "posizionata" all'interno di questi spazi e ne viene calcolata la distanza rispetto a tutti gli altri punti (documenti).
Tutti i punti-documenti che rientrano entro una (iper)sfera di un certo raggio determineranno i risulati della ricerca.
Ma come ordinarli? Cioè qual'è l'algoritmo di ranking?
Questo non ci è dato sapere.
Sappiamo solo che esiste una matrice di pesi utilizzata per ottenere l'ordinamento finale. Il sistema comunque rimane lineare. Sistemi non-lineari sono: 1) poco controllabili, 2) poco osservabili e 3) non asintoticamente stabili.
Alcune (molte...) query sono però "sistemate" a manina (vedi il lavoro fatto dai Quality rater) per vari motivi, primo fra tutti quello commerciale

paocavo non in linea   Rispondi citando
Vecchio 22-05-07, 16:05   #6 (permalink)
Esperto
 
Data di registrazione: May 2005
Messaggi: 430
Invia un messaggio tramite MSN a gik25
Quote:
paocavo Visualizza il messaggio
Il modello di rappresentazione delle informazioni contenute nelle pagine web fa riferimento sicuramente ad un sistema lineare (Vector Space Model). Tutte le pagine contenute nell'intero corpus dei documenti catalogati da GoogleBot sono punti di uno spazio vettoriale N-dimensionale. Ogni documento è a sua volta un sottospazio vettoriale.
Ogni query inviata a GG è "posizionata" all'interno di questi spazi e ne viene calcolata la distanza rispetto a tutti gli altri punti (documenti).
Tutti i punti-documenti che rientrano entro una (iper)sfera di un certo raggio determineranno i risulati della ricerca.
Ma come ordinarli? Cioè qual'è l'algoritmo di ranking?
Questo non ci è dato sapere.
Sappiamo solo che esiste una matrice di pesi utilizzata per ottenere l'ordinamento finale. Il sistema comunque rimane lineare. Sistemi non-lineari sono: 1) poco controllabili, 2) poco osservabili e 3) non asintoticamente stabili.
Alcune (molte...) query sono però "sistemate" a manina (vedi il lavoro fatto dai Quality rater) per vari motivi, primo fra tutti quello commerciale

Hai delle ipotesi sul numero di dimensioni? Perchè se un sistema è lineare, dato un punto-vettore-documento e lo scalare posizione nella serp, il vettore che lo pesa-trasforma non è impossibile da calcolare? Giusto?

Perdona la mia incompetenza in geometria
Bisogna risalire a tutti i fattori usati da google, poi scegliere una serp non moderata (quindi non troppo spammosa) e risolvere l'equazione matriciale: ValoriDocumento*VettoreAlgoritmoGoogle = posizione nelle serp.

A meno di filtri antispam si dovrebbe trovare per ogni documento lo stesso VettoreAlgoritmoGoogle, dove sbaglio?


Altra domanda: i quality rater saranno tipo moderatori che bannano un sito? O semplicemente segnalano: sì, il sito usa testo nascosto. E poi google decide cosa fare? Ovvero rientrano nell'algoritmo di google con un "peso" molto maggiore degli altri fattori. Qual'è l'ipotesi più probabile?
gik25 non in linea   Rispondi citando
Vecchio 22-05-07, 16:12   #7 (permalink)
Esperto
 
L'avatar di nbriani
 
Data di registrazione: May 2005
Ubicazione: Firenze
Messaggi: 1,938
Invia un messaggio tramite MSN a nbriani Invia un messaggio tramite Skype a nbriani
Quote:
gik25 Visualizza il messaggio
dove sbaglio?
Secondo me nella semplificazione iniziale che fai che la funzione che immagini sia correlata ad una posizione in SERP.. non credo proprio sia cosi', ma piuttosto nella semplificazione massima della questione, esprima un "valore" , uno "score" da assegnare ad un documento... cosa che rende il ranking di una serp assolutamente "imprevedibile" ...


Nicola
__________________
Web Marketing Consultant

:sun: Focus on:
Convegno GT ! :sun:
nbriani non in linea   Rispondi citando
Vecchio 22-05-07, 16:15   #8 (permalink)
Esperto
 
L'avatar di nbriani
 
Data di registrazione: May 2005
Ubicazione: Firenze
Messaggi: 1,938
Invia un messaggio tramite MSN a nbriani Invia un messaggio tramite Skype a nbriani
Quote:
gik25 Visualizza il messaggio
Altra domanda: i quality rater saranno tipo moderatori che bannano un sito? O semplicemente segnalano: sì, il sito usa testo nascosto. E poi google decide cosa fare? Ovvero rientrano nell'algoritmo di google con un "peso" molto maggiore degli altri fattori. Qual'è l'ipotesi più probabile?
Leggi qui.


Nicola
__________________
Web Marketing Consultant

:sun: Focus on:
Convegno GT ! :sun:
nbriani non in linea   Rispondi citando
Vecchio 22-05-07, 16:20   #9 (permalink)
Esperto
 
L'avatar di nbriani
 
Data di registrazione: May 2005
Ubicazione: Firenze
Messaggi: 1,938
Invia un messaggio tramite MSN a nbriani Invia un messaggio tramite Skype a nbriani
Quote:
paocavo Visualizza il messaggio
Il modello di rappresentazione delle informazioni contenute nelle pagine web fa riferimento sicuramente ad un sistema lineare (Vector Space Model). Tutte le pagine contenute nell'intero corpus dei documenti catalogati da GoogleBot sono punti di uno spazio vettoriale N-dimensionale. Ogni documento è a sua volta un sottospazio vettoriale.
Ogni query inviata a GG è "posizionata" all'interno di questi spazi e ne viene calcolata la distanza rispetto a tutti gli altri punti (documenti).
Tutti i punti-documenti che rientrano entro una (iper)sfera di un certo raggio determineranno i risulati della ricerca.
Ma come ordinarli? Cioè qual'è l'algoritmo di ranking?
Ma se il MDR indicizzasse nel modo che indichi , il ranking non sarebbe soltanto una questione di vicinanza al punto-query? Cioè la vicinanza l'avresti calcolata proprio tenendo conto dei pesi dei vari elementi... o no?
__________________
Web Marketing Consultant

:sun: Focus on:
Convegno GT ! :sun:
nbriani non in linea   Rispondi citando
Vecchio 22-05-07, 16:23   #10 (permalink)
Esperto
 
Data di registrazione: May 2005
Messaggi: 430
Invia un messaggio tramite MSN a gik25
Quote:
nbriani Visualizza il messaggio
Secondo me nella semplificazione iniziale che fai che la funzione che immagini sia correlata ad una posizione in SERP.. non credo proprio sia cosi', ma piuttosto nella semplificazione massima della questione, esprima un "valore" , uno "score" da assegnare ad un documento... cosa che rende il ranking di una serp assolutamente "imprevedibile" ...


Nicola
A scanso di equivoci, non è che penso di "fregare" google così facilmente . Ho tirato in ballo l'argomento perchè l'IR (il lato più tecnico del seo) sia poco dibattuto rispetto ad altre forme.

Dobbiamo pensare come una macchina, fare il punto su cosa sappiamo di Google. Non per fregarlo, ma per capirlo.

Il post di Paocavo ha portato un interessantissimo spunto di riflessione: su un db immenso bisogna usare degli indici multidimensionali, quindi prima ancora di qualsiasi algoritmo si utilizza un filtro basato su una distanza pesata. Gli indici su troppe dimensioni sono poco utili, quindi di solito si eliminano in prima battuta le dimensioni inutili. Poi? Tecnicamente quali sono i limiti di un computer, quali quelli di un sistema decentralizzato come google?

I datacenter sono un "punto debole" di google, trovato per sentito dire, ma prevedibile lato teorico. Ce ne sono sicuramente altri, no?
gik25 non in linea   Rispondi citando
Vecchio 22-05-07, 16:31   #11 (permalink)
Esperto
 
Data di registrazione: May 2005
Messaggi: 430
Invia un messaggio tramite MSN a gik25
Quote:
nbriani Visualizza il messaggio
Ma se il MDR indicizzasse nel modo che indichi , il ranking non sarebbe soltanto una questione di vicinanza al punto-query? Cioè la vicinanza l'avresti calcolata proprio tenendo conto dei pesi dei vari elementi... o no?
Secondo me non è detto, una cosa è l'attinenza alla ricerca, un'altra il ranking della pagina.

Cerco: cane super bello
metti primo una pagina che parla di "cani super belli"
o un portale sui cani per la pagina "cani belli"

Una prima filtrata potrebbe servire a scartare le pagine non rilevanti (considerando le dimensioni relative alle parole chiave), la seconda a effettuare un ranking. Sulla prima più vicino al punto query non dovrebbe significare maggior ranking, o almeno dovrebbe entro certi limiti.
gik25 non in linea   Rispondi citando
Vecchio 22-05-07, 16:32   #12 (permalink)
Moderatore
 
L'avatar di paocavo
 
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
Quote:
gik25 Visualizza il messaggio
Hai delle ipotesi sul numero di dimensioni? Perchè se un sistema è lineare, dato un punto-vettore-documento e lo scalare posizione nella serp, il vettore che lo pesa-trasforma non è impossibile da calcolare? Giusto?
Il numero di dimensioni è in continua crescita al crescere del numero di documenti e dei "concetti" contenuti nei documenti...

Quote:
Perdona la mia incompetenza in geometria
Bisogna risalire a tutti i fattori usati da google, poi scegliere una serp non moderata (quindi non troppo spammosa) e risolvere l'equazione matriciale: ValoriDocumento*VettoreAlgoritmoGoogle = posizione nelle serp.

A meno di filtri antispam si dovrebbe trovare per ogni documento lo stesso VettoreAlgoritmoGoogle, dove sbaglio?
più o meno... ma a monte dovresti avere un copia dei DB di Google (e un buon super-computer...)

Quote:
Altra domanda: i quality rater saranno tipo moderatori che bannano un sito? O semplicemente segnalano: sì, il sito usa testo nascosto. E poi google decide cosa fare? Ovvero rientrano nell'algoritmo di google con un "peso" molto maggiore degli altri fattori. Qual'è l'ipotesi più probabile?
Oltre a segnalare siti spammosi riordinano manualmente i risultati delle query sulla base di principi di qualità totale dei risultati.
paocavo non in linea   Rispondi citando
Vecchio 22-05-07, 16:37   #13 (permalink)
Moderatore
 
L'avatar di paocavo
 
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
Quote:
nbriani Visualizza il messaggio
Ma se il MDR indicizzasse nel modo che indichi , il ranking non sarebbe soltanto una questione di vicinanza al punto-query? Cioè la vicinanza l'avresti calcolata proprio tenendo conto dei pesi dei vari elementi... o no?
una cosa è la vicinanza "semantica", un'altra è il ranking: attualmente basato principalmente sui fattori soliti off-page (qualità/quantita dei backlink, age factor, ecc...)
paocavo non in linea   Rispondi citando
Vecchio 22-05-07, 16:54   #14 (permalink)
 
L'avatar di Giorgiotave
 
Data di registrazione: Oct 2004
Ubicazione: Monasterace
Messaggi: 34,892
Invia un messaggio tramite Skype a Giorgiotave
Volevo segnalare il thread Faq sui Quality Rater a Gik (lo aveva fatto da nbriani, ma rifaccio )
Giorgiotave ora è in linea   Rispondi citando
Vecchio 22-05-07, 16:56   #15 (permalink)
Esperto
 
Data di registrazione: May 2005
Messaggi: 430
Invia un messaggio tramite MSN a gik25
I filtri antipspam però immagino siano a parte, eseguiti prima o dopo il ranking normale? Ad esempio come linearizzi l'intervento di un operatore umano , inoltre scartano (danno output 0) a tutti i siti che ci incappano, quindi sono bruschi, non graduali.
Pensi sia corretta questa ipotesi?

Se l'ipotesi è plausibile, quanti siti incappano in questi filtri ad hoc (anti-spamengine ad esempio)?

Ultima modifica di gik25 : 22-05-07 16:59.
gik25 non in linea   Rispondi citando
Rispondi
Tags:



Strumenti di discussione

Regole di scrittura
Non puoi postare nuove discussioni
Non puoi rispondere alle discussioni
Non puoi allegare file
Non puoi editare i tuoi post

BB code is Attivo
smilies è Attivo
[IMG] il codice è Attivo
Il codice HTML è Disattivato
Trackbacks are Attivo
Pingbacks are Attivo
Refbacks are Disattivato
Vai al forum



Tutti gli orari sono GMT +3. Attualmente sono le 20:33.




Forum GT - © 2004-2009 GT idea S.r.l P.iva 02418200800 - Privacy/Disclaimer

SEO by vBSEO 3.2.0 ©2008, Crawlability, Inc.