Un Evento Unico. 5 Sale. 27 Interventi. SEO, SOCIAL, E-Commerce, Mobile, Turismo.
CLICCA QUI e SCOPRI DI PIù X Chiudi
 
Forum GT: Condividiamo idee e conoscenza Forum GT: Condividiamo idee e conoscenza


Condividi questo contenuto nei Social Network:
Ti stiamo aspettando: Registrati subito e gratis. Entra a far parte di una delle comunità più attive in Italia. Se hai dimenticato i tuoi dati li puoi recuperare subito.


Vai indietro   Forum per Webmaster: Condividiamo Idee e Conoscenza > Seo e Tecnologie > Strumenti per Statistiche
Benvenuto! Forum Regole FAQ Lista utenti Calendario Segna come letti


Rispondi
 
LinkBack Strumenti di discussione
Vecchio 26-06-06, 12:15   #1 (permalink)
Moderatore
 
L'avatar di paocavo
 
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
Attività dei crawler di Google

Analizzando le visite provenienti dai ragnetti di Google sul mio sito rilevo che i crawlers sono due i cui User-Agent sono:
1) Googlebot/2_1 (+http://www_google_com/bot_html)
2) Mozilla/5_0 (compatible; Googlebot/2_1; +http://www_google_com/b

E' noto che GG effettua due tipi di scansioni: una "leggera" che avviene quasi sempre quotidianamente e analizza solo l'Home Page e eventualmente poche altre pagine direttamente linkate dalla Home.
Una seconda scansione ("Deep crawling") avviene più sporadicamente ma è molto più profonda: serve per rivisitare l'intero (o quasi) sito web.

Probabilmente ai due tipi di scansioni corrispondono i suddetti User-Agent.
Rilevo però che dal 28 Marzo il primo Crawler indicato non viene più a "trovarmi".

Sapete se sono cambiate le politiche di crawling di Google o se devo aspettarmi che il primo spider nella lista ritorni a farmi visita? Quale dei due è l'addetto al "Deep Crawling"? Adesso fa tutto solo il secondo nella lista (?)

PS: Quali considerazioni si possono fare sull'analisi dell'attivita dello spider di Google-Desktop (User Agent = Mozilla/4_0 (compatible; Google Desktop)? Posso considerare tali visite come provenienti da visitatori "abituali" (o sono semplici accessi da utenti che hanno salvato alcune mie pagine sui loro Desktop)?
paocavo non in linea   Rispondi citando
Vecchio 29-07-06, 14:41   #2 (permalink)
 
L'avatar di Giorgiotave
 
Data di registrazione: Oct 2004
Ubicazione: Monasterace
Messaggi: 34,892
Invia un messaggio tramite Skype a Giorgiotave
Questo post è molto interessante, sarebbe ancora di più analizzare tramite un apposito software l'attività degli spider.

Si potrebbero raccogliere dei siti, tanti siti, e poi dare un codice per analizzare gli spider. Poi dividiamo i siti per settore.

Ma serve un server apposta e un programma apposta. No?

Giorgio
Giorgiotave non in linea   Rispondi citando
Vecchio 29-07-06, 17:11   #3 (permalink)
Esperto
 
L'avatar di nbriani
 
Data di registrazione: May 2005
Ubicazione: Firenze
Messaggi: 1,938
Invia un messaggio tramite MSN a nbriani Invia un messaggio tramite Skype a nbriani
Quote:
paocavo
Analizzando le visite provenienti dai ragnetti di Google sul mio sito rilevo che i crawlers sono due i cui User-Agent sono:
1) Googlebot/2_1 (+http://www_google_com/bot_html)
2) Mozilla/5_0 (compatible; Googlebot/2_1; +http://www_google_com/b

E' noto che GG effettua due tipi di scansioni: una "leggera" che avviene quasi sempre quotidianamente e analizza solo l'Home Page e eventualmente poche altre pagine direttamente linkate dalla Home.
Una seconda scansione ("Deep crawling") avviene più sporadicamente ma è molto più profonda: serve per rivisitare l'intero (o quasi) sito web.

Probabilmente ai due tipi di scansioni corrispondono i suddetti User-Agent.
Rilevo però che dal 28 Marzo il primo Crawler indicato non viene più a "trovarmi".
Ciao Paocavo,
.....no la spiegazione sta nel fatto che da oltre 3 mesi è cambiato il crawler di gg dal vecchio "googlebot" al nuovo "mozilla-googlebot" ... qui trovi tutte le info fra i blogger nostrani, e qui l'articolo di html.it
__________________
Web Marketing Consultant

:sun: Focus on:
Convegno GT ! :sun:
nbriani non in linea   Rispondi citando
Vecchio 29-07-06, 19:33   #4 (permalink)
Moderatore
 
L'avatar di paocavo
 
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
Quote:
Giorgiotave
Questo post è molto interessante, sarebbe ancora di più analizzare tramite un apposito software l'attività degli spider.

Si potrebbero raccogliere dei siti, tanti siti, e poi dare un codice per analizzare gli spider. Poi dividiamo i siti per settore.

Ma serve un server apposta e un programma apposta. No?

Giorgio
Per il programma ci sto già lavorando per il server si vedrà...
Forse una divisione per area geografica dell'IP dei web server visitati porebbe essere indicativa di come si "muove" lo spider...
paocavo non in linea   Rispondi citando
Vecchio 29-07-06, 19:36   #5 (permalink)
Moderatore
 
L'avatar di paocavo
 
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
Grazie per i link! (anche se nel frattempo avevo già risolto l'arcano proposto in questo 3D postato un mese fa...)

Salutoni!

Quote:
nbriani
Ciao Paocavo,
.....no la spiegazione sta nel fatto che da oltre 3 mesi è cambiato il crawler di gg dal vecchio "googlebot" al nuovo "mozilla-googlebot" ... qui trovi tutte le info fra i blogger nostrani, e qui l'articolo di html.it
paocavo non in linea   Rispondi citando
Vecchio 30-07-06, 03:13   #6 (permalink)
Esperto
 
L'avatar di nbriani
 
Data di registrazione: May 2005
Ubicazione: Firenze
Messaggi: 1,938
Invia un messaggio tramite MSN a nbriani Invia un messaggio tramite Skype a nbriani
oops, sorry, non avevo visto la data del tuo post....


Nicola


p.s. come proseguono gli studi sul tuo interessante lavoro sull'analisi semantica delle keyword di accesso al sito ?
__________________
Web Marketing Consultant

:sun: Focus on:
Convegno GT ! :sun:
nbriani non in linea   Rispondi citando
Vecchio 31-07-06, 11:15   #7 (permalink)
Moderatore
 
L'avatar di paocavo
 
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
Quote:
nbriani
p.s. come proseguono gli studi sul tuo interessante lavoro sull'analisi semantica delle keyword di accesso al sito ?
Bene, sto raggiungendo ottimi risultati con mix del''algoritmo proposto nel 3D e con il clustering k-means (come suggerito da Low). Adesso sto pensando di passare al passo successivo: analizzare e catalogare paragrafi (non più Keyphrases per MDR) prelevati dal web (per esperimenti sulla creazione di un "proto-MDR" e procedure di Summarization (sunti automatici).

I dettagli sullo stato di avanzamento dei lavori (lento) saranno disponibili sul 3D relativo (in questo Forum).

paocavo non in linea   Rispondi citando
Vecchio 04-08-06, 23:57   #8 (permalink)
User
 
Data di registrazione: Jul 2006
Ubicazione: roma
Messaggi: 41
gia' lo avevo scritto un po di tempo fa, ma a nessuno e' interessato. mi riferisco al programma x controllare le visite dei motori di ricerca (non solo google). quello che ho fatto, funziona perfettamente.

Ultima modifica di titan : 04-08-06 23:59.
titan non in linea   Rispondi citando
Rispondi
Tags: ,



Strumenti di discussione

Regole di scrittura
Non puoi postare nuove discussioni
Non puoi rispondere alle discussioni
Non puoi allegare file
Non puoi editare i tuoi post

BB code is Attivo
smilies è Attivo
[IMG] il codice è Attivo
Il codice HTML è Disattivato
Trackbacks are Attivo
Pingbacks are Attivo
Refbacks are Disattivato
Vai al forum



Tutti gli orari sono GMT +3. Attualmente sono le 12:58.




Forum GT - © 2004-2009 GT idea S.r.l P.iva 02418200800 - Privacy/Disclaimer

SEO by vBSEO 3.2.0 ©2008, Crawlability, Inc.