Un Evento Unico. 5 Sale. 27 Interventi. SEO, SOCIAL, E-Commerce, Mobile, Turismo.
CLICCA QUI e SCOPRI DI PIù X Chiudi
 
Forum GT: Condividiamo idee e conoscenza Forum GT: Condividiamo idee e conoscenza


Condividi questo contenuto nei Social Network:
Ti stiamo aspettando: Registrati subito e gratis. Entra a far parte di una delle comunità più attive in Italia. Se hai dimenticato i tuoi dati li puoi recuperare subito.


Vai indietro   Forum per Webmaster: Condividiamo Idee e Conoscenza > Ripostiglio > Sezioni Storiche > Teecno
Benvenuto! Forum Regole FAQ Lista utenti Calendario Segna come letti

Teecno Costruzione, sviluppo e promozione del nostro MdR

Hey Amico Visitatore,
Condividi con noi le tue idee e la tua conoscenza Aprendo una nuova discussione nella sezione Teecno


Rispondi
 
LinkBack Strumenti di discussione
Vecchio 07-09-06, 18:35   #1 (permalink)
Esperto
 
L'avatar di osvi
 
Data di registrazione: Jul 2006
Ubicazione: Siena
Messaggi: 1,077
spider "osvi"

uso questo thread per la versione "osvi" dello spider

lo spider quando pronto sarà in grado di:
- leggere gli header inviati dal server (301 aggiorno gli url nel db, 503 taggo come ricontrollare, 200 scarico, ecc)
- gestire il robots.txt (parser già scritto va solo ricontrollato e ottimizzato)
- eliminare i commenti dal codice e tutte le cose inutili
- prendere le parole e metterle in un array (con ricorrenza importanza ecc)
- prendere i link e analizzare le sottopagine (gestendo il nofollow)
- testo e titolo <a>
- spider rss (vedi post di Giorgio)

pensavo di usare una tabella del database con le pagine da esaminare, che ne dite?
ah per inserire nel database.. non ho ben capito (anche perchè non ho letto il codice php e soprattutto la teoria per bene) come funzionano le tabelle del lessico ecc, quindi se a qualcuno andrà di scrivere un po' di documentazione, o semplicemente spiegarmelo, oppure fare una classe dove gli passo il vettore, ...


Ultima modifica di Giorgiotave : 07-09-06 21:37.
osvi non in linea   Rispondi citando
Vecchio 07-09-06, 20:21   #2 (permalink)
 
L'avatar di Giorgiotave
 
Data di registrazione: Oct 2004
Ubicazione: Monasterace
Messaggi: 34,892
Invia un messaggio tramite Skype a Giorgiotave
Ciao Osvi

Che ne dici se gli facciamo rendere anche il testo dei link? (lo fai già? )

Un'altra cosa

Che ne pensi se tramite gli rss, creassimo uno spider in grado di estrapolare i seguenti dati:

titolo dell'argomento
link
nome del link

Questo per assegnare un punteggio ai link.

Fammi sapere. Tony è alla prese con il SubVersion, è un pò un casino ma ce la farà

Giorgiotave non in linea   Rispondi citando
Vecchio 07-09-06, 20:27   #3 (permalink)
Esperto
 
L'avatar di osvi
 
Data di registrazione: Jul 2006
Ubicazione: Siena
Messaggi: 1,077
lo so che configurare subversion è un impresa biblica forse è meglio se usiamo source forge, oppure opensvn, all'inizio almeno.. anche per non appesantire troppo il server di teecno

hai ragione per il testo dei link (sia dell'ancora sia del title)
però per come è strutturato il database non saprei come metterlo

mmmh devo ragionare un po' su una nuova struttura per il database


per gli rss: non ho ben capito cosa vuoi fare :sto:
uno spider rss?
osvi non in linea   Rispondi citando
Vecchio 07-09-06, 20:30   #4 (permalink)
 
L'avatar di Giorgiotave
 
Data di registrazione: Oct 2004
Ubicazione: Monasterace
Messaggi: 34,892
Invia un messaggio tramite Skype a Giorgiotave
Quote:
osvi
lo so che configurare subversion è un impresa biblica forse è meglio se usiamo source forge, oppure opensvn, all'inizio almeno.. anche per non appesantire troppo il server di teecno
Non è un problema, prendiamo un server solo per Teecno e lasciamo il subversion in questo server, su GT

Poi compriamo anche un secondo server per Teecno, che useremo con i siti che usano Teecno come motore interno, ma ti questo ne parleremo tra qualche giorno in un altro topic

Quote:
osvi
hai ragione per il testo dei link (sia dell'ancora sia del title)
però per come è strutturato il database non saprei come metterlo

mmmh devo ragionare un po' su una nuova struttura per il database
E si

Quote:
osvi
per gli rss: non ho ben capito cosa vuoi fare :sto:
uno spider rss?
Si. Praticamente dagli Rss noi estrapoliamo i dati.

Questo per vari motivi:

- creare un motore che usi anche gli RSs per aggiornarsi (e poi uno specifico per le news )
- creare un archivio mensile di link (per assegnare i punteggi)

In questo modo osvi, noi sappiamo che questo mese una risorsa è stata linkata con la chiave X, X volte. L'articolo aveva la chiave nel Title anche.

Capisci....possiamo giocarci, imparare e studiare molte cose

No?

Oltre a questo, puntare sugli Rss
Giorgiotave non in linea   Rispondi citando
Vecchio 07-09-06, 21:13   #5 (permalink)
Esperto
 
L'avatar di osvi
 
Data di registrazione: Jul 2006
Ubicazione: Siena
Messaggi: 1,077
ah sì, certo

un parser rss è anche 100 volte più semplice di uno html
accodo alla lista


edit non mi fa modificare il messaggio puoi mettere te
- testo e titolo <a>
- spider rss (vedi post di Giorgio)
?
osvi non in linea   Rispondi citando
Vecchio 07-09-06, 21:23   #6 (permalink)
 
L'avatar di Giorgiotave
 
Data di registrazione: Oct 2004
Ubicazione: Monasterace
Messaggi: 34,892
Invia un messaggio tramite Skype a Giorgiotave
Quote:
osvi
ah sì, certo

un parser rss è anche 100 volte più semplice di uno html
accodo alla lista


edit non mi fa modificare il messaggio puoi mettere te
- testo e titolo <a>
- spider rss (vedi post di Giorgio)
?
Oki, mi rifai il messaggio e me lo posti in pvt? NOn ho capito bene,
ora ti rispondo al privato
Giorgiotave non in linea   Rispondi citando
Vecchio 09-09-06, 11:21   #7 (permalink)
User Attivo
User Attivo
 
L'avatar di must
 
Data di registrazione: Mar 2005
Ubicazione: Vittoriosa, Malta
Messaggi: 4,311
Invia un messaggio tramite MSN a must
fate in modo che interpreti correttamente anche gli html entities, poi, eh
__________________
SEO Birra a Malta: 9 giugno 2012!
must ora è in linea   Rispondi citando
Vecchio 09-09-06, 13:18   #8 (permalink)
Esperto
 
L'avatar di osvi
 
Data di registrazione: Jul 2006
Ubicazione: Siena
Messaggi: 1,077
si infatti non sarà un problema
avevo già notato che con il codice attule vengono spazzate via

lo spider è in programmazione
non lo sto facendo ad oggetti come spiegato nell'altro thread, cmq una conversione in futuro sarebbe indolore (maledetta debian ma php5 quando lo rilasci?)
ancora è troppo presto anche per uno snapshot, cmq volevo dire ci sto lavorando non è che ho aperto il thread solo per fare qualcosa


vi aggiorno appena ho qualcosa di "alpha"
osvi non in linea   Rispondi citando
Vecchio 20-10-06, 19:47   #9 (permalink)
 
L'avatar di Giorgiotave
 
Data di registrazione: Oct 2004
Ubicazione: Monasterace
Messaggi: 34,892
Invia un messaggio tramite Skype a Giorgiotave
Osvi tutto bene dalle tue parti?
Giorgiotave non in linea   Rispondi citando
Vecchio 20-10-06, 20:49   #10 (permalink)
Esperto
 
L'avatar di osvi
 
Data di registrazione: Jul 2006
Ubicazione: Siena
Messaggi: 1,077
purtroppo, devo essere sincero - non ho avuto né tempo né modo
spero di poter sfornare qualcosa di "usabile" appena possibile... non saprei dirti una data (che probabilmente non rispetterei)
prometto però che domenica riguardo il codice già scritto e preparo uno schema di cosa fare, come continuare, ecc

ti faccio sapere

[ot]qualcuno sa come dezendare uno script php?[/ot]
osvi non in linea   Rispondi citando
Vecchio 21-10-06, 00:35   #11 (permalink)
 
L'avatar di Giorgiotave
 
Data di registrazione: Oct 2004
Ubicazione: Monasterace
Messaggi: 34,892
Invia un messaggio tramite Skype a Giorgiotave
Quote:
osvi
purtroppo, devo essere sincero - non ho avuto né tempo né modo
spero di poter sfornare qualcosa di "usabile" appena possibile... non saprei dirti una data (che probabilmente non rispetterei)
prometto però che domenica riguardo il codice già scritto e preparo uno schema di cosa fare, come continuare, ecc

ti faccio sapere
Ottimo e molto interessante

Sopratutto il come continuare, grazie mille e fai con calma Osvi

Giorgio
Giorgiotave non in linea   Rispondi citando
Vecchio 21-10-06, 21:28   #12 (permalink)
Esperto
 
L'avatar di osvi
 
Data di registrazione: Jul 2006
Ubicazione: Siena
Messaggi: 1,077
visto che si mette male e non esco, ci lavoro ora

a seconda dei risultati aggiornerò questo post e/o upperò il lavoro parziale su svn
__________________
Firefox browser
osvi non in linea   Rispondi citando
Vecchio 22-10-06, 11:47   #13 (permalink)
Esperto
 
L'avatar di osvi
 
Data di registrazione: Jul 2006
Ubicazione: Siena
Messaggi: 1,077
primo aggiornamento: ho cambiato lo schema del database
sistemo il codice di spider.php (senza aggiungere migliorie) rendendolo compatibile col nuovo schema e pubblico
__________________
Firefox browser
osvi non in linea   Rispondi citando
Vecchio 22-10-06, 12:41   #14 (permalink)
 
L'avatar di Giorgiotave
 
Data di registrazione: Oct 2004
Ubicazione: Monasterace
Messaggi: 34,892
Invia un messaggio tramite Skype a Giorgiotave
Okey Perfetto
Giorgiotave non in linea   Rispondi citando
Vecchio 22-10-06, 17:10   #15 (permalink)
Esperto
 
L'avatar di osvi
 
Data di registrazione: Jul 2006
Ubicazione: Siena
Messaggi: 1,077
qualcun'altro si vuole aggregare a me?
in due sarebbe più semplice e più veloce

info msn:samy_morgan§msn.com gtalk:francesco.monte§gmail.com
__________________
Firefox browser
osvi non in linea   Rispondi citando
Rispondi
Tags: ,



Strumenti di discussione

Regole di scrittura
Non puoi postare nuove discussioni
Non puoi rispondere alle discussioni
Non puoi allegare file
Non puoi editare i tuoi post

BB code is Attivo
smilies è Attivo
[IMG] il codice è Attivo
Il codice HTML è Disattivato
Trackbacks are Attivo
Pingbacks are Attivo
Refbacks are Disattivato
Vai al forum



Tutti gli orari sono GMT +3. Attualmente sono le 14:11.




Forum GT - © 2004-2009 GT idea S.r.l P.iva 02418200800 - Privacy/Disclaimer

SEO by vBSEO 3.2.0 ©2008, Crawlability, Inc.