![]() |
![]() |
|
| Condividi questo contenuto nei Social Network: |
|
Tweet |
|
|
|
Ti stiamo aspettando: Registrati subito e gratis. Entra a far parte di una delle comunità più attive in Italia. Se hai dimenticato i tuoi dati li puoi recuperare subito. |
||||
|
|||||||||
Hey Amico Visitatore, Condividi con noi le tue idee e la tua conoscenza Aprendo una nuova discussione nella sezione Teecno |
|
|
LinkBack | Strumenti di discussione |
|
|
#1 (permalink) |
|
Banned
|
[domanda]il punto della situazione
chiedevo qual era il punto della situazione...cioè se era possibile iniziare a fare delle query di test per verificare l'efficacia del motore.
io ne ho fatta una, però, prima di riportarla, volevo informarmi sul fatto che il motore fosse o meno in fase beta. ![]() |
|
|
|
|
|
|
|
#2 (permalink) |
|
Il motore non fornisce ancora risultati per gli utenti
![]() Ma solo per noi. Dobbiamo spiderizzare tanti documento e fare un algo che calcoli i link, poi sarà attivo ![]() | |
|
__________________
Giorgio Taverniti Blog - Il mio account Twitter! Che aspetti? Diventa MODERATRICE del Forum gt ![]() Importante evento sul Web Marketing: 5 sale, 27 argomenti, 33 esperti presenti, streaming e video registrati...a soli 149€
|
|
|
|
|
|
|
#4 (permalink) |
|
User
Data di registrazione: Feb 2005
Messaggi: 522
|
Alcune domande sul vostro progetto
Non volevo aprire un altro post inutile...
Cmq per prima cosa, complimenti per il vostro progetto !! Volevo chiarezza sul funzionamento del motore Teecno La spiderizzazione dei siti web come avviene ? Immettete direttamente voi i link da spiderezzare o avete studiato qualcosa per poterlo fare ? Ho letto che il progetto è Open Source, quindi ogni volta che migliorate il motore di ricerca viene data la possibilità di scaricarsi il codice aggiornato? Per il momento è tutto !! Se mi vengono in mente altre curiosità vi faccio sapere !! Ciao ciao e buon lavoro !! |
|
|
|
|
|
#5 (permalink) | |||
|
Quote:
Quote:
http://www.teecno.it/spider.php Provalo...ha un bug ma funziona. Quote:
![]() | ||||
|
__________________
Giorgio Taverniti Blog - Il mio account Twitter! Che aspetti? Diventa MODERATRICE del Forum gt ![]() Importante evento sul Web Marketing: 5 sale, 27 argomenti, 33 esperti presenti, streaming e video registrati...a soli 149€
|
||||
|
|
|
|
|
#6 (permalink) |
|
Esperto
Data di registrazione: Apr 2006
Messaggi: 94
|
Ciao,
ho appena scoperto teecno, complimenti per il coraggio ;-) Avete dei piani piu' concreti o state solo sperimentando ? Che previsioni avete sul volume (milioni di URL nel DB ? decine di queries al secondo?) Ho scaricato i sorgenti, vedo che siamo ancora agli inizi, ma c'e' qualche piano di passare a linguaggi piu' versatili, almeno per il crawling e l'indicizzazione ? Spider.php e' molto rudimentale, per es. non mi sembra che rispetti i robots.txt o che si presenti con un User-Agent specifico (TeecnoBot ?) :-D Ma non credo che si possa fare molto altro in php, Python sembra invece un linguaggio piu' versatile (e altrettanto semplice da usare) per questo tipo di applicazioni. Spero comunque che il progetto faccia dei significativi passi avanti (anche se non credo che vi partecipero' attivamente, sono comunque disponibile per consulenze occasionali ;-) Saluti, F. |
|
__________________
Shades by Everfluxx |
|
|
|
|
|
|
#7 (permalink) |
|
Esperto
Data di registrazione: Jul 2006
Ubicazione: Siena
Messaggi: 1,077
|
secondo me è meglio continuare in php
python ha molti meno utenti (per esempio anche io stesso non lo conosco) sto facendo delle modifiche (http://webmatters.it/teecno2/ in attesa di ftp sento un po' la mancanza di php5, soprattutto per spider.php |
|
|
|
|
|
#8 (permalink) | ||||||||
|
Ciao F. Ray71
Quote:
L'obiettivo, come detto è: Quote:
Quote:
E' una lista "delle cose da fare", ma ovviamente non sono tutte. Diciamo che con molti progetti finiti di quelli siamo già a buon punto per qualcosa di più concreto. Non è per gli utenti ovviamente....ancora Speriamo lo sia presto (che non significa tre mesi )Quote:
Ovviamente ci sono da contare tutte le pagine interne. La prima cosa da pensare (e qui ci potresti dare il tuo parere L'intenzione è di mettere nel DB tantissimi siti Italiani, non so quando, ma si, milioni di URL. Però ripeto, prima di iniziare a farlo, dobbiamo ovviamente pensare all'ottimizzazione. Per le query dell'utente non lo so...non è il nostro obiettivo ora. Oggi abbiamo ricevuto 350 query, ma è il giorno del lancio, ancora un paio di giorni e dovrebbero calare. Quando sarà qualcosa di concreto inizierò con una promozione maggiore ed ho già individuato come farlo. Quote:
![]() Perchè sappiamo che ci sono linguaggi più potenti e vorremmo proprio tradurlo. Ma la programmazione in php la lasciamo, proprio perchè è il linguaggio più usato e quindi cerchiamo di farlo capire a tutti. Ovvio, il risultato finale, lo vogliamo fare in un altro linguaggio ![]() Quote:
Non si presenta come User-Agent (si, TeecnoBot) e questo crea problemi con le pagine come Wikipedia. Inoltre il progetto Robots.txt non è ancora attivo e lo faremo presto. Oltre a questo lo dobbiamo migliorare molto, è un esperimento. Quote:
![]() Ne siamo fermamente consapevoli ![]() Quote:
Ovviamente sono graditissimi i tuoi consigli ![]() Giorgio | |||||||||
|
__________________
Giorgio Taverniti Blog - Il mio account Twitter! Che aspetti? Diventa MODERATRICE del Forum gt ![]() Importante evento sul Web Marketing: 5 sale, 27 argomenti, 33 esperti presenti, streaming e video registrati...a soli 149€
|
|||||||||
|
|
|
|
|
#9 (permalink) | |
|
Quote:
Me lo invii? Emmebar ti attiva subito Dicevo, rimaniamo in php, ma cerchiamo qualcuno che programmi in Python per tradurre il tutto ![]() Ma il php rimarrà sempre, poi ci sono tante cartelle e c'è spazio per tutti | ||
|
__________________
Giorgio Taverniti Blog - Il mio account Twitter! Che aspetti? Diventa MODERATRICE del Forum gt ![]() Importante evento sul Web Marketing: 5 sale, 27 argomenti, 33 esperti presenti, streaming e video registrati...a soli 149€
|
||
|
|
|
|
|
#11 (permalink) |
|
http://www.teecno.it/osvi/
C'è qualche bug...ma lodevole! Credo che si può implementare il discorso cache Era uno dei progetti Anche se è solo un test. Osvi, apri un thread dove spieghi le modifiche che hai fatto. Presto ci sarà anche un altro utente che mostrerà la sua versione. Dovremmo prevedere anche dei zip per ogni utente. Ora scegliamo il tipo specifico di licenza ![]() | |
|
__________________
Giorgio Taverniti Blog - Il mio account Twitter! Che aspetti? Diventa MODERATRICE del Forum gt ![]() Importante evento sul Web Marketing: 5 sale, 27 argomenti, 33 esperti presenti, streaming e video registrati...a soli 149€
|
|
|
|
|
|
|
#12 (permalink) |
|
Esperto
Data di registrazione: Jul 2006
Ubicazione: Siena
Messaggi: 1,077
|
ok
5 minuti e lo faccio intanto ho scritto la prima parte del parser robots http://webmatters.it/teecno2/robots.php pulisce linee e toglie i commenti manca solo la parte "leggi solo Teecnobot e *" |
|
|
|
|
|
#13 (permalink) |
|
__________________
Giorgio Taverniti Blog - Il mio account Twitter! Che aspetti? Diventa MODERATRICE del Forum gt ![]() Importante evento sul Web Marketing: 5 sale, 27 argomenti, 33 esperti presenti, streaming e video registrati...a soli 149€
|
|
|
|
|
|
|
#14 (permalink) | |||||
|
Esperto
Data di registrazione: Apr 2006
Messaggi: 94
|
Quote:
Ovviamente ha ben poco a che vedere con il Google di oggi, ma da un idea di quali sono gli aspetti principali di cui tenere conto. Quote:
Per i blog, e' forse anche piu' facile: basta registrarsi ai feed RSS. Quote:
Quote:
Questo dovrebbe essere fattibile facilmente con le macchine che ci sono oggi. Inoltre, a quei tempi (dieci anni fa!) 150Gb erano un'enormita' oggi sono (quasi) bruscolini, quindi gestire questo numero di pagine non dovrebbe essere complicatissimo (il problema e', semmai, scegliere quali tenere e quali buttare, e questo e' forse un problema molto piu' complicato oggi che dieci anni fa) Quote:
| |||||
|
__________________
Shades by Everfluxx |
||||||
|
|
|
|
|
#15 (permalink) |
|
Grazie Ray71 per questi consigli.
Ora vediamo un attimino di analizzarli con calma e prendere delle decisioni e poi aprire i vari progetti. Si abbiamo letto quel documento Grazie davvero ![]() | |
|
__________________
Giorgio Taverniti Blog - Il mio account Twitter! Che aspetti? Diventa MODERATRICE del Forum gt ![]() Importante evento sul Web Marketing: 5 sale, 27 argomenti, 33 esperti presenti, streaming e video registrati...a soli 149€
|
|
|
|
|
| Tags: domandail, punto, situazione |
| Strumenti di discussione | |
|
|