Beh, certamente oltre al fattore 'Tempo' hanno lavorato a qualche filtro che potesse gestire la 'nuova cosa'.
Si tratta di indicizzare una mole di dati ENORME in pochissimo tempo, sulla base di un proliferante impero di siti di UGC: praticamente Caffeine impone un nuovo 'face-to-face' con lo
spam, questo è assai probabile.
E non solo con lo spam vero e proprio, ma anche - molto più semplicemente - con i contenuti da filtrare.
Pensiamo a cosa succede quando un account
Twitter molto noto cinguetta un messaggio 'importante': si becca centinaia di retweet con moltissima probabilità!
Secondo me è chiaro che Caffeine vuole indicizzare e dare rilevanza a quel tweet originale, SOPRATTUTTO perchè ha ricevuto molti RT e magari moltissimi reply.
Ma altrettanto probabilmente deve filtrare quelle migliaia di RT, velocemente e con buon margine di approssimazione.
Quindi direi che si, hanno lavorato anche sui filtri.