Quote:
|
Giorgiotave
Quindi in pura teoria lui potrebbe andare a visionare tutti i documenti presenti nel suo database e confrontarli con il LSI.
Oltre a questa tecnica quale altre potrebbe usare?
|
Un sistema per l'espansione della query che secondo me ha buone probabilitā di essere usato č quello a cui ha giā accennato Low e che Bharat ha usato per esempio nel suo
algoritmo di
Topic Distillation.
Si esegue la query dell'utente e si ordinano i risultati normalmente, dopodichč si assume che i risultati top-ranked siano rilevanti, vuoi per questioni di contenuto che di
PR o di
Trust.
Si preleva il contenuto dei documenti top-ranked e filtrando i termini non utili (per es. i termini usati troppo spesso nell'intero indice e i termini usati troppo poco) si ottengono i termini con i quali verrā formata la query espansa.
La si esegue ed infine si ordinano i risultati eseguendo il confronto fra i logaritmi dei vettori di termini dei documenti e della query.