Wow! Premesso che mi hai fatto commuovere pių di una volta, veniamo a noi:
Quote:
Gli oggetti in comune a piu ' categorie, come li tratti?
Semplice, dopo aver creato le categorie le ordini per "importanza", gli oggetti comuni a piu' categorie li metterai-suddividerai nelle categorie minori o maggiori, a tua scelta.
|
E se ripetessimo l'algoritmo ricorsivamente, escludendo le "categorie" del livello superiore? Otterremmo delle sotto-categorie...
Quote:
Ma torniamo alla questione base, come decidi quale oggetto sara' categoria?
k >= m+2s
Non mi sembra applicabile, nessun K supera (realmente) media + varianza, a maggior ragione media + varianza * 2
|
In teoria, se la distribuzione č di Gauss (ipotesi da verificare nel linguaggio "pseudo-naturale" delle frasi scritte nella textBox di ricerca...), l'80% dei "campioni"
(in questo caso le
keywords) si distribuisce tra m+-2s...(il "meno" mi preoccupa...)
In ogni caso i risultati che sto ottenendo sono soffisfacenti, ma stanno uscendo anche cose strane...
Un'altra soluzione potrebbe essere quella di passare agli spazi vettoriali: una keyphrases appartiene ad una categoria(=significato?) sel il prodotto scalare dei due vettori tende a 1 (ovvero sono vettori "paralleli")...Ma come assegnare ad una frase un "insieme di coordinate"???