Connect.gt

Condividiamo idee e conoscenza dal 2003...
...dopo 17 anni una Nuova Storia è nata
Scopri di più

Stop words

Stop words o stopwords, è il nome dato alle parole che vengono filtrate a priori o conseguentemente ad un processo di analisi dei testi di documenti presenti in un data base, come ad esempio: - da, in, per, il, chi, su, ecc..

Hans Peter Luhn, uno dei pionieri dell'information retrieval, è ritenuto il creatore del termine e colui che per primo ha usato il concetto nei suoi progetti.


Il sistema di filtro delle stop words è di solito regolato ed organizzato da umani e non automaticamente.

L'applicazione del sistema di analisi dei testi stop words si è rivelato inizialmente di non facile applicazione agli algoritmi dei motori di ricerca in quanto a volte influenzava negativamente la naturale lettura degli articoli del discorso alterando la loro comprensione e quindi il risultato dell'analisi.


  • Questa pagina è stata modificata per l'ultima volta il 24 nov 2008 alle 07:12.
  • Questa pagina è stata letta 1 513 volte.