• User

    Espansione delle query: Google Search Appliance

    Vorrei segnalarvi l'ultimo post pubblicato sul blog ufficiale di Google Enterprise, a proposito dell'espansione delle query sul prodotto destinato alle aziende (Google Search Appliance): Tech Tip: Flexible Query Expansion Policies
    Riporto (grassetto mio):

    The Google Search Appliance can automatically expand a search-users query by adding synonyms and words with the same stem.
    [...]
    Administrators also have ability to custom upload their synonyms file or blacklist certain terms.
    [...]
    You can log-in to the administrative console of Google Search Appliance and enable the Query Expansion feature. We provide you with 4 flexible options and these are:
    None - This is by default and it disables the query expansion feature completely.
    Standard: Enables query expansion, using Google's built-in synonyms.
    Local: Enables query expansion, using only the synonyms that you upload to the appliance.
    Full: Enables query expansion, using both Google's built-in synonyms and the files that you upload to the appliance.
    [..]
    Here is the example of the custom synonyms file uploaded to search appliance.
    #Synonyms file created Oct 2006
    #Author: nitinm
    product abc = product xyz
    FED = federal electronics division
    {phone, cell, mobile, telephone}

    There are **two formats we support for the synonyms file
    **Format 1: term1 operator term2
    In this format:
    ? term1 consists of one word or multiple words that are separated by single spaces.
    ? term2 consists of one word or multiple words that are separated by single spaces.
    ? operator is one of the following:
    = Specifies that the words are equivalent. The appliance expands a search query for term1 or term2 by adding the other term.

    Causes the appliance to add term2 when a search query contains term1.

    Entry format 2: {term, term, ...}
    In this format:
    ? Each term in the list will be used to expand queries for each other term.
    ? The use of brackets {} was introduced with the current release

    And finally you can create the blacklists file to mark certain words that should not be expanded. The blacklists file is applicable to both Google built-in synonyms and your custom synonyms file.

    Essendo io abbastanza ignorante in materia, mi piacerebbe sapere da voi se è possibile ipotizzare che un funzionamento simile sia alla base del motore di ricerca.
    In particolare, mi piacerebbe avere vostre considerazioni sugli operatori, "=" e ">": mi sembra di capire che con il primo vale l'equivalenza tra due termini; con il secondo, vale una relazione univoca (tra key1 e key2, ma non il contrario).


  • Community Manager

    Ciao Gine e grazie di questo piccolo contributo.

    Sposto la discussione in posizionamento, primo per chiedere a qualcuno di tradurre le righe sopra, secondo perchè mi interessa parecchio il parere degli utenti su questo bellissimo post 🙂

    Nonostante parli di Google in modo particolare, è molto interessante la parte che potrebbe svilupparsi lato SEO.

    Giorgio


  • User

    Giorgio, grazie a te (sia per il forum: colgo l'occasione in quanto neo-iscritto, seppure lettore affezionato da tempo), che per lo spostamento.
    In effetti ero indeciso se postare in Google GT o Posizionamento.

    Se non mi precede nessuno, inizio a tradurre 🙂


  • User

    Perdonate le semplificazioni nella traduzione.
    Spero solo di non aver tradotto sbagliato. 🙂
    (il grassetto è sempre mio)

    Google Search Appliance può automaticamente espandere una ricerca (query) degli utenti, aggiungendo sinonimi e parole con la stessa radice (ndr: non sapevo bene come tradurre stem).
    [...]
    Gli amministratori hanno anche la possibilità di caricare/inserire un file personalizzato con i sinonimi o una blacklist.
    [...]
    Ci si può loggare alla console di amministrazione di Google Search Appliance e abilitare la funzionalità Espansione delle Query (Query Expansion). Ci sono** 4 opzioni possibili**:
    Nessuna: Definita di default, disabilita completamente la funzionalità Espansione delle Query
    Standard: Abilita l'espansione delle query, usando i sinonimi definiti da Google (Google's built-in synonyms).
    Locale: Abilita l'espansione delle query, usando solo i sinonimi caricati nell'applicazione (the synonyms that you upload to the appliance).
    Completa: Abilita l'espansione delle query, usando sia i sinonimi definiti da Google (Google's built-in synonyms) sia i file caricati dall'utente (the files that you upload to the appliance)
    [...]
    Un esempio di file con i sinonimi personalizzati, caricato dall'utente.
    #Synonyms file created Oct 2006
    #Author: nitinm
    product abc = product xyz
    FED = federal electronics division
    {phone, cell, mobile, telephone}

    Son possibili due formati per i file dei sinonimi
    Formato 1: term1 operator term2
    Con questo formato:
    • term1 rappresenta una o più parole separate da spazi singoli
    • term2 rappresenta una o più parole separate da singoli spazi
    • operator è uno dei seguenti:
    = Specifica quali parole sono equivalienti. L'applicazione espande una query di ricerca per term1 o term2 aggiungendo l'altro termine.

    Fa sì che l'applicazione aggiunga term2 quando una query contiene term1.

    Formato 2: {term, term, ...}
    Con questo formato:
    • Ogni parola nella lista sarà usata per espandere le query per ogni altro termine.
    • L'uso delle parentesi graffe {} è stato introdotto con l'ultima release.

    Infine, è possibile creare i file con le blacklist per segnare alcune parole che non dovrebbero essere espanse. I file con le blacklist sono riferibili sia ai sinonimi definiti da Google, sia a quelli definiti dall'utente con un file personalizzato.


  • Community Manager

    Ciao Gine,

    trovo il progetto molto molto interessante e sono sicuro che Pigot e Kerouac ora drizzeranno il mouse da queste parti 😄

    Bello, creeranno un DB fatto dagli utenti e potranno usare questi dati per tanti motivi.

    Ora occorre immediatamente testare la ricerca caricando noi stessi qualche sinonimo.

    Allora, chi si offre di farlo?


  • User Attivo

    Mouse drizzato ma in questo momento non ho tantissimo tempo per approfondire la cosa. Mi sa che Kerouac è anche nella stessa condizione. Siamo leggermente incasinati. 🙂


  • Super User

    @Gine said:

    Essendo io abbastanza ignorante in materia, mi piacerebbe sapere da voi se è possibile ipotizzare che un funzionamento simile sia alla base del motore di ricerca.

    Il motore di ricerca per il Web sfrutta soluzioni un po' più sofisticate.

    Premesso che il concetto di "lista di sinonimi" trova applicazione anche nel motore per il Web, di solito i motori di ricerca più evoluti espandono la query anche con altri metodi.

    Ad esempio: espansione con informazioni ottenibili dagli algoritmi di clustering, espansione con informazioni estraibili da un corpus locale, ovvero dall'insieme dei documenti che compongono i risultati della query iniziale, ed altre soluzioni ancora più sofisticate.

    In particolare, mi piacerebbe avere vostre considerazioni sugli operatori, "=" e ">": mi sembra di capire che con il primo vale l'equivalenza tra due termini; con il secondo, vale una relazione univoca (tra key1 e key2, ma non il contrario).

    Sì, esatto.

    I due simboli possono essere usati come si vuole, ma se volessimo individuarne una valenza semantica, potremmo dire che il simbolo di uguale "=" potrebbe essere usato per indicare dei sinonimi (termine1 ha lo stesso significato di termine2 e viceversa) mentre il simbolo ">" potrebbe essere usato per indicare un rapporto di iperonimia/iponimia (termine2 rientra nella classe di termine1 ma non viceversa. Es: felino > gatto).


  • Super User

    @Giorgiotave said:

    Ora occorre immediatamente testare la ricerca caricando noi stessi qualche sinonimo.

    Allora, chi si offre di farlo?

    Ehm... Ci vuole una Google Search Appliance. (Qualcuno ce l'ha?)