EXEMPLARY PROCESSING
[0130] FIG. 4 is a flowchart of exemplary processing for scoring documents according to an implementation consistent with the principles of the invention. Processing may begin with
server 120 identifying documents (act 410). The documents may include, for example, one or more documents associated with a search query, such as documents identified as relevant to the search query. Alternatively, the documents may include one or more documents in a corpus or repository of documents that are independent of any search query (e.g., documents that are identified by crawling a network and stored in a repository).
[0130] Nella figura 4 c’e’ il diagramma di flusso del trattamento esemplare per l’assegnazione del punteggio al documento in accordo con l’ implementazione coerente con i principi dell’invenzione.
Il trattamento può cominciare con l’identificazione “server 120” del documento (act 410). I documenti possono includere, per esempio, uno o più documenti associati con una query di ricerca, come i documenti identificati come rilevanti per la query. Alternativamente, i documenti possono includere uno o più documenti nel corpo (corpus: raccolta di scritti insieme dei documenti) o “magazzino” (repository: deposito, magazzino, ripostiglio. Azzardo io: forse il db delle cache?) di documenti che sono indipendenti da ogni query di ricerca.(per esempio i documenti che sono stati identificati spiderizzando un network e immagazzinando i dati nel “deposito”).
[0131]
Search engine 125 may obtain history data associated with the identified documents (act 420). As described above, the history data may take different forms. For example, the history data may include data relating to document inception dates; document content updates/changes; query analysis;
link-based criteria;
anchor text; traffic; user behavior; domain-related information; ranking history; user maintained/generated data (e.g., bookmarks and/or favorites); unique words, bigrams, and phrases in anchor text; linkage of independent peers; and/or document
topics. Search engine 125 may obtain one, or a combination, of these kinds of history data.
[0131] GG può ottenere l’ history data associate con i documenti identificati (act 420). Come descritto sopra, l’history data può assumere diverse forme. Per esempio, l’history data può includere dati relativi alla data di introduzione del documento; alle date di aggiornamenti/cambiamenti del contenuto del documento;..cut.. praticamente controlla l’history data di tutte le sezioni fin qui analizzate penso… e GG può ottenerne una, o una combinazione, di questi tipi di history data.
[0132] Search engine 125 may then score the identified documents based, at least in part, on the history data (act 430). When the identified documents are associated with a search query, search engine 125 may also generate relevancy scores for the documents based, for example, on how relevant they are to the search query. Search engine 125 may then combine the history scores with the relevancy scores to obtain overall scores for the documents. Instead of combining the scores, search engine 125 may alter the relevancy scores for the documents based on the history data, thereby raising or lowering the scores or, in some cases, leaving the scores the same. Alternatively, search engine 125 may score the documents based on the history data without generating relevancy scores. In any event, search engine 125 may score the documents using one, or a combination, of the types of history data.
[0132] GG può poi valutare il documento identificato basato, almeno in parte, sulla history data (act 430). Quando i documento identificati sono associati con una query di ricerca, GG può anche generare punteggi attinenti per i documenti basati, per esempio, su quanto pertinenti essi sono per la query di ricerca. GG può combinare i punteggi di history con i punteggi pertinenti per ottenere punteggi “generali” per I documenti. Invece di combinare i punteggi, GG può alterare l’attinenza dei punteggi per i documenti basati sull’history data, alzando o abbassando quindi i punteggi o, in alcuni casi, lasciando inalterati gli stessi. Alternativamente, GG può valorizzare i documenti basati sull’history data senza generare punteggi pertinenti.
[0133] When the identified documents are associated with a search query, search engine 125 may also form search results from the scored documents. For example, search engine 125 may sort the documents based on their scores. Search engine 125 may then form references to the documents, where a reference might include a title of the document (which may contain a hypertext link that will direct the user, when selected, to the actual document) and a snippet (i.e., a text excerpt) from the document. In other implementations, the references are formed differently. Search engine 125 may present references corresponding to a number of the top-scoring documents (e.g., a predetermined number of the documents, documents with scores above a threshold, all documents, etc.) to a user who submitted the search query.
[0133] Quando I documenti identificati sono associati a una query, GG può formare la
serp dai punteggi dei documenti. Per esempio, GG può ordinare i risultati in base ai punteggi dei documenti. GG può allora formare delle referenze per i documenti, dove una referenza può includere un titolo del documento (che può contenere un link con anchor that dirigerà l’utente all’attuale documento) e uno snippet dal documento. In altre implementazioni, le referenze sono formate differentemente. GG può presentare referenze corrispondendo al numero dei documenti con maggior punteggio a un utente che ha fatto una certa query.
dai che e' + o - fatta...quelle due righe di conclusioni che mancano mi pare siano superflue a questo punto.
In giornata provo a dargli una risistemata generale.
