+ Rispondi alla Discussione
Risultati da 1 a 6 di 6

[Brevetti Google] Sistema e metodo per focalizzare la ricerca in parti del database

Ultimo Messaggio di Giorgiotave il:
  1. #1
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Localit
    Monasterace
    Messaggi
    40,243
    Visita il canale Youtube di Giorgiotave

    [Brevetti Google] Sistema e metodo per focalizzare la ricerca in parti del database

    Apprendo da Seobythesea il rilascio di un nuovo brevetto da parte di Google: Sistema e metodo per focalizzare la ricerca in parti del database (spero sia corretto).

    Abstract

    When a search query is received, a plurality of partition indexes are searched using the set of search terms in the search query. Each partition index corresponds to a partition of a document index. The search of each respective partition index identifies a subset of a plurality of document index sub-partitions corresponding to the respective partition index. Next, the search query is executed by only those document index sub-partitions identified by the subsets, thereby identifying documents that satisfy the search query. By using the partition index to reduce the number of document index sub-partitions searched while executing a search query, the execution of the search query is made more efficient.
    Bill Slawski si chiede, se non sbaglio, se c'entra qualcosa si Risultati Supplementari?

    Is this extended index what we have been referring to as Google’s supplemental index? It could possibly be, or could have been. A recent blog post at the Official Google Webmaster Central Blog on supplemental results, Supplemental goes mainstream, tells us that Google is going to stop labeling supplemental results as “supplemental” because the differences between main index and supplemental index results is growing narrower, and supplemental results are now fresher and more comprehensive than they have ever been.
    Cosa ne pensate?

  2. #2
    ModSenior L'avatar di mister.jinx
    Data Registrazione
    May 2007
    Localit
    Toscana
    Messaggi
    8,676
    Segui mister.jinx su Twitter Aggiungi mister.jinx su Google+ Aggiungi mister.jinx su Facebook Aggiungi mister.jinx su Linkedin Visita il canale Youtube di mister.jinx
    E' da un p che Google contribuisce al progetto Hibernate, proprio sul settore del partizionamento orizzontale (sottoprogetto Shards).

  3. #3
    Esperto L'avatar di petro
    Data Registrazione
    Sep 2005
    Localit
    Piacenza
    Messaggi
    599
    Citazione Originariamente Scritto da Giorgiotave Visualizza Messaggio
    Cosa ne pensate?
    Bingo!
    la prova di una cosa che avevo notato e sulla quale volevo fare un test, ma ora non ce n' pi bisogno perch ho la certezza che gi la usano.

    Ci che avevo notato non ha nulla a che fare coi supplementari, vado a illustrare.

    L'ipotesi era questa: volevo dimostrare che in una serp, all'interno di una singola pagina di risultati, confluissero contemporaneamente informazioni provenienti da pi di un indice (database).

    Come me ne sono accorto?
    1. Ho fatto indicizzare un dominio A, poi ho creato un terzo livello di un dominio B.
    2. Il sottodominio del dominio B era nuovo di pacca, mai esistito prima, e non ha mai ricevuto alcun backlink, mentre invece il dominio A era indicizzato.
    3. In queste condizioni, ho eseguito un redirect 301 dal dominio A al sottodominio del dominio B.
    4. Lo spider ha seguito il redirect di A, ed ha trovato ed indicizzato il sottodominio B.
    5. L'unico modo in cui pu aver trovato il sottodominio B proprio attraverso il redirect, perch sottodominio B non ha mai ricevuto backlinks, n visite (fino a quel momento i log erano immacolati).
    6. Google avrebbe quindi dovuto de-indicizzare il dominio A, o meglio trasferire tutte le informazioni che aveva su A verso il sottodominio B, e contemporaneamente rimuovere A dall'indice (quello che succede normalmente col 301)
    7. Se non che, ad un certo punto, nella stessa serp comparivano contemporaneamente sia il dominio A che il sottodominio B.
    8. Dopo qualche giorno, tutto tornato alla normalit: dominio A stato deindicizzato, e le informazioni sono state trasferite al sottodominio B.
    9. Ma per un periodo hanno convissuto nella medesima serp, e non potevano che provenire da due indici distinti e non sincronizzati.

    Avrei voluto mettere un test per avere la conferma definitiva, ma questo brevetto descrive esattamente (anche) questo comportamento:
    # The use of a cache to return results for popular searches,
    # How terms may be mapped to different partitions and sub partitions
    Il resto del brevetto me lo studio con calma al ritorno dalle ferie, per adesso basta SEO.

    Buon ferragosto a tutti

  4. #4
    Esperto L'avatar di beke
    Data Registrazione
    Mar 2005
    Localit
    Firenze
    Messaggi
    1,316
    Citazione Originariamente Scritto da petro Visualizza Messaggio
    ...Ma per un periodo hanno convissuto nella medesima serp, e non potevano che provenire da due indici distinti e non sincronizzati....
    Non lo so Petro...
    Oggi in treno, come ultima azione SEO prima dell'inizio delle ferie, ho dato un'occhiata al paper in questione e a me sembra che parli di tecniche per trattare in modo separato determinate parti di uno stesso indice e non di un sistema per ordinare dati provenienti da indici diversi.

    Non credo che possa giustificare il tipo di fenomeno a cui tu hai assistito.

    Credo invece, anche se nel documento questo non viene mai menzionato in modo esplicito, che si tratti del modo in cui zio Google tratta (trattava? Boh...) i risultati supplementari.


  5. #5
    Utente Premium L'avatar di fdaguanno
    Data Registrazione
    May 2007
    Messaggi
    211
    Citazione Originariamente Scritto da petro Visualizza Messaggio
    e non potevano che provenire da due indici distinti e non sincronizzati
    In base a quale legge ? Non credo dipenda da una limitazione del database, che non accetti due record (quasi) identici (l'ho detta in maniera semplicistica, ma spero sia chiaro il senso )...

    Citazione Originariamente Scritto da petro Visualizza Messaggio
    perch sottodominio B non ha mai ricevuto backlinks, n visite (fino a quel momento i log erano immacolati)
    Per log intendi i "log del webserver" ? Intendi dire che oltre ai visitatori, non era passato neanche uno spider ? Mi sembra strano che Google mostri risultati solo in base ad un redirect, senza prima aver controllato di "persona"...


    Citazione Originariamente Scritto da petro Visualizza Messaggio
    volevo dimostrare che in una serp, all'interno di una singola pagina di risultati, confluissero contemporaneamente informazioni provenienti da pi di un indice (database)
    Non ho ancora capito bene quale sia l'idea comune... Ma dite un po', credete che Google tenga miliardi di record un un'unica tabella e in unico database ? Ho lavorato per qualche tempo con database che gestivano centinaia di milioni di record (ma mai miliardi per tabella, e neanche per database) e penso fermamente che i dati degli indici di Google risiedano su pi tabelle e quasi di sicuro su pi database, in base a qualche strano criterio di archiviazione. Purtroppo non ne ho le prove, ma credo che non ci siano neanche le prove per escluderlo.

    Ciao.

  6. #6
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Localit
    Monasterace
    Messaggi
    40,243
    Visita il canale Youtube di Giorgiotave
    Ciao Francesco e Benvenuto nel Forum GT

    ti volevo segnalare questo thread, forse ti pu interessare: Google BigTable e l’archiviazione dei dati storici

    Buon Forum GT

+ Rispondi alla Discussione

Tag per Questa Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] Attivato
  • Il codice [VIDEO] Attivato
  • Il codice HTML Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.