• ModSenior

    Brevetto Yahoo: le query necessarie

    Il brevetto assegnato a Yahoo ha titolo "Sistemi e metodi per spiderizzare ordinando secondo l'impatto della ricerca" e affronta il tema dell'indicizzazione.

    Obiettivo di uno spider è recuperare contenuti dal web. Le pagine non indicizzate sono sempre tante e gli spider dei motori di ricerca sono continuamente al lavoro e analizzano sempre nuovi contenuti.

    Con questo brevetto però secondo Yahoo possono essere recuperati contenuti dal web per aspetti non legati alle query.
    Ad esempio se una URL ha ricevuto molti backlink o un certo valore di PageRank, anche se non è mai stata visitata e indicizzata, può essere messa nella coda di spiderizzazione per analizzare il contenuto della risorsa.

    Oppure usando il "focused crawling", uno spider può seguire le URL indicate in un gruppo di URL già indicizzate in precedenza cercando risorse che hanno a che fare con lo stesso tema.

    Con questo brevetto Yahoo! dichiara di analizzare anche i log delle query generate dagli utenti per andare più a fondo nell'analisi di nuove URL di cui il motore è già a conoscenza ma non ha ancora spiderizzato, partendo dalle query più ricorrenti. E Yahoo! sempre con questo brevetto dichiara di analizzare anche le parole chiave presenti in URL, anchor text dei link, numero di link che puntano alle URL, e nome a dominio.

    Il brevetto è qui.
    La fonte è: seobythesea.com/?p=1822 .

    Il brevetto fa anche riferimento ad altri documenti: