• ModSenior

    Yahoo: parti di pagine più significative di pagine web

    Nel brevetto di Yahoo dal titolo "Tecniche per approssimare il layout visuale di una pagina e determinare la porzione della pagina che contiene testo significativo" (Il link al brevetto è questo) si legge che il motore e' in grado di approssimare un layout visuale di una pagina web senza renderizzarla.

    In pratica viene attraversato ricorsivamente un albero di oggetti che rappresenta gli elementi dentro la pagina per determinare i limiti della larghezza degli elementi.

    Per ogni elemento il brevetto determina vari tipi di larghezza: quella minima richiesta, quella desiderata senza vincoli e quella massima disponibile basata sui vincoli esistenti dagli elementi padre.

    Poi, facendo avanzare un cursore tra gli elementi, vengono determinate le posizioni di ogni elemento. L'elemento che ha contenuti più significativi viene deterinato sulla base delle dimensioni degli elementi e della loro posizione nella
    pagina.

    (Nota: questo testo e' una rielaborazione discorsiva dell'abstract del brevetto)