Ad oggi i motori di ricerca sono poco inclini all'analisi degli errori HTML, quindi alla loro validazione, e si limitano a leggere prevalentemente i contenuti al di fuori dei tag (e in alcuni casi il testo contenuto nel codice javascript in line).

Per chi si sta chiedendo se i MDR abbiano un sistema di controllo della validità del codice, la risposta trova diverse argomentazione. C'è chi dice che i principali e più potenti effettuano un controllo della struttura HTML basato sull'analisi del DOM (document object model) di ogni singola pagina (non sul WAI, più esigente e rigoroso), chi invece sostiene che non venga effettuato alcun controllo (e questo potrebbe giustificare il fatto che molti risultati presenti nelle SERP riconducano a pagine di bassissimo profilo tecnico e contenutistico).

Premessa a parte, gli errori HTML in relazione ai MDR si possono classificare in due macro categorie.

La prima è quella degli errori "semplici" che, seppure generando un output differente dalle intenzioni dell'impaginatore, non comportano una mancata visualizzazione del testo.

Per esempio:

Codice:

<br> <TABLE BORDER=1 WIDTH=200> <TR><TD>Table content</TR> </TABLE>

la mancata chiusura del tag TableData non causa l'omissione del testo "Table content" nella tabella all'interno del documento.

Per esser più precisi le specifiche del W3C stabiliscono che la chiusura di entrambi i tag TD e TR non è obbligatoria (se non ci credete, guardate qui a metà pagina) pertanto un browser W3C conformante chiude normalmente la tabella senza farsi problemi. Sia MSIE sia FF rispettano questa specifica, e, ciò che più ci interessa, anche gli spider leggono quel contenuto per indicizzarlo.

Nell'esempio visto sopra non c'è conseguenza visibile all'errore dell'impaginatore.

Vediamo invece questo esempio:

Codice:

<FONT FACE="Arial SIZE="4">text</FONT>

In questo caso il testo inserito all'interno dei tag non sarà né Arial né di dimensione 4.v Questo è un errore più visibile perché a livello grafico si ottiene qualcosa di diverso da quanto desiderato. Il testo stampato a video non sarà formattato come si vorrebbe.
Anche in questo caso però gli spider non si fanno problemi: indicizzano il contenuto di quei tag.

La seconda categoria è quella degli "errori gravi": quegli errori di marcatura che fanno sì che non sia stampato a video il contenuto desiderato. Fa parte di questa categoria di errori l'omissione di virgolette singole ' e doppie " o degli apici < e >.

Per esempio:

Codice:

<FONT FACE="Arial SIZE=4>contenuto del tag "font"</FONT>
In questo caso l'analisi DOM non è in grado di stabilire dove finisca il tag di apertura, dal momento che l'apice ">" che ne delimita la chiusura si trova per errore all'interno del valore dell'attributo FACE. Di conseguenza è come se non esistesse. Infatti viene letto:

Codice:

<FONT FACE="unknown font"</FONT>

e avrà valore solo il tag di chiusura
, con conseguente risultato di chiusura di altri eventuali tag FONT aperti in precedenza. Di fatto il contenuto dei tag è nullo e non viene letto dal browser (provare per credere) né dallo spider.

FAQ Correlate

Che relazione c'è tra gli errori di validazione ed i motori di ricerca?

--Moroandrea 15:37, Gen 7, 2008 (CET)

FAQ Posizionamento nei Motori di Ricerca
Spider GT-1.jpg
Approfondimenti?
WikiGT Locuzioni Categoria Posizionamento nei motori di ricerca
Domande?
Apri un Thread nella sezione Posizionamento nei motori di ricerca
Accedi alla home del Forum GT

  • Questa pagina è stata modificata per l'ultima volta il 7 gen 2008 alle 16:37.
  • Questa pagina è stata letta 1 637 volte.