parsing-microformats-fr: Difference between revisions

From Microformats Wiki
Jump to navigation Jump to search
(parsing-microformats - to be reviewed)
(No difference)

Revision as of 09:13, 27 June 2006

Parser les Microformats

Le mécanisme de parsage des microformats qui dépend de documents ayant même des propriétés xml minimales comme celles bien formées peut échouer au moment de consommer un contenu non-bien-formé. Tidy ou même mieux CyberNeko peut être un travail utile à regarder. En particulier, X2V la découverte et les prototypes de transformation fréquemment citées de X2V hCard et hCalendar utilisent XSLT, et "nettoient" toute entrée non bien formée avant de la traiter.

La plupart des microformats tendent à être agnostiques sur des choses comme le type d'élément exact à utiliser.

Les développeurs peuvent utiliser des outils comme XPATH qui supposent "well-formedness" sur un contenu bien-formé (à partir du web ou par l'utilisation de tidy). L'exemple du parseur universel de fil de Mark Pilgrim suggère qu'il peut être possible de nettoyer le html utilisateur jusqu'à un stade où il est adaptable pour un processus à venir comme le xml.

Parser les valeurs de classe

Au moment de parser les valeurs de classe, un soin doit être porté :

  1. les attributs Class peuvent contenir plusieurs noms de classe, par ex : class="foo vcard bar"
  2. les attributs Class peuvent contenir plusieurs noms de classe qui continennet le nom de classe utilisé par un microformat, par ex : class="foovcardbar" class="foovcard", class="vcardbar".
  3. Plusieurs noms de classe sont séparés pr un ou plusieurs caractères espace blanc.
  4. Les noms de classes sont sensibles à la casse.

Voir http://www.la-grange.net/w3c/html4.01/struct/global.html#h-7.5.2

Exemple JavaScript

if (elemenent.className.match(/\bvcard\b/)) ...

Exemple XSLT

<xsl:if test="contains(
   concat (
       ' ',
       concat(normalize-whitespace(@class),' ')
   ),
   ' vcard '
 )" > ...

Parser les valeurs rel/rev

Parser les valeurs rel et rev est similaire au parsage de valeurs de classe exception faite pour les différences suivantes :

  1. les valeurs rel et rev devraient être séparées par un espace.
  2. les valeurs rel et rev ne sont pas sensibles à la casse.

Voir http://www.la-grange.net/w3c/html4.01/types.html#h-6.12.

Voir aussi