Difference between revisions of "measure-brainstorming-fr"

From Microformats Wiki
Jump to navigation Jump to search
m
 
Line 1: Line 1:
= Brainstormin sur le Microformat de Mesure =
+
= Brainstorming sur le Microformat de Mesure =
  
 
Cette page rassemble des idées sur la manière d'utiliser le XHTML sémantique pour représenter sans ambiguité les [[measure-fr|mesure]]s.
 
Cette page rassemble des idées sur la manière d'utiliser le XHTML sémantique pour représenter sans ambiguité les [[measure-fr|mesure]]s.
Line 24: Line 24:
  
 
==Bogdan Stăncescu==
 
==Bogdan Stăncescu==
Here are my findings related to automatic parsing of measurements on web pages while developing the [http://converter.mozdev.org Converter] extension. Please ask away if you want me to go into more detail on any of the topics -- I'm not sure which of my experiences are relevant to microformats, so I'm going to give you an overview of my conclusions.
+
Voici mes trouvailles en rapport avec le parsage automatique des mesures sur les pages web tout en développant l'extension [http://converter.mozdev.org Converter]. Demandez svp si vous voulez que j'aille plus en détails sur n'importe lesquelles des thématiques -- je ne suis pas certain de savoir lesquelles de mes expériences sont pertinentes pour les microformats, aussi je vais vous donner un aperçu de mes conclusions.
  
By the way of an introduction, the Converter is a Firefox extension which tries to convert all measurements it finds in any web page to their Imperial or metric counterpart (e.g. Fahrenheit to Celsius, and Celsius to Fahrenheit; meters to feet and feet to meters). There are two steps to the conversion process: (1) identifying the measurements in the page, and (2) converting them. As expected, the conversion part is trivial, at least conceptually. The parsing is the tricky bit, and that's also where the Converter's challenges also become relevant for microformats.
+
En passant pour présenter, Converter est une extension Firefox qui essaye de convertir toutes les mesures qu'elle trouve sur n'importe quelle page web en leur contrepartie Impériale ou métrique (par ex. Fahrenheit vers Celsius, et Celsius vers Fahrenheit ; les mètres en pieds et les pieds en mètres). Il existe deux étapes pour le processus de conversion : (1) identifier les mesures dans la page, et (2) les convertir. Comme attendu, la partie conversion est triviale, au moins conceptuellement. Le parsage est le truc plus embêtant, et c'est là aussi que les défis de Converter deviennent aussi pertinents pour les microformats.
  
Here are the main challenges I have encountered while writing the Converter:
+
Voici les principaux défis que j'ai rencontrés en écrivant le Converter :  
  
;Presentation standardization: The first, biggest and most obvious challenge is lack of almost any ''de facto'' standardization in respect to data presentation. What I mean is that although the units themselves are more or less standardized (more on that later), they are ''presented'' in various ways within web pages. Take these examples: "50 foot monster", "50 ft monster", "50 feet monster", "50-foot monster", "50-feet monster" -- and my personal favorite, "fifty-foot monster" (more on this later);
+
;Standardisation de la Présentation: Le premier défi, le plus gros et le plus évident est l'absence de quelque standardisation ''de facto'' eu égard à la présentation de données. Ce que je veux dire est que même si les unités elles-même sont plus ou moins standardisées (plus sur ça à venir), elles sont ''présentées'' de différentes manières dans les pages web. Prenez ces exemples : "50 foot monster", "50 ft monster", "50 feet monster", "50-foot monster", "50-feet monster" -- et mon favori personnel, "fifty-foot monster" (plus sur ça à venir) ;
  
:Note that using a microformat using in particular the [[abbr-design-pattern-fr]] would make each of these examples less ambiguous if not unambiguous. See below --[[User:Guillaume_Lebleu|Guillaume_Lebleu]]:
+
:Remarquez qu'utiliser un microformat en utilisant en particulier le [[abbr-design-pattern-fr]] ferait de chacun de ces exemples des choses moins ambigus si ce n'est sans ambiguité. Voir en dessous. --[[User:Guillaume_Lebleu|Guillaume_Lebleu]]:
  
 
<pre>
 
<pre>
Line 54: Line 54:
 
</pre>
 
</pre>
  
:: Of course; as far as I could gather, that's actually the ''purpose'' of microformats -- bridging the gap between what humans and machines can understand, no? --[[User:BogdanStancescu|BogdanStancescu]] 00:30, 11 Oct 2006 (PDT)
+
:: Bien sûr ; jusqu'à la limite de ce que j'ai pu assembler, c'est véritablement ''l'objectif'' des microformats -- ponter le fossé entre ce que les humains et machines peuvent comprendre, non ? -- [[User:BogdanStancescu|BogdanStancescu]] 00:30, 11 Oct 2006 (PDT)
  
;Unit standardization: I live in Europe, where I've always used the metric system. As such, this probably was a much bigger nasty surprise for me than it is for a user of the Imperial/U.S. Customary system: in the Imperial system, the units themselves vary depending on where you are -- miles, pints, and a whole lot of other units come in many different flavors, but they're all written the same in regular usage;
+
;Standardisation des Unités : Je vis en Europe, où j'ai toujours utilisé le système métrique. En tant que tel, ceci a été probablement pour moi une plus grande surprise désagréable que ce ne l'est pour l'utilisateur du système habituel Impérial/US : dans le système Impérial, les unités elles-mêmes varient selon l'endroit où vous vivez -- miles, pintes et un paquet d'autres unités arrivent avec beaucoup de saveurs différentes, mais sont toutes écrites de la même façon en usage ordinaire ;
  
;Language: "1 meter" vs. "1 metre" is a reasonable difference -- but non-SI units are usually translated. Even some SI units have different plurals, depending on the language, although in theory SI units are actually denoted by ''symbols'', not "words", as to make them non-translatable, and truly international (hence the name of the SI). I haven't really given much thought to a solution towards parsing these, because I find it overwhelming for the time.
+
;Langue: "1 meter" vs. "1 mètre" est une différence raisonnable -- mais les unités non systèmes métriques sont généralement traduites. Même quelque unités de systèmes métriques ont des pluriels différents, selon la langue, même si en théorie les unités de systèmes métriques sont annotées par des ''symboles'', et non pas des "mots", comme pour les rendre non traduisibles, et vraiment internationales (d'où le nom de SI). Je n'ai pas vraiment beaucoup réfléchi à une solution pour les parser, parce que je trouvais cela trop chronophage.
  
;The sheer number of units: surprisingly, most people don't realize just how many units we humans have invented. Just take a look here: [http://www.asknumbers.com/ asknumbers.com] -- see how many categories there are? Now click on Flow Rate -- a non-ubiquitous type of measurement. Three sub-categories only for flow rates! Now click on Volume Flow Rate and take a look at the number of units in those lists. Remember, those are just in one of the three categories for flow rate! The UNECE standard mentioned in the [[measure-formats-fr|measure formats]] page is useful to define just that -- a ''standard'' set of units. But in practice there are a lot more being used out there.
+
;Le nombre très fin d'unités : à ma grande surprise, la plupart des personnes ne réalisent simplementp as combien d'unités nous les humains avons inventé. Jetez simplement un coup d'oeil à cela : [http://www.asknumbers.com/ asknumbers.com] -- regardez combien de catégories existent ? Maintenant cliquez sur "Flow Rate" -- un type de mesure sans ubiquité. Trois sous-catégories seulement pour les taux de flux ! Maintenant cliquez sur 'Volume Flow Rate' et jetez un oeil sur le nombre d'unités dans ces listes. Souvenez-vous, ce ne sont que simplement dans une des trois catégories pour un taux de flux ! Le standard UNECE mentionné dans la page des  [[measure-formats-fr|formats de mesure]] est utile pour définir simplement ça -- un ensemble ''standard'' d'unités. Mais en pratique il en existe bien plus utilisées ci et là.
  
:Do you have examples from the Web (a URL) of non-UNECE units. One possibility would be to provide the ability for a unit to be defined as a division of products of other units. This is consistent with the [[measure-formats-fr#Systeme_International]], which defines 7 base units and all other units as derived units (of course some units, even though they are derived are much easily represented as simple ones). This is what XBRL has done for financial/accounting/reporting. See [[currency-formats-fr#XBRL]] and theorical example (ampere acre per second) below --[[User:Guillaume_Lebleu|Guillaume_Lebleu]]:
+
:Avez-vous des exemples extraits du web (un URL) d'unités non-UNECE. Une possibilité serait de fournir la capacité pour une unité d'être définie comme une division de produits d'autres unités. Ceci est cohérent avec le [[measure-formats-fr#Systeme_International]], qui définit 7 unités de base et toutes les autres unités comme unités dérivées (bien sûr quelques unités, même si elles sont dérivées sont bien plus facilement représentées comme des unités simples). Ceci est ce qu'a fait XBRL pour les rapports de finance/comptabilité. Voir [[currency-formats-fr#XBRL]] et un exemple théorique en dessous (ampère acre par seconde) --[[User:Guillaume_Lebleu|Guillaume_Lebleu]]:
  
::Unfortunately I don't have URLs -- almost at all -- with measurements, although I've been in the "business" for a while. The reason for this is that I collect URLs of pages I encounter which are not properly parsed by the Converter, and when I release a version which understands those, I delete the URLs. Also, I never intended to cover all units in the Converter myself, for a multitude of reasons -- therefore I was never interested in the more exotic ones.
+
::Malheureusement je n'ai pas d'URLs -- almost at all -- avec des mesures, bien que je suis depuis un moment dans le "business". La raison à cela est que je collectionne des URLs des pages que je rencontre qui ne sont pas parsées proprement par le Converter, et quand je sort une version qui les comprend, j'efface les URLs. Aussi, je n'ai jamais eu l'intention de couvrir toutes les unités moi-même dans le Converter, pour une quantité de raisons -- par conséquent je ne me suis jamais intéressé dans les plus exotiques.
  
<small>Guillaume Lebleu's example</small>
+
<small>Exemple de Guillaume Lebleu</small>
 
<pre>
 
<pre>
 
<span class="unit">
 
<span class="unit">
Line 73: Line 73:
 
</pre>
 
</pre>
  
::Regarding your idea of breaking down the units in base units, that's something I've also been toying with in my head for the Converter. For my particular application, it's technically more difficult to implement this breakdown. For microformats, it would be easier, but there still remains at least one potential problem: you end up with a huge mess in the page. If a standard is too complicated to follow, one tends to give up altogether.
+
::Eu égard à ton idée de briser les unités en unités de base, c'est quelque chose avec laquelle j'ai aussi joué dans ma tête pour le Converter. Pour mon application spécifique, ce breakdown est plus difficile à mettre en oeuvre. Pour les microformats, ce serait plus facile, mais cela demeure encore au moins problème potentiel : vous aboutissez à un bazar énorme dans la page. Si un standard est trop compliqué, on tend à tous le laisser tomber.
  
::Consider a document which actually discusses some sort of current variation per farm, and therefore needs to repeatedly refer to ampere acres per second. For human use, they'd simply define the AAS somewhere at the top of the document, and then refer to AAS, KAAS or MAAS as needed. Maybe a similar approach should be considered for microformats as well:
+
::Imaginez un document qui discute véritablement de quelque sorte de variation en cours par ferme, et par conséquent a besoin de faire constamment référence à des "ampere acres par seconde". Pour l'usage humain, ils définiraient simplement le AAS quelque part en haut du document, et puis ferait référence à AAS, KAAS ou MAAS en fonction des besoins. Peut-être qu'une approche similaire pourrait être imaginée pour les microformats :  
  
 
<pre>
 
<pre>
We define the
+
Nous définissons l'
 
<span class="unit_definition">
 
<span class="unit_definition">
 
   <abbr class="unit_name">AAS</span>
 
   <abbr class="unit_name">AAS</span>
   as
+
   comme
 
   <abbr class="unit" title="AMP">Ampere</abbr>
 
   <abbr class="unit" title="AMP">Ampere</abbr>
 
   <abbr class="unit" title="ACR">acre</abbr>
 
   <abbr class="unit" title="ACR">acre</abbr>
   <span class="divide">per</span>
+
   <span class="divide">par</span>
   <abbr class="unit" title="SEC">second</abbr>
+
   <abbr class="unit" title="SEC">seconde</abbr>
 
</span>.
 
</span>.
 
</pre>
 
</pre>
  
::And then use the "AAS" throughout the document as any other pre-defined unit. How would you define (and use) the KAAS (1000 AAS) or MAAS (1,000,000 AAS) though? Is there any standard way already to use data multipliers in microformats? Or should we discuss that? Or is it out of scope? --[[User:BogdanStancescu|BogdanStancescu]] 00:30, 11 Oct 2006 (PDT)
+
::Et puis utilisons l'"AAS" dans tout le document comme n'importe quelle autre unité pré-définie. Comment définiriez-vous (et utiliseriez) le KAAS (1000 AAS) ou le MAAS (1,000,000 AAS) ? Y'a t'il déjà quelque moyen standard à utiliser des multiplicateurs de données dans les microformats ? Ou devrions-nous en parler ? Où est-ce hors sujet ? --[[User:BogdanStancescu|BogdanStancescu]] 00:30, 11 Oct 2006 (PDT)
  
That's all I can think of as major hurdles right now. If I remember anything else, I'll post here. Please do give me feedback here if you want to ask more about any of the topics I touched above, or if you have other questions I might be able to reply to. --[[User:BogdanStancescu|BogdanStancescu]] 12:08, 9 Oct 2006 (PDT)
+
C'est tout ce je peux penser comme un des obstacles majeurs à cette heure. Si je me souviens de quelque chose de vu ailleurs, je posterai ici. SVP donnez-moi vraiment ici vos réactions si vous voulez m'interrogrer plus en profondeur sur n'importe lesquelles de ces thématiques abordées au-dessus, ou si vous avez d'autres questions auxquelles je puisse être capable de répondre. --[[User:BogdanStancescu|BogdanStancescu]] 12:08, 9 Oct 2006 (PDT)

Latest revision as of 19:39, 6 November 2006

Brainstorming sur le Microformat de Mesure

Cette page rassemble des idées sur la manière d'utiliser le XHTML sémantique pour représenter sans ambiguité les mesures.

Guillaume Lebleu

Exemple basique avec unité élémentaire utilisant le modèle abbr et le code UNECE (voir measure-formats)

<span class="length">5 <abbr class="unit" title="FOT">Feet</abbr></span>

Une "value" optionnelle pourrait être utile dans certains cas, par exemple quand la valeur est fournie en texte clair :

<span class="length"><abbr class="value" title="5">Five</abbr> <abbr class="unit" title="FOT">Feet</abbr></span>


Andy Mabbett

Cette extension Firefox peut se montrer intéressante. Remarquez cependant qu'elle a été critiqué pour avoir un écran "embêtant" : Converter AndyMabbett 15:32, 3 Oct 2006 (PDT)

Je suis l'auteur de cette extension. Je ne veux pas aller plus loin là-dessus, mais je veux simplement clarifier ça brièvement. La section avec le "nag screen" est fausse sur deux points : (1) ce dialogue n'est plus là, et (2) même s'il était encore là, vous n'aviez seulement besoin de lire un paragraphe et de cliquer sur un bouton pour le faire disparaître à jamais -- mais vous n'avez pas à me prendre au mot, installez le vous même et observez. Le compte-rendu d'Andy est pertinenent néanmoins -- l'extension a été critiquée pour ce dialogue (c'est ce que vous obtenez de votre utilisateurs libres d'extensions quand vous leur demandez 15 secondes de leur temps pour des centaines d'heures de votre temps). --BogdanStancescu 09:35, 9 Oct 2006 (PDT)

Bogdan Stăncescu

Voici mes trouvailles en rapport avec le parsage automatique des mesures sur les pages web tout en développant l'extension Converter. Demandez svp si vous voulez que j'aille plus en détails sur n'importe lesquelles des thématiques -- je ne suis pas certain de savoir lesquelles de mes expériences sont pertinentes pour les microformats, aussi je vais vous donner un aperçu de mes conclusions.

En passant pour présenter, Converter est une extension Firefox qui essaye de convertir toutes les mesures qu'elle trouve sur n'importe quelle page web en leur contrepartie Impériale ou métrique (par ex. Fahrenheit vers Celsius, et Celsius vers Fahrenheit ; les mètres en pieds et les pieds en mètres). Il existe deux étapes pour le processus de conversion : (1) identifier les mesures dans la page, et (2) les convertir. Comme attendu, la partie conversion est triviale, au moins conceptuellement. Le parsage est le truc plus embêtant, et c'est là aussi que les défis de Converter deviennent aussi pertinents pour les microformats.

Voici les principaux défis que j'ai rencontrés en écrivant le Converter :

Standardisation de la Présentation
Le premier défi, le plus gros et le plus évident est l'absence de quelque standardisation de facto eu égard à la présentation de données. Ce que je veux dire est que même si les unités elles-même sont plus ou moins standardisées (plus sur ça à venir), elles sont présentées de différentes manières dans les pages web. Prenez ces exemples : "50 foot monster", "50 ft monster", "50 feet monster", "50-foot monster", "50-feet monster" -- et mon favori personnel, "fifty-foot monster" (plus sur ça à venir) ;
Remarquez qu'utiliser un microformat en utilisant en particulier le Abbr design pattern ferait de chacun de ces exemples des choses moins ambigus si ce n'est sans ambiguité. Voir en dessous. --Guillaume_Lebleu:
<span class="height"><span class="value">50</span><abbr class="unit" title="FOT">foot</abbr></span> monster
<span class="height"><span class="value">50</span><abbr class="unit" title="FOT">ft</abbr></span> monster
<span class="height"><span class="value">50</span>-<abbr class="unit" title="FOT">foot</abbr></span> monster
<span class="height"><span class="value">50</span><abbr class="unit" title="FOT">feet</abbr></span> monster
<span class="height"><abbr class="value" title="50">fifty</abbr><abbr class="unit" title="FOT">foot</abbr></span> monster
Bien sûr ; jusqu'à la limite de ce que j'ai pu assembler, c'est véritablement l'objectif des microformats -- ponter le fossé entre ce que les humains et machines peuvent comprendre, non ? -- BogdanStancescu 00:30, 11 Oct 2006 (PDT)
Standardisation des Unités 
Je vis en Europe, où j'ai toujours utilisé le système métrique. En tant que tel, ceci a été probablement pour moi une plus grande surprise désagréable que ce ne l'est pour l'utilisateur du système habituel Impérial/US : dans le système Impérial, les unités elles-mêmes varient selon l'endroit où vous vivez -- miles, pintes et un paquet d'autres unités arrivent avec beaucoup de saveurs différentes, mais sont toutes écrites de la même façon en usage ordinaire ;
Langue
"1 meter" vs. "1 mètre" est une différence raisonnable -- mais les unités non systèmes métriques sont généralement traduites. Même quelque unités de systèmes métriques ont des pluriels différents, selon la langue, même si en théorie les unités de systèmes métriques sont annotées par des symboles, et non pas des "mots", comme pour les rendre non traduisibles, et vraiment internationales (d'où le nom de SI). Je n'ai pas vraiment beaucoup réfléchi à une solution pour les parser, parce que je trouvais cela trop chronophage.
Le nombre très fin d'unités 
à ma grande surprise, la plupart des personnes ne réalisent simplementp as combien d'unités nous les humains avons inventé. Jetez simplement un coup d'oeil à cela : asknumbers.com -- regardez combien de catégories existent ? Maintenant cliquez sur "Flow Rate" -- un type de mesure sans ubiquité. Trois sous-catégories seulement pour les taux de flux ! Maintenant cliquez sur 'Volume Flow Rate' et jetez un oeil sur le nombre d'unités dans ces listes. Souvenez-vous, ce ne sont que simplement dans une des trois catégories pour un taux de flux ! Le standard UNECE mentionné dans la page des formats de mesure est utile pour définir simplement ça -- un ensemble standard d'unités. Mais en pratique il en existe bien plus utilisées ci et là.
Avez-vous des exemples extraits du web (un URL) d'unités non-UNECE. Une possibilité serait de fournir la capacité pour une unité d'être définie comme une division de produits d'autres unités. Ceci est cohérent avec le measure-formats-fr#Systeme_International, qui définit 7 unités de base et toutes les autres unités comme unités dérivées (bien sûr quelques unités, même si elles sont dérivées sont bien plus facilement représentées comme des unités simples). Ceci est ce qu'a fait XBRL pour les rapports de finance/comptabilité. Voir currency-formats-fr#XBRL et un exemple théorique en dessous (ampère acre par seconde) --Guillaume_Lebleu:
Malheureusement je n'ai pas d'URLs -- almost at all -- avec des mesures, bien que je suis depuis un moment dans le "business". La raison à cela est que je collectionne des URLs des pages que je rencontre qui ne sont pas parsées proprement par le Converter, et quand je sort une version qui les comprend, j'efface les URLs. Aussi, je n'ai jamais eu l'intention de couvrir toutes les unités moi-même dans le Converter, pour une quantité de raisons -- par conséquent je ne me suis jamais intéressé dans les plus exotiques.

Exemple de Guillaume Lebleu

<span class="unit">
<abbr class="unit" title="AMP">Ampere</abbr> <abbr class="unit" title="ACR">acre</abbr> <span class="divide">per</span> <abbr class="unit" title="SEC">second</abbr>
</span>
Eu égard à ton idée de briser les unités en unités de base, c'est quelque chose avec laquelle j'ai aussi joué dans ma tête pour le Converter. Pour mon application spécifique, ce breakdown est plus difficile à mettre en oeuvre. Pour les microformats, ce serait plus facile, mais cela demeure encore au moins problème potentiel : vous aboutissez à un bazar énorme dans la page. Si un standard est trop compliqué, on tend à tous le laisser tomber.
Imaginez un document qui discute véritablement de quelque sorte de variation en cours par ferme, et par conséquent a besoin de faire constamment référence à des "ampere acres par seconde". Pour l'usage humain, ils définiraient simplement le AAS quelque part en haut du document, et puis ferait référence à AAS, KAAS ou MAAS en fonction des besoins. Peut-être qu'une approche similaire pourrait être imaginée pour les microformats :
Nous définissons l'
<span class="unit_definition">
  <abbr class="unit_name">AAS</span>
  comme 
  <abbr class="unit" title="AMP">Ampere</abbr>
  <abbr class="unit" title="ACR">acre</abbr>
  <span class="divide">par</span>
  <abbr class="unit" title="SEC">seconde</abbr>
</span>.
Et puis utilisons l'"AAS" dans tout le document comme n'importe quelle autre unité pré-définie. Comment définiriez-vous (et utiliseriez) le KAAS (1000 AAS) ou le MAAS (1,000,000 AAS) ? Y'a t'il déjà quelque moyen standard à utiliser des multiplicateurs de données dans les microformats ? Ou devrions-nous en parler ? Où est-ce hors sujet ? --BogdanStancescu 00:30, 11 Oct 2006 (PDT)

C'est tout ce je peux penser comme un des obstacles majeurs à cette heure. Si je me souviens de quelque chose de vu ailleurs, je posterai ici. SVP donnez-moi vraiment ici vos réactions si vous voulez m'interrogrer plus en profondeur sur n'importe lesquelles de ces thématiques abordées au-dessus, ou si vous avez d'autres questions auxquelles je puisse être capable de répondre. --BogdanStancescu 12:08, 9 Oct 2006 (PDT)