robots-exclusion-fr: Difference between revisions

From Microformats Wiki
Jump to navigation Jump to search
m (Replace <entry-title> with {{DISPLAYTITLE:}})
 
(14 intermediate revisions by one other user not shown)
Line 1: Line 1:
= Profil Robot Exclusion =
{{DISPLAYTITLE:Robot Exclusion Profil}}
__TOC__
{{DraftSpecification-fr}}
== Spécification Brouillon du 18-06-2005 ==
== Spécification Brouillon du 18-06-2005 ==


Line 8: Line 8:


=== Copyright ===
=== Copyright ===
Cette spécification est © 2004-2005 par l'auteur. Néanmoins, l'auteur a pour intention de soumettre cette spécification à un corps de standards avec une politique libérale de copyright telle que le [http://gmpg.org/ GMPG]. Voir les [http://gmpg.org/principles Principes GMPG] pour plus de détails. Quiconque souhaitant contribuer à cet effort DOIT lire ces principes, tout spécialement ceux considérant le copyright et la licence, et être d'accord avec eux avant de contribuer.
De par la sortie dans le domaine public des pages utilisateur des auteurs et contributeurs ([[User:PeterJ|Peter Janes]], [[User:RyanKing|Ryan King]], [[User:Tantek|Tantek Çelik]]), cette spécification est versée dans le domaine public.
 
Obligation de Contribution dans le Domaine Public. Du fait que les auteurs aient diffusé leurs travaux dans le domaine public, afin de maintenir ce statut de travail dans le domaine public, tous les contributeurs sur cette page sont aussi d'accord pour publier leurs contributions sur cette page dans le domaine public. Les contributeurs peuvent indiquer leur accord en ajoutant le modèle de sortie dans le domaine public (http://microformats.org/wiki/Template:public-domain-release) à leurs pages-utilisateur selons les instructions "Voluntary Public Domain Declarations" (http://microformats.org/wiki/Category:public_domain_license). Les contributions non publiées dans le domaine public peuvent être révoquées/retirées.


=== Brevets ===
=== Brevets ===
Line 14: Line 16:


== Abstract ==
== Abstract ==
Le Profil Robot Exclusion est un retravail de la balise Robots META (et des extensions moins standards) sous un [[microformat-fr|microformat]].
Le Profil Robot Exclusion est un retravail de la balise [[Robots META]] (et des extensions moins standards) sous un [[microformat-fr|microformat]].


== Introduction ==
== Introduction ==
La balise [http://www.robotstxt.org/wc/meta-user.html Robots META] est utilisée pour fournir une direction spécifique-à-une-page pour les crawlers web. Tout en étant utile dans beaucoup de cas, sa nature spécifique-à-une-page veut dire qu'elle ne peut pas être utilisée pour empêcher les crawlers d'indexer seulement certaines sections d'un document. Plusieurs tentatives ont été produites pour créer des solutions plus granulaires à travers différentes méthodes mais ont été perçues comme des raccourcis qui limitent leur utilisation ; Le Profil Exclusion Robot détinit un microformat qui peut être appliqué à n'importe quel élément ou ensemble d'éléments dans une page.
La balise [[Robots META]] est utilisée pour fournir une direction spécifique-à-une-page pour les crawlers web. Tout en étant utile dans beaucoup de cas, sa nature spécifique-à-une-page veut dire qu'elle ne peut pas être utilisée pour empêcher les crawlers d'indexer seulement certaines sections d'un document. Plusieurs tentatives ont été produites pour créer des solutions plus granulaires à travers différentes méthodes mais ont été perçues comme des raccourcis qui limitent leur utilisation ; Le Profil Exclusion Robot détinit un microformat qui peut être appliqué à n'importe quel élément ou ensemble d'éléments dans une page.


Comme d'autres microformats tels que [[hcalendar-fr|hCalendar]], le Profil Robot Exclusion définit un ensemble de noms de classe qui peuvent être appliqués aux éléments (X)HTML. <code>class</code> peut être appliqué à presque tout élément (X)HTML, ce qui veut dire que les auteurs peuvent être aussi spécifiques ou générer comme ils le souhaitent dans leurs applications.  Ceci diffère de l'attribut similaire <code>rel="nofollow"</code> qui ne peut être appliqué qu'à un lien spécifique (et ne fait pas référence au contenu) dans la ligne. (Il est intéressant de noter que ce comportement est complètement englobé par l'utilisation de <code>class="robots-nofollow"</code> sur le même élément.)  Les classes sont aussi additives, ainsi plusieurs valeurs peuvent être spécifiées en une fois, par ex. <code>class="robots-nofollow robots-noindex"</code>.  Pour l'exclusion de robot en particulier, ceci permet aux auteurs de spécifier plusieurs règles pour un élément sans ajouter quelque balisage supplémentaire non nécessaire.
Comme d'autres microformats tels que [[hcalendar-fr|hCalendar]], le Profil Robot Exclusion définit un ensemble de noms de classe qui peuvent être appliqués aux éléments (X)HTML. <code>class</code> peut être appliqué à presque tout élément (X)HTML, ce qui veut dire que les auteurs peuvent être aussi spécifiques ou générer comme ils le souhaitent dans leurs applications.  Ceci diffère de l'attribut similaire <code>rel="nofollow"</code> qui ne peut être appliqué qu'à un lien spécifique (et ne fait pas référence au contenu) dans la ligne. (Il est intéressant de noter que ce comportement est complètement englobé par l'utilisation de <code>class="robots-nofollow"</code> sur le même élément.)  Les classes sont aussi additives, ainsi plusieurs valeurs peuvent être spécifiées en une fois, par ex. <code>class="robots-nofollow robots-noindex"</code>.  Pour l'exclusion de robot en particulier, ceci permet aux auteurs de spécifier plusieurs règles pour un élément sans ajouter quelque balisage supplémentaire non nécessaire.
Line 23: Line 25:
== Format ==
== Format ==
=== Profile URI ===
=== Profile URI ===
<code><nowiki>http://exemple.org/xmdp/robots-profile#</nowiki></code> (obviously preliminary)
<code><nowiki>http://exemple.org/xmdp/robots-profile#</nowiki></code> (évidemment conteneur)


Les classes définie par le Profil Robot Exclusion devraient être considérées sans sens quand le profil URI n'est pas présent dans le document attribut <code>profile</code> du <code>&lt;head&gt;</code>.
Les classes définies par le Profil Robot Exclusion devraient être considérées sans sens quand le profil URI n'est pas présent dans le document attribut <code>profile</code> du <code>&lt;head&gt;</code>.


=== XMDP Profile ===
=== Profil XMDP ===
<pre><nowiki><dl class="profile">
<pre><nowiki><dl class="profile">
  <dt id="robots-nofollow">robots-nofollow</dt>
  <dt id="robots-nofollow">robots-nofollow</dt>
  <dd>
  <dd>
   Informs robots that links contained by the element are not to be followed.
   Informe les robots que les liens contenus par l'élément ne doivent pas être suivis.
  </dd>
  </dd>
  <dt id="robots-follow">robots-follow</dt>
  <dt id="robots-follow">robots-follow</dt>
  <dd>
  <dd>
   Informs robots that links contained by the element are to be followed.
   Informe les robots que les liens contenus par l'élément doivent être suivis.
  </dd>
  </dd>
  <dt id="robots-noindex">robots-noindex</dt>
  <dt id="robots-noindex">robots-noindex</dt>
  <dd>
  <dd>
   Informs robots that the content of the element is not to be included as part of the page.
   Informe les robots que le contenu de l'élément ne doit pas être inclus comme section de la page.
</dd>
<dt id="robots-noanchortext">robots-noanchortext</dt>
<dd>
  Informe les robots que le document en lien cible ne doit pas être indexé sous l'ancre texte.
</dd>
<dt id="robots-anchortext">robots-anchortext</dt>
<dd>
  Informe les robots que le document en lien cible doit être indexé sous l'ancre texte.
  </dd>
  </dd>
  <dt id="robots-index">robots-index</dt>
  <dt id="robots-index">robots-index</dt>
  <dd>
  <dd>
   Informs robots that the content of the element is to be included as part of the page.
   Informe les robots que le contenu de l'élément doit être inclus comme section de la page.  
  </dd>
  </dd>
  <dt id="robots-noarchive">robots-noarchive</dt>
  <dt id="robots-noarchive">robots-noarchive</dt>
  <dd>
  <dd>
   Informs caching robots that the content of the element is not to be included in their cached copy.
   Informe les caches des robots que le contenu de l'élément ne doit pas être inclus dans leur copie cachée.
  </dd>
  </dd>
  <dt id="robots-archive">robots-archive</dt>
  <dt id="robots-archive">robots-archive</dt>
  <dd>
  <dd>
   Informs caching robots that the content of the element is to be included in their cached copy.
   Informe les caches des robots que le contenu de l'élément doit être inclus dans leur copie cachée.
  </dd>
  </dd>
</dl></nowiki></pre>
</dl></nowiki></pre>


== Examples ==
== Exemples ==
Removing page content:
Retirer le contenu de la page :
<pre><nowiki>
<pre><nowiki>
<head profile=”http://example.org/xmdp/robots-profile#”>
<head profile=”http://exemple.org/xmdp/robots-profile#”>
...
...
<div class=”robots-noindex”>There once was a man from Nantucket…</div>
<div class=”robots-noindex”>Il était une fois un homme de Nantucket…</div>
<p>This page is not about <span class=”robots-noindex”>pornography</span>.</p>
<p>Cette page ne parle pas de <span class=”robots-noindex”>pornographie</span>.</p>
</nowiki></pre>
</nowiki></pre>


Showing <code>nofollow</code> in conjunction with [[votelinks]], and applying it in parallel with [[relnofollow]]:
Afficher le <code>nofollow</code> en conjonction avec [[vote-links-fr|votelinks]], et l'appliquer en parallèle avec [[rel-nofollow-fr|rel-nofollow]] :


<pre><nowiki>
<pre><nowiki>
<head profile=”http://example.org/xmdp/robots-profile#”>
<head profile=”http://exemple.org/xmdp/robots-profile#”>
...
...
<p class=”robots-nofollow”>This is <a href=”http://example.com/bogus”>a bogus link</a>
<p class=”robots-nofollow”>Ceci est <a href=”http://exemple.com/bogus”>un lien bogus</a>  
and so is <a href=”http://example.net/bogus”>this</a>.</p>
et ceci se fait comme <a href=”http://exemple.net/bogus”>ça</a>.</p>


<p>I don't like <a rel="nofollow" rev="vote-against" class="robots-nofollow"
<p>Je n'aime pas <a rel="nofollow" rev="vote-against" class="robots-nofollow"
                   href="http://example.com/disagree">this page</a>
                   href="http://example.com/disagree">cette page</a>
but I do like <a rev="vote-for" href="http://example.com/agree">this one</a>.</p>
mais j'aime vraiment <a rev="vote-for" href="http://exemple.com/agree">celle-là</a>.</p>
</nowiki></pre>
</nowiki></pre>


Preventing images from being stored by search engines, forcing them to be retrieved from the originating website:
Empêcher les images d'être sauvegardées par les moteurs de recherche, les forcer à être retrouvées à partir du site web original :


<pre><nowiki>
<pre><nowiki>
<head profile="http://example.org/xmdp/robots-profile#">
<head profile="http://exemple.org/xmdp/robots-profile#">
...
...
<p><img src="example.png" class="robots-noarchive" alt="Private image" /></p>
<p><img src="exemple.png" class="robots-noarchive" alt="Image privée" /></p>
</nowiki></pre>
</nowiki></pre>


A [http://peterjanes.ca/2005/robots/example more complex example] is available which also shows how the robots metadata may be [http://tantek.com/log/2005/06.html#d03t2359 visualized].
Une conséquence à cela est que les petits résumés qu'affichent les moteurs de recherche avec les liens résultants excluent aussi le <code>robots-noarchive</code>. Nous suggérons de remplacer les petits segments exclus avec une ellipse [<code>...</code>]. Les segments non archivés d'une taille comparable aux segments qu'utile normalement le moteur de recherche pour les résumés peuvent juste être omis. Probablement un affichage d'un document complètement caché qui a des segments non archivés devrait inclure aussi quelque locution pour afficher les endroits où le texte a été retiré, peut importe sa taille.


== References ==
Un [http://peterjanes.ca/2005/robots/example exemple plus complexe] est disponible qui montre aussi comment la métadonnée robots peut être [http://tantek.com/log/2005/06.html#d03t2359 visualisée].
 
== Références ==
=== Normative ===
=== Normative ===
* [http://gmpg.org/xmdp/ XMDP]
* [http://gmpg.org/xmdp/ XMDP]
* [http://www.robotstxt.org/wc/meta-user.html The Robots META Tag]
* [http://www.robotstxt.org/wc/meta-user.html Le Tag Robots META Tag]  
 
=== Informative ===
=== Informative ===
* [http://www.robotstxt.org/wc/norobots.html A Standard for Robot Exclusion]
* [http://www.robotstxt.org/wc/norobots.html A Standard for Robot Exclusion]
Line 97: Line 108:
* [http://www.bauser.com/websnob/meta/robots.html The ROBOTS META Tag]
* [http://www.bauser.com/websnob/meta/robots.html The ROBOTS META Tag]
* [[relnofollow|RelNoFollow Draft Specification]]
* [[relnofollow|RelNoFollow Draft Specification]]
* This page was contributed from the [http://developers.technorati.com/wiki/RobotsExclusion technorati developers' wiki].
* Cette page a été contribuée à partir du [http://developers.technorati.com/wiki/RobotsExclusion wiki des développeurs de technorati].


=== Thanks ===
=== Remerciements ===
* [http://tantek.com/log/ Tantek Çelik]
* [http://tantek.com/log/ Tantek Çelik]
* [http://www.lachy.id.au/ Lachlan Hunt]
* [http://www.lachy.id.au/ Lachlan Hunt]
* [http://www.joesapt.net/ Joe D'Andrea]
* [http://www.joesapt.net/ Joe D'Andrea]


== Issues ==
== pages en rapport ==
These are open issues that have been raised in various forums.  The "efficacy" and "collateral damage" issues from [[relnofollow#open_issues|rel="nofollow"]] also apply.
* <span id="Issues-fr"> [[robots-exclusion-issues]]</span>
 
* [[robots-exclusion-brainstorming]]
=== Precedence ===
* Should earlier values take precedence or later?  Does <code>class="robots-nofollow robots-follow"</code> means the same as <code>class="robots-nofollow"</code> or <code>class="robots-follow"</code>?
* <code>meta</code> tag suggests not using conflicting or repeating directives and so does not specify precedence
* Interaction with [[relnofollow]]: what does <code>class="robots-follow" rel="nofollow"</code> mean?  Currently [[relnofollow]] has no profile URI defined, so the Robot Exclusion Profile takes precedence.  In the future, per XMDP's [http://gmpg.org/xmdp/description#multiple Using Multiple Profiles], <q>the URIs in the 'profile' attribute are to be treated most significant (first) to least significant (last).</q>
 
=== Specificity ===
* Does not allow control of specific UAs à la [http://www.robotstxt.org/wc/norobots.html A Standard for Robot Exclusion]
 
If it is actually necessary to control specific UAs here is an possible soluiton.
Example:
 
<pre><nowiki>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html>
<head>
<link rel="schema.RobotExclusion" href="http://example.org/.../" />
<meta name="RobotExclusion.RobotName1" content="Foo Bot" />
<meta name="RobotExclusion.RobotName2" content="Bar Bot" />
<meta name="RobotExclusion.RobotName3" content="Evil Bot" />
</head>
<body>
<h1>Page</h1>
<p class="robots-noindex">This paragraph shouldn't be indexed by any bot.</p>
<p class="robot3-noindex">This paragraph should be indexed by every bot except "Evil Bot".</p>
<p class="robots-noindex robot1-index">This paragraph should be indexed by any bot except "Foo Bot".</p>
</div>
</body>
</html>
</nowiki></pre>
Of course it is a waste of bandwith if there are "RobotExclusion.RobotName" meta tags
on every page of a website. Thus this metatags should be stored on one page - perhaps the
main page - so they can be maintained easily.
 
<pre><nowiki>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html>
<head>
<link rel="schema.RobotExclusion" href="http://example.org/.../" />
<link rel="RobotExclusion.Names" href="http://mypage.com/" />
</head>
<body>
<h1>Page</h1>
<p class="robots-noindex">This paragraph shouldn't be indexed by any bot.</p>
<p class="robot3-noindex">This paragraph should be indexed by every bot except "Evil Bot".</p>
<p class="robots-noindex robot1-index">This paragraph should be indexed by any bot except "Foo Bot".</p>
</div>
</body>
</html>
</nowiki></pre>
 
=== Keywords ===
* The keywords <code>all</code> and <code>none</code> are defined by the Robots META Tag as convenience shortcuts to enable or disable the combination of <code>nofollow</code> and <code>noindex</code>, but predate Google's <code>noarchive</code> and should not be considered to include it.  As a result, for purposes of clarity and simplicity (the [http://gmpg.org/xmdp/description#principles XMDP Minimalism principle]), they are not included in this version of the Robot Exclusion Profile.


=== Suitability as a microformat ===
[[Category:Draft Specifications]]
* Isn't the Robot Exclusion Profile designed for machines first and humans second instead of vice versa?  Yes, just as much as [[relnofollow]], the deployed microformat that it's designed to replace.
[[Category:robots-exclusion]]
* I'd like to echo this concern. We need to discuss whether or not this is a suitable microformat. --[[User:RyanKing|RyanKing]] 13:34, 17 Jan 2006 (PST)

Latest revision as of 16:32, 18 July 2020

Ce document est une spécification microformat draft. Bien que les "drafts" soient en quelque sorte mâtures dans le processus de développement, la stabilité de ce document ne peut être garantie, et les implémenteurs doivent être prêts à rester informés des futurs développements et modifications. Suivez cette page wiki, ou suivez les discussions sur la liste de discussion microformats-new pour rester informé.

Spécification Brouillon du 18-06-2005

Auteurs

Copyright

De par la sortie dans le domaine public des pages utilisateur des auteurs et contributeurs (Peter Janes, Ryan King, Tantek Çelik), cette spécification est versée dans le domaine public.

Obligation de Contribution dans le Domaine Public. Du fait que les auteurs aient diffusé leurs travaux dans le domaine public, afin de maintenir ce statut de travail dans le domaine public, tous les contributeurs sur cette page sont aussi d'accord pour publier leurs contributions sur cette page dans le domaine public. Les contributeurs peuvent indiquer leur accord en ajoutant le modèle de sortie dans le domaine public (http://microformats.org/wiki/Template:public-domain-release) à leurs pages-utilisateur selons les instructions "Voluntary Public Domain Declarations" (http://microformats.org/wiki/Category:public_domain_license). Les contributions non publiées dans le domaine public peuvent être révoquées/retirées.

Brevets

L'auteur ne détient ni n'a l'intention d'appliquer quelque brevet sur tout ce qui est requis pour mettre en oeuvre cette spécification.

Abstract

Le Profil Robot Exclusion est un retravail de la balise Robots META (et des extensions moins standards) sous un microformat.

Introduction

La balise Robots META est utilisée pour fournir une direction spécifique-à-une-page pour les crawlers web. Tout en étant utile dans beaucoup de cas, sa nature spécifique-à-une-page veut dire qu'elle ne peut pas être utilisée pour empêcher les crawlers d'indexer seulement certaines sections d'un document. Plusieurs tentatives ont été produites pour créer des solutions plus granulaires à travers différentes méthodes mais ont été perçues comme des raccourcis qui limitent leur utilisation ; Le Profil Exclusion Robot détinit un microformat qui peut être appliqué à n'importe quel élément ou ensemble d'éléments dans une page.

Comme d'autres microformats tels que hCalendar, le Profil Robot Exclusion définit un ensemble de noms de classe qui peuvent être appliqués aux éléments (X)HTML. class peut être appliqué à presque tout élément (X)HTML, ce qui veut dire que les auteurs peuvent être aussi spécifiques ou générer comme ils le souhaitent dans leurs applications. Ceci diffère de l'attribut similaire rel="nofollow" qui ne peut être appliqué qu'à un lien spécifique (et ne fait pas référence au contenu) dans la ligne. (Il est intéressant de noter que ce comportement est complètement englobé par l'utilisation de class="robots-nofollow" sur le même élément.) Les classes sont aussi additives, ainsi plusieurs valeurs peuvent être spécifiées en une fois, par ex. class="robots-nofollow robots-noindex". Pour l'exclusion de robot en particulier, ceci permet aux auteurs de spécifier plusieurs règles pour un élément sans ajouter quelque balisage supplémentaire non nécessaire.

Format

Profile URI

http://exemple.org/xmdp/robots-profile# (évidemment conteneur)

Les classes définies par le Profil Robot Exclusion devraient être considérées sans sens quand le profil URI n'est pas présent dans le document attribut profile du <head>.

Profil XMDP

<dl class="profile">
 <dt id="robots-nofollow">robots-nofollow</dt>
 <dd>
  Informe les robots que les liens contenus par l'élément ne doivent pas être suivis.
 </dd>
 <dt id="robots-follow">robots-follow</dt>
 <dd>
  Informe les robots que les liens contenus par l'élément doivent être suivis.
 </dd>
 <dt id="robots-noindex">robots-noindex</dt>
 <dd>
  Informe les robots que le contenu de l'élément ne doit pas être inclus comme section de la page. 
 </dd>
 <dt id="robots-noanchortext">robots-noanchortext</dt>
 <dd>
  Informe les robots que le document en lien cible ne doit pas être indexé sous l'ancre texte.
 </dd>
 <dt id="robots-anchortext">robots-anchortext</dt>
 <dd>
  Informe les robots que le document en lien cible doit être indexé sous l'ancre texte.
 </dd>
 <dt id="robots-index">robots-index</dt>
 <dd>
  Informe les robots que le contenu de l'élément doit être inclus comme section de la page. 
 </dd>
 <dt id="robots-noarchive">robots-noarchive</dt>
 <dd>
  Informe les caches des robots que le contenu de l'élément ne doit pas être inclus dans leur copie cachée.
 </dd>
 <dt id="robots-archive">robots-archive</dt>
 <dd>
  Informe les caches des robots que le contenu de l'élément doit être inclus dans leur copie cachée.
 </dd>
</dl>

Exemples

Retirer le contenu de la page :

<head profile=”http://exemple.org/xmdp/robots-profile#”>
...
<div class=”robots-noindex”>Il était une fois un homme de Nantucket…</div>
<p>Cette page ne parle pas de <span class=”robots-noindex”>pornographie</span>.</p>

Afficher le nofollow en conjonction avec votelinks, et l'appliquer en parallèle avec rel-nofollow :

<head profile=”http://exemple.org/xmdp/robots-profile#”>
...
<p class=”robots-nofollow”>Ceci est <a href=”http://exemple.com/bogus”>un lien bogus</a> 
et ceci se fait comme <a href=”http://exemple.net/bogus”>ça</a>.</p>

<p>Je n'aime pas <a rel="nofollow" rev="vote-against" class="robots-nofollow"
                   href="http://example.com/disagree">cette page</a>
mais j'aime vraiment <a rev="vote-for" href="http://exemple.com/agree">celle-là</a>.</p>

Empêcher les images d'être sauvegardées par les moteurs de recherche, les forcer à être retrouvées à partir du site web original :

<head profile="http://exemple.org/xmdp/robots-profile#">
...
<p><img src="exemple.png" class="robots-noarchive" alt="Image privée" /></p>

Une conséquence à cela est que les petits résumés qu'affichent les moteurs de recherche avec les liens résultants excluent aussi le robots-noarchive. Nous suggérons de remplacer les petits segments exclus avec une ellipse [...]. Les segments non archivés d'une taille comparable aux segments qu'utile normalement le moteur de recherche pour les résumés peuvent juste être omis. Probablement un affichage d'un document complètement caché qui a des segments non archivés devrait inclure aussi quelque locution pour afficher les endroits où le texte a été retiré, peut importe sa taille.

Un exemple plus complexe est disponible qui montre aussi comment la métadonnée robots peut être visualisée.

Références

Normative

Informative

Remerciements

pages en rapport