THÉORIE DES MANIEMENTS DE COULEUR AU BRIDGE
Joël BRADMETZ
Cet article traite des conditions de jeu qui déterminent le choix d'une stratégie
particulière dans le maniement d'une couleur au bridge. Il expose principalement les conséquences qu'il faut tirer de certaines
caractéristiques intrinsèques aux rendements des stratégies et aux systèmes de cotation en tournoi par paires et en match par quatre.
Il ne traite pas de la technique permettant de déterminer les stratégies et leur rendement ni des algorithmes utilisés pour
écrire un logiciel adapté à cette tâche. Ces informations sont données par l'auteur dans d'autres articles (http://www.scanbridge.net).
Il y a différentes façons de manier une couleur en fonction des objectifs que l'on poursuit.
Pour les présenter, nous choisirons une exposition classique des situations.
Stratégie 1 | Stratégie 2 | Stratégie 3 | |
---|---|---|---|
Monde 1 (.20) | |||
Monde 2 (.30) | |||
Monde 3 (.15) | |||
Monde 4 (.35) | |||
Rendement |
En colonnes, nous avons 3 stratégies (synonyme de maniements mais plus conforme à la terminologie de la théorie des jeux). En ligne nous avons quatre mondes possibles, qui représentent les jeux inconnus des adversaires. Avec chacun de ces mondes est indiquée sa probabilité, que, selon l'usage, on n'exprime pas en % mais avec la notation internationale, par exemple : .27 ( = 0,27 ou encore 27 %). On vérifie que le total des quatre probabiltés des mondes fait 1.
Dans les cases du tableau, on trouve le nombre de levées que rapporte la stratégie qui est en tête de colonne dans le monde qui est en tête de ligne. La ligne du bas fournit le rendement global de la stratégie.
Par exemple, la stratégie 1 rapporte (2 x .20) + (3 x .30) + (3 x .15) + (4 x .35) = 3,15 levées.
Si l'on joue un grand nombre de parties, le meilleur rendement est fourni par la stratégie 3 qui rapporte 3,4 levées.
C'est le rendement maximal, ou rendement max selon la terminologie de l'encyclopédie américaine du bridge. Pour une main donnée, si un bridgeur ne doit connaître qu'une stratégie c'est celle-là.
Il y a néanmoins certaines autres subtilités à connaître.
Tout d'abord, on peut choisir un objectif particulier correspondant au nombre de levées que l'on souhaite réaliser. Si,
avec AV32-R954, on doit réussir trois levées pour assurer le contrat, on tire l'as et on retourne petit vers R9,
ce qui assure trois levées dans tous les cas. Si on a besoin de quatre levées, cette stratégie ne les rapporte qu'avec
une probabilité de .1978, très inférieure à la probabilité associée à la stratégie qui consiste à jouer petit vers le
valet pour tenter de capturer les Dames secondes ou troisièmes en Est (.3674).
Mais cette stratégie maximale pour quatre levées ne l'est plus pour trois où elle échoue face à une Dame sèche en Ouest
(p = .9717).
Retournons au tableau. La meilleure stratégie pour assurer trois levées est la première qui n'échoue que dans le monde 1
(p = .80); la meilleure stratégie pour assurer quatre levées est la troisième qui réussit dans les mondes 1, 3 et 4 (p = .70); la meilleure stratégie pour cinq levées est la seconde qui réussit dans le monde 2 (p = .30).
Nous appellerons ces stratégies n-optimales, c'est-à-dire optimales pour un nombre n de levées. On trouve
chez les bridgeurs l'expression de maniement de sécurité.
La stratégie max est celle qui est adaptée au tournoi par paires où il faut maximiser le nombre total de levées
réalisé. Nous verrons qu'elle est adaptée dans l'immense majorité des cas.
Les stratégies n-optimales sont au contraire adaptées au match par quatre où il est essentiel de réussir les
contrats, car les pénalités sont très lourdes quand un contrat est manqué à une table et réussi à l'autre, et la
récompense des surlevées est négligeable dans la plupart des cas, exception faite des contrats contrés ou surcontrés.
(Ainsi que des surlevées de chute que le flanc peut obtenir, notamment contre les contrats également contrés ou
vulnérables.)
Supposons une partie libre où le classement est établi simplement en totalisant les points dans chaque colonne.
Il est clair qu'il faut tenter de maximiser les points mais qu'aucune stratégie claire ne peut être dégagée parce qu'en fonction
du retard ou de l'avance à la marque et du terme de la partie, des risques très différents peuvent être pris et le hasard peut jouer un rôle important.
C'est surtout avec les situations de compétition où les joueurs ont été confrontés aux mêmes situations
que l'étude des stratégies peut être engagée.
Stratégie 1 | Stratégie 2 | Balance | |
---|---|---|---|
Monde 1 (.20) | |||
Monde 2 (.30) | |||
Monde 3 (.15) | |||
Monde 4 (.35) | |||
Rendement |
Pour être exact, la seule chose qui compte en tournoi par paire est, non pas de faire un
maximum de levées (ce qui a peu d'intérêt si tout le champ le réussit) mais de faire mieux que les autres le plus souvent
possible.
La cotation des parties a ceci de particulier qu'elle régresse l'échelle cardinale des points sur une échelle ordinale
qui perd les intervalles et leurs rapports. Les feuilles de score
La conséquence en est que, pour surpasser un adversaire, il vaut mieux espérer 10 points de plus à p = .50 que 400 points
de plus à p =.49. Donnons une comparaison facile à comprendre.
Si vous faites un concours de belote joué en un certain nombre de manches de 1000 points chacune, il peut y avoir deux
façons de faire les comptes. Soit on proclame gagnante l'équipe qui a réalisé le plus de points au total, soit on proclame
gagnante celle qui a gagné le plus de manches.
Sur trois manches par exemple, il vaut mieux, dans le premier cas en perdre trois à 980 points qu'en gagner deux à 1020
points et en perdre une à 250, alors que c'est le contraire dans le second cas.
Dans le tableau ci-dessus, nous voyons que la stratégie 1 est indiscutablement meilleure que la 2 sur le plan du rendement,
seulement si les deux stratégies deviennent simplement confrontées en termes de fréquence de surclassement l'une de l'autre,
la seconde l'emporte dans 55% des cas et la première dans 45% seulement.
Il en résulte que dans un tournoi où le codage fait qu'il faut gagner plus souvent que ses adversaires, peu importe de
combien, il faudra jouer la stratégie 2.
Cette situation est celle du tournoi par paires au bridge où le classement établi sur chaque donne est purement ordinal.
Donc, dans ce cas, plus de considération d'objectif ni de maniement de sécurité, il faut simplement choisir la stratégie
qui, statistiquement, bat le plus souvent les autres, encore une fois, peu importe de combien.
On pourrait penser que la stratégie max est le meilleur candidat pour cela. Elle l'est en effet, sauf à de rares
exceptions qui se chiffrent à environ 1% des mains.
Si vous jouez par exemple AV94-R32, la stratégie max rapporte quatre levées à .2901 en tirant le Roi et
petit vers le Valet, alors que tirer le Roi et petit vers le 9 ne rapporte quatre levées qu'à .2683 (les deux stratégies
sont équivalentes pour 3 levées: .7826). Malgré cela, paradoxalement ce n'est pas la première stratégie qui est à conseiller
en tournoi par paires mais la seconde.
Quelle en est la raison ? L'examen des deux stratégies montre que la stratégie max surclasse l'autre dans 3 mondes,
soit .1833 alors qu'elle est surclassée dans 4 mondes, soit .2260. Comment est-ce possible puisque max est également
toujours n-optimale? Simplement parce que contre le monde X8-D888 (p = .0646) max rapporte quatre levées et sa
concurrente seulement deux. Cette surlevées (il en suffisait de trois) est comptablisée dans le calcul du rendement
(+ .0646 levée) mais ne compte pas dans la logique du surclassement.(Cette main peut être analysée avec la version de démonstration de ScanSuit).
Il ne semble guère possible de tirer des conséquences pratiques fermes de ces caractéristiques car elles reposent sur
l'hypothèse forte que l'ensemble du champ joue le même contrat. Seules des analyses à grande échelle ou des simulations
informatiques pourraient tirer cette question au clair.
Il y a environ 1% des positions de l'encyclopédie américaine du bridge dont la stratégie à préconiser en tournoi par
paire n'est pas la stratégie max. Le lecteur intéressé pourra les découvrir avec le logiciel ScanSuit.
Dans les matches par quatre, il est nécessaire de battre la table adverse sur le même contrat.
Il y a, par rapport au tournoi par paires, à la fois une simplification et une complexification. Le champ est réduit à
deux joueurs, ce qui est plus simple et rend plus tenable l'hypothèse que le même contrat est joué dans les deux camps.
La cotation est un peu plus complexe car elle s'applique à la conversion de la différence des scores en points IMP,
ce qui n'est plus simplement une échelle ordinale comme dans le cas du tournoi par paires et, de plus, cette conversion
des différences en points n'est pas identique à ce que serait la différence des conversions des scores en IMP de chaque
équipe, en raison d'une absence de monotonie stricte de l'échelle IMP. Nous verrons plus bas les conséquences qui peuvent en découler.
On sait que les surlevées rapportent peu en match (et principalement dans les contrats contrés ou surcontrés) et que
l'important est de réaliser son contrat. S'il faut n levées pour réaliser un contrat, il est logique de considérer
cette fois non pas la stratégie max mais la stratégie n-optimale pour ce nombre de levées.
Comme dans le cas du TPP, la stratégie optimale pour un nombre donné de levées peut être surclassée par une autre stratégie.
En tournoi par paires, la raison des déviances est liée à la réduction ordinale des écarts. La raison est différente en
matche par quatre: elle est liée au fait que la stratégie surclassante est beaucoup plus performante au(x) palier(s)
n+k ou au(x) palier(s) n-k que la stratégie optimale du palier n.
Considérons le tableau ci-dessous pour illustrer la recherche de la meilleure stratégie. Sud, vulnérable, joue 4 piques et doit réaliser
trois levées dans une couleur pour réussir son contrat, il dispose des deux stratégies 1 et 2 ci-dessous, face à
quatre mondes adverses.
Stratégie 1 | Stratégie 2 | Score 1 | Score 2 | Score 1-score 2 | IMP | Imp pondéré | |
---|---|---|---|---|---|---|---|
Monde 1 (.22) | |||||||
Monde 2 (.18) | |||||||
Monde 3 (.30) | |||||||
Monde 4 (.30) |
Le total de la dernière colonne (+.18) fournit la moyenne des gains IMP en fonction de la probabilité des mondes, c'est à dire
l'espérance de gain associé à l'emploi de la stratégie 1 contre la 2. Puisqu'il est positif, c'est la stratégie 1 qu'il faut utiliser,
le fait qu'elle ne rapporte pas de surlevée dans le quatrième monde (contrairement à sa rivale) ne suffit pas à compenser
l'écart de 4% qui sépare les deux premiers mondes.
Ce calcul illustre la méthode générale d'estimation de la meilleure stratégie pour un contrat donné. Lorsque n stratégies
sont en concurrence, il y a (n x (n-1)) / 2 comparaisons deux à deux à effectuer. Nous reviendrons sur une particularité
de cette méthode plus bas.
Donnons maintenant quatre exemples bridgesques.
ARDV93-2 a une stratégie optimale pour cinq levées (impasse) qui n'échoue que face à Est vide et rapporte six levées
à .4925. La stratégie alternative non-optimale (tirer en tête) échoue contre Est et Ouest vide mais, en revanche
elle rapporte six levées à .8640. On gagne .0075 sur cinq levées mais on perd .3715 sur six levées. Dans tous les contrats c'est
donc la seconde stratégie qui est meilleure. Cest un exemple où la stratégie est meilleure aux paliers n+k
c'est à dire aux paliers supérieurs à celui du nombre de levées recherchées.
ARD43-X2 a une stratégie X qui fait quatre levées à .8640 et cinq levées à .3553 et une stratégie Y qui
donne .9199 et 0. Y fait gagner un peu plus de 5% pour quatre levées mais perd plus de 35% sur cinq levées. Dans la
plupart des contrats, lorsque 4 levées sont nécessaires c'est X qui surclasse Y, sauf toutefois dans les
contrats de base (ni contre ni vulnérabilité défévorable).C'est aussi un exemple de supériorité aux paliers n+k.
Parce que, évidemment, la sensibilité à la cotation fait que le même contrat, selon qu'il sera contré ou surcontré,
vulnérable ou non, conduira à un score différent qui pourra infléchir le choix final de la stratégie.
AR9832-V met deux stratégies en concurrence. La stratégie max (laisser courir le Valet) rapporte respectivement pour 3, 4, 5, 6 levées:
1, .9851, .7025, .0161 et la stratégie 6-optimale (tirer en tête) rapporte: .9925,.8882, .6581, .0323. Même lorsque six levées sont
nécessaires, dans tous les contrats à tous les niveaux, c'est la stratégie max qui est préconisée car les chances de gain sont très faibles
et elle limite beaucoup plus les levées de chute. C'est un exemple clair de stratégie meilleure aux paliers n-k.
ARD82-X9 a deux stratégies concurrentes: max (laisser courir le X) rapporte 1, 1 et .50 pour trois, quatre et cinq levées.
La stratégie alternative rapporte 1, .9394 et .5410 pour les mêmes nombres de levées. Lorsque 3 levées sont nécessaires, c'est
évidemment la considération des paliers supérieurs qui va déterminer la bonne stratégie puisque les deux garantissent les trois levées à 100%.
C'est la seconde qui est retenue car le gain qu'elle laisse espérer pour cinq levées est plus appréciable que le gain que
la première laisse espérer pour quatre levées.
Détaillons dans le tableau ci-dessous, à titre d'exemple, le contrat de 4 coeurs non-vulnérable contré qui se réussit si, avec ARD43 - X2,
le déclarant réalise quatre levées. Cette main possède, comme nous l'avons vu, deux stratégies. La première consiste à tirer
en tête, la seconde à jouer petit vers le X. La stratégie 2 est 4-optimale (.9199 contre .8640 pour la 1).
Stratégie 1 | Stratégie 2 | Score 1 | Score 2 | Score 1-score 2 | IMP | Imp pondéré | |
---|---|---|---|---|---|---|---|
0 - V99999 (.0075) | |||||||
V- 99999 (.0121) | |||||||
9 - V9999 (.0606) | |||||||
V9 - 9999 (.0807) | |||||||
99 - V999 (.1615) | |||||||
V99 - 999 (.1776) | |||||||
999 - V99 (.1776) | |||||||
V999 - 99 (.1615) | |||||||
9999 - V9 (.0807) | |||||||
V9999 - 9 (.0606) | |||||||
99999 - V (.0121) | |||||||
V99999 - 0 (.30) |
Le total de la dernière colonne est positif : +.395. Il préconise donc la stratégie 1 et non la 2.
Le tableau ci-dessous dénombre les contrats avec stratégie déviante sur un échantillon bien représentatif de positions
simples (les 2013 positions du dictionnaire des maniements de couleur de Roudinesco).
NV - NC | NV - X | NV - XX | V - NC | V - X | V - XX | TOTAL | ||
---|---|---|---|---|---|---|---|---|
PARTIELLE | Mineure | |||||||
Majeure | ||||||||
Sans atout | ||||||||
Total | ||||||||
MANCHE | Mineure | |||||||
Majeure | ||||||||
Sans atout | ||||||||
Total | ||||||||
CHELEM | Mineure | |||||||
Majeure | ||||||||
Sans atout | ||||||||
Total | ||||||||
ENSEMBLE |
Il y a dans les 2013 positions que nous avons analysées, 534 mains qui ont au moins une stratégie déviante, soit 26,52%.
Il y a avec ces 2013 mains, un total de 554 472 contrats possibles. Parmi eux, 34 165 ont une stratégie déviante
(dont 437 sans stratégie comme on verra plus bas), c'est-à-dire 6,16%.
Si l'on estime le pourcentage des contrats à stratégie déviante parmi les 534 mains qui en contiennent au moins 1,
on arrive à 34 165 / 165 870, soit 20,597%.
Lorsqu'on examine de quel type sont les substitutions de stratégies, on découvre, dans
l'immense majorité des cas que c'est la stratégie max qui supplante la stratégie n-optimale.
Sur les 33 728 contrats à stratégie déviante que nous avons dénombrés dans le tableau ci-dessus (i.e. 34165-437), 31 001, soit
90,74% voient leur stratégie n-optimale remplacée par la stratégie max.
Dans 718 cas, soit 2,1%, la stratégie n-optimale qui était aussi la stratégie max est
remplacée par une autre.
Une règle générale assez simple semble donc pouvoir être dégagé à la table: dès qu'une stratégie n-optimale
présente un rendement nettement inférieur à la stratégie max, elle doit être remplacée par elle.
Nous avons calculé la valeur de ces écarts de rendement.
Sur l'ensemble des 131 705 contrats normalement résolus par la stratégie n-optimale, qui se confond
dans 79,64% cas avec la stratégie max, l'écart moyen entre ces deux stratégies est de 0,011 point
IMP et l'écart-type est de 0,0349 point IMP.
Sur l'ensemble des 33728 contrats déviants en revanche, l'écart
moyen entre la stratégie max et la stratégie n-optimale est de 0,134 point IMP et
l'écart-type est de 0,183 point IMP.
Il y a donc une différence de 1 à 12 entre les deux. Cette différence est statistiquement très significative.
On observe également que les stratégies n-optimale et max qui sont confondues dans 79,64% des cas
lorsque les contrats sont normaux, ne le sont plus que dans 2,12% des cas (718 sur 33 728) lorsque les contrats demandent
des stratégies déviantes.
Ces faits montrent la force de la stratégie max et sa sensibilité globale aux systèmes de cotation qui ont tendance à renforcer les meilleurs rendements moyens.
En effet dès qu'une stratégie n-optimale n'est pas max, si son espérance de gain s'éloigne trop de celle de cette dernière (plus de 0,1 IMP en moyenne)
elle est rattrapée et remplacée par la stratégie max.
Stratégie 1 | Stratégie 2 | Stratégie 3 | 1 - 2 | 1 - 3 | 2 - 3 | |
---|---|---|---|---|---|---|
Monde 1 (.20) | ||||||
Monde 2 (.25) | ||||||
Monde 3 (.15) | ||||||
Monde 4 (.35) | ||||||
Monde 5 (.05) | ||||||
Total pondéré |
Il n'y a aucune ambiguité sur le choix de la meilleure stratégie dans ces 5 mondes, c'est la troisième.
Il est également clair que les différences entre les totaux de colonnes sont égales aux sommes des différences (colonnes 4, 5 et 6).
Convertissons maintenant ces scores en rang selon la logique du tournoi par paires.
Stratégie 1 | Stratégie 2 | Stratégie 3 | 1 - 2 | 2 - 3 | 3 - 1 | |
---|---|---|---|---|---|---|
Monde 1 (.20) | ||||||
Monde 2 (.25) | ||||||
Monde 3 (.15) | ||||||
Monde 4 (.35) | ||||||
Monde 5 (.05) | ||||||
Total pondéré |
On constate que la stratégie 1 est supérieure à la 2, la 2 à la 3 et la 3 à la 1.
Aucune des trois ne domine les deux autres, il n'y a pas dans ce cas de stratégie à préconiser pour le
tournoi par paires avec la position qui mène à ce tableau de résultats.
Ces positions sont rares, on n'en trouve que 5 dans les 2013 de l'échantillon étudié:
AR95 - V82 ; AX98 - R432 ; A974 - V832 ; RDX84 - 32 ; R987 - D432
Stratégie 1 | Stratégie 2 | Stratégie 3 | |
---|---|---|---|
Monde 1 (.20) | |||
Monde 2 (.20) | |||
Monde 3 (.20) | |||
Monde 4 (.20) | |||
Monde 5 (.20) | |||
Rendement |
Le classement est non ambigu et, là aussi, les sommes des différences sont égales aux différences des sommes.
Si l'on convertit les écarts de points entre les stratégies en points IMP, leur comparaison donne:
Stratégie 1 | Stratégie 2 | Stratégie 3 | Stratégie 4 | Stratégie 5 | Stratégie 6 | |
---|---|---|---|---|---|---|
Perd 3 levées contre | ||||||
Gagne 4 levées contre |