THÉORIE  DES  MANIEMENTS  DE  COULEUR  AU  BRIDGE
Joël BRADMETZ



Cet article traite des conditions de jeu qui déterminent le choix d'une stratégie particulière dans le maniement d'une couleur au bridge. Il expose principalement les conséquences qu'il faut tirer de certaines caractéristiques intrinsèques aux rendements des stratégies et aux systèmes de cotation en tournoi par paires et en match par quatre. Il ne traite pas de la technique permettant de déterminer les stratégies et leur rendement ni des algorithmes utilisés pour écrire un logiciel adapté à cette tâche. Ces informations sont données par l'auteur dans d'autres articles (http://www.scanbridge.net).

Il y a différentes façons de manier une couleur en fonction des objectifs que l'on poursuit. Pour les présenter, nous choisirons une exposition classique des situations.

  Stratégie 1 Stratégie 2 Stratégie 3
Monde 1 (.20)
2
3
4
Monde 2 (.30)
3
5
2
Monde 3 (.15)
3
3
4
Monde 4 (.35)
4
2
4
Rendement
3,15
3,25
3,4


En colonnes, nous avons 3 stratégies (synonyme de maniements mais plus conforme à la terminologie de la théorie des jeux). En ligne nous avons quatre mondes possibles, qui représentent les jeux inconnus des adversaires. Avec chacun de ces mondes est indiquée sa probabilité, que, selon l'usage, on n'exprime pas en % mais avec la notation internationale, par exemple : .27 ( = 0,27 ou encore 27 %). On vérifie que le total des quatre probabiltés des mondes fait 1.
Dans les cases du tableau, on trouve le nombre de levées que rapporte la stratégie qui est en tête de colonne dans le monde qui est en tête de ligne. La ligne du bas fournit le rendement global de la stratégie.
Par exemple, la stratégie 1 rapporte (2 x .20) + (3 x .30) + (3 x .15) + (4 x .35) = 3,15 levées.



1. Les rendements classiques.

Si l'on joue un grand nombre de parties, le meilleur rendement est fourni par la stratégie 3 qui rapporte 3,4 levées. C'est le rendement maximal, ou rendement max selon la terminologie de l'encyclopédie américaine du bridge. Pour une main donnée, si un bridgeur ne doit connaître qu'une stratégie c'est celle-là.
Il y a néanmoins certaines autres subtilités à connaître.

Tout d'abord, on peut choisir un objectif particulier correspondant au nombre de levées que l'on souhaite réaliser. Si, avec AV32-R954, on doit réussir trois levées pour assurer le contrat, on tire l'as et on retourne petit vers R9, ce qui assure trois levées dans tous les cas. Si on a besoin de quatre levées, cette stratégie ne les rapporte qu'avec une probabilité de .1978, très inférieure à la probabilité associée à la stratégie qui consiste à jouer petit vers le valet pour tenter de capturer les Dames secondes ou troisièmes en Est (.3674).
Mais cette stratégie maximale pour quatre levées ne l'est plus pour trois où elle échoue face à une Dame sèche en Ouest (p = .9717).

Retournons au tableau. La meilleure stratégie pour assurer trois levées est la première qui n'échoue que dans le monde 1 (p = .80); la meilleure stratégie pour assurer quatre levées est la troisième qui réussit dans les mondes 1, 3 et 4 (p = .70); la meilleure stratégie pour cinq levées est la seconde qui réussit dans le monde 2 (p = .30).
Nous appellerons ces stratégies n-optimales, c'est-à-dire optimales pour un nombre n de levées. On trouve chez les bridgeurs l'expression de maniement de sécurité.

La stratégie max est celle qui est adaptée au tournoi par paires où il faut maximiser le nombre total de levées réalisé. Nous verrons qu'elle est adaptée dans l'immense majorité des cas.

Les stratégies n-optimales sont au contraire adaptées au match par quatre où il est essentiel de réussir les contrats, car les pénalités sont très lourdes quand un contrat est manqué à une table et réussi à l'autre, et la récompense des surlevées est négligeable dans la plupart des cas, exception faite des contrats contrés ou surcontrés. (Ainsi que des surlevées de chute que le flanc peut obtenir, notamment contre les contrats également contrés ou vulnérables.)



2. La cotation des parties libres.

Supposons une partie libre où le classement est établi simplement en totalisant les points dans chaque colonne. Il est clair qu'il faut tenter de maximiser les points mais qu'aucune stratégie claire ne peut être dégagée parce qu'en fonction du retard ou de l'avance à la marque et du terme de la partie, des risques très différents peuvent être pris et le hasard peut jouer un rôle important. C'est surtout avec les situations de compétition où les joueurs ont été confrontés aux mêmes situations que l'étude des stratégies peut être engagée.



3. Les irrégularités intrinsèques aux stratégies dans la cotation du tournoi par paire.

Considérons le nouveau tableau ci-dessous.


  Stratégie 1 Stratégie 2 Balance
Monde 1 (.20)
2
3
2 > 1
Monde 2 (.30)
5
2
1 > 2
Monde 3 (.15)
5
2
1 > 2
Monde 4 (.35)
3
4
2 > 1
Rendement
3,7
2,9
.55 > .45


Pour être exact, la seule chose qui compte en tournoi par paire est, non pas de faire un maximum de levées (ce qui a peu d'intérêt si tout le champ le réussit) mais de faire mieux que les autres le plus souvent possible.
La cotation des parties a ceci de particulier qu'elle régresse l'échelle cardinale des points sur une échelle ordinale qui perd les intervalles et leurs rapports. Les feuilles de score

650 ; 620 ; 620 ; 170 ; 140 ;-100 ;-200

et
160 ; 150 ; 150 ; 140 ; 130 ; 120 ; 110

sont ainsi identiques.

La conséquence en est que, pour surpasser un adversaire, il vaut mieux espérer 10 points de plus à p = .50 que 400 points de plus à p =.49. Donnons une comparaison facile à comprendre.
Si vous faites un concours de belote joué en un certain nombre de manches de 1000 points chacune, il peut y avoir deux façons de faire les comptes. Soit on proclame gagnante l'équipe qui a réalisé le plus de points au total, soit on proclame gagnante celle qui a gagné le plus de manches.
Sur trois manches par exemple, il vaut mieux, dans le premier cas en perdre trois à 980 points qu'en gagner deux à 1020 points et en perdre une à 250, alors que c'est le contraire dans le second cas.
Dans le tableau ci-dessus, nous voyons que la stratégie 1 est indiscutablement meilleure que la 2 sur le plan du rendement, seulement si les deux stratégies deviennent simplement confrontées en termes de fréquence de surclassement l'une de l'autre, la seconde l'emporte dans 55% des cas et la première dans 45% seulement.
Il en résulte que dans un tournoi où le codage fait qu'il faut gagner plus souvent que ses adversaires, peu importe de combien, il faudra jouer la stratégie 2.
Cette situation est celle du tournoi par paires au bridge où le classement établi sur chaque donne est purement ordinal. Donc, dans ce cas, plus de considération d'objectif ni de maniement de sécurité, il faut simplement choisir la stratégie qui, statistiquement, bat le plus souvent les autres, encore une fois, peu importe de combien.
On pourrait penser que la stratégie max est le meilleur candidat pour cela. Elle l'est en effet, sauf à de rares exceptions qui se chiffrent à environ 1% des mains.
Si vous jouez par exemple AV94-R32, la stratégie max rapporte quatre levées à .2901 en tirant le Roi et petit vers le Valet, alors que tirer le Roi et petit vers le 9 ne rapporte quatre levées qu'à .2683 (les deux stratégies sont équivalentes pour 3 levées: .7826). Malgré cela, paradoxalement ce n'est pas la première stratégie qui est à conseiller en tournoi par paires mais la seconde.
Quelle en est la raison ? L'examen des deux stratégies montre que la stratégie max surclasse l'autre dans 3 mondes, soit .1833 alors qu'elle est surclassée dans 4 mondes, soit .2260. Comment est-ce possible puisque max est également toujours n-optimale? Simplement parce que contre le monde X8-D888 (p = .0646) max rapporte quatre levées et sa concurrente seulement deux. Cette surlevées (il en suffisait de trois) est comptablisée dans le calcul du rendement (+ .0646 levée) mais ne compte pas dans la logique du surclassement.(Cette main peut être analysée avec la version de démonstration de ScanSuit).

Il ne semble guère possible de tirer des conséquences pratiques fermes de ces caractéristiques car elles reposent sur l'hypothèse forte que l'ensemble du champ joue le même contrat. Seules des analyses à grande échelle ou des simulations informatiques pourraient tirer cette question au clair.
Il y a environ 1% des positions de l'encyclopédie américaine du bridge dont la stratégie à préconiser en tournoi par paire n'est pas la stratégie max. Le lecteur intéressé pourra les découvrir avec le logiciel ScanSuit.



4. Les irrégularités intrinsèques aux stratégies dans la cotation des matches par quatre.

Dans les matches par quatre, il est nécessaire de battre la table adverse sur le même contrat.
Il y a, par rapport au tournoi par paires, à la fois une simplification et une complexification. Le champ est réduit à deux joueurs, ce qui est plus simple et rend plus tenable l'hypothèse que le même contrat est joué dans les deux camps. La cotation est un peu plus complexe car elle s'applique à la conversion de la différence des scores en points IMP, ce qui n'est plus simplement une échelle ordinale comme dans le cas du tournoi par paires et, de plus, cette conversion des différences en points n'est pas identique à ce que serait la différence des conversions des scores en IMP de chaque équipe, en raison d'une absence de monotonie stricte de l'échelle IMP. Nous verrons plus bas les conséquences qui peuvent en découler.
On sait que les surlevées rapportent peu en match (et principalement dans les contrats contrés ou surcontrés) et que l'important est de réaliser son contrat. S'il faut n levées pour réaliser un contrat, il est logique de considérer cette fois non pas la stratégie max mais la stratégie n-optimale pour ce nombre de levées.
Comme dans le cas du TPP, la stratégie optimale pour un nombre donné de levées peut être surclassée par une autre stratégie.
En tournoi par paires, la raison des déviances est liée à la réduction ordinale des écarts. La raison est différente en matche par quatre: elle est liée au fait que la stratégie surclassante est beaucoup plus performante au(x) palier(s) n+k ou au(x) palier(s) n-k que la stratégie optimale du palier n.

Considérons le tableau ci-dessous pour illustrer la recherche de la meilleure stratégie. Sud, vulnérable, joue 4 piques et doit réaliser trois levées dans une couleur pour réussir son contrat, il dispose des deux stratégies 1 et 2 ci-dessous, face à quatre mondes adverses.

  Stratégie 1 Stratégie 2 Score 1 Score 2 Score 1-score 2 IMP Imp pondéré
Monde 1 (.22)
3
2
620
-100
720
12
2.64
Monde 2 (.18)
2
3
-100
620
-720
-12
-2.16
Monde 3 (.30)
3
3
620
620
0
0
0
Monde 4 (.30)
3
4
620
650
-30
-1
-.3


Le total de la dernière colonne (+.18) fournit la moyenne des gains IMP en fonction de la probabilité des mondes, c'est à dire l'espérance de gain associé à l'emploi de la stratégie 1 contre la 2. Puisqu'il est positif, c'est la stratégie 1 qu'il faut utiliser, le fait qu'elle ne rapporte pas de surlevée dans le quatrième monde (contrairement à sa rivale) ne suffit pas à compenser l'écart de 4% qui sépare les deux premiers mondes.
Ce calcul illustre la méthode générale d'estimation de la meilleure stratégie pour un contrat donné. Lorsque n stratégies sont en concurrence, il y a (n x (n-1)) / 2 comparaisons deux à deux à effectuer. Nous reviendrons sur une particularité de cette méthode plus bas.

Donnons maintenant quatre exemples bridgesques.

ARDV93-2 a une stratégie optimale pour cinq levées (impasse) qui n'échoue que face à Est vide et rapporte six levées à .4925. La stratégie alternative non-optimale (tirer en tête) échoue contre Est et Ouest vide mais, en revanche elle rapporte six levées à .8640. On gagne .0075 sur cinq levées mais on perd .3715 sur six levées. Dans tous les contrats c'est donc la seconde stratégie qui est meilleure. Cest un exemple où la stratégie est meilleure aux paliers n+k c'est à dire aux paliers supérieurs à celui du nombre de levées recherchées.

ARD43-X2 a une stratégie X qui fait quatre levées à .8640 et cinq levées à .3553 et une stratégie Y qui donne .9199 et 0. Y fait gagner un peu plus de 5% pour quatre levées mais perd plus de 35% sur cinq levées. Dans la plupart des contrats, lorsque 4 levées sont nécessaires c'est X qui surclasse Y, sauf toutefois dans les contrats de base (ni contre ni vulnérabilité défévorable).C'est aussi un exemple de supériorité aux paliers n+k.
Parce que, évidemment, la sensibilité à la cotation fait que le même contrat, selon qu'il sera contré ou surcontré, vulnérable ou non, conduira à un score différent qui pourra infléchir le choix final de la stratégie.

AR9832-V met deux stratégies en concurrence. La stratégie max (laisser courir le Valet) rapporte respectivement pour 3, 4, 5, 6 levées: 1, .9851, .7025, .0161 et la stratégie 6-optimale (tirer en tête) rapporte: .9925,.8882, .6581, .0323. Même lorsque six levées sont nécessaires, dans tous les contrats à tous les niveaux, c'est la stratégie max qui est préconisée car les chances de gain sont très faibles et elle limite beaucoup plus les levées de chute. C'est un exemple clair de stratégie meilleure aux paliers n-k.

ARD82-X9 a deux stratégies concurrentes: max (laisser courir le X) rapporte 1, 1 et .50 pour trois, quatre et cinq levées. La stratégie alternative rapporte 1, .9394 et .5410 pour les mêmes nombres de levées. Lorsque 3 levées sont nécessaires, c'est évidemment la considération des paliers supérieurs qui va déterminer la bonne stratégie puisque les deux garantissent les trois levées à 100%. C'est la seconde qui est retenue car le gain qu'elle laisse espérer pour cinq levées est plus appréciable que le gain que la première laisse espérer pour quatre levées.

Détaillons dans le tableau ci-dessous, à titre d'exemple, le contrat de 4 coeurs non-vulnérable contré qui se réussit si, avec ARD43 - X2, le déclarant réalise quatre levées. Cette main possède, comme nous l'avons vu, deux stratégies. La première consiste à tirer en tête, la seconde à jouer petit vers le X. La stratégie 2 est 4-optimale (.9199 contre .8640 pour la 1).

  Stratégie 1 Stratégie 2 Score 1 Score 2 Score 1-score 2 IMP Imp pondéré
0 - V99999 (.0075)
3
4
-100
590
-690
-12
-.0894
V- 99999 (.0121)
4
3
590
-100
690
12
.1452
9 - V9999 (.0606)
3
4
-100
590
-690
-12
-.7272
V9 - 9999 (.0807)
4
4
590
590
0
0
0
99 - V999 (.1615)
4
4
590
590
0
0
0
V99 - 999 (.1776)
5
4
690
590
100
3
.5328
999 - V99 (.1776)
5
4
690
590
100
3
.5328
V999 - 99 (.1615)
4
4
590
590
0
0
0
9999 - V9 (.0807)
4
4
590
590
0
0
0
V9999 - 9 (.0606)
3
3
-100
-100
0
0
0
99999 - V (.0121)
4
4
590
590
0
0
0
V99999 - 0 (.30)
3
3
-100
-100
0
0
0


Le total de la dernière colonne est positif : +.395. Il préconise donc la stratégie 1 et non la 2.

Le tableau ci-dessous dénombre les contrats avec stratégie déviante sur un échantillon bien représentatif de positions simples (les 2013 positions du dictionnaire des maniements de couleur de Roudinesco).

    NV - NC NV - X NV - XX V - NC V - X V - XX TOTAL
PARTIELLE Mineure
1276
1554
1800
1096
1813
2215
9754
  Majeure
819
1092
1325
769
1310
1624
6936
  Sans atout
526
774
884
491
911
1092
4678
  Total
2621
3420
4009
2356
4034
4931
21371
MANCHE Mineure
96
226
337
96
293
434
1482
  Majeure
172
475
728
166
644
934
3119
  Sans atout
274
755
1125
267
1007
1448
4876
  Total
542
1456
2190
529
1944
2816
9477
CHELEM Mineure
54
141
226
50
196
338
1005
  Majeure
41
136
218
40
190
328
953
  Sans atout
41
136
215
40
190
300
922
  Total
136
413
659
130
576
966
2880
ENSEMBLE  
6462
10165
13057
5900
12532
16460
33728

Il y a dans les 2013 positions que nous avons analysées, 534 mains qui ont au moins une stratégie déviante, soit 26,52%.
Il y a avec ces 2013 mains, un total de 554 472 contrats possibles. Parmi eux, 34 165 ont une stratégie déviante (dont 437 sans stratégie comme on verra plus bas), c'est-à-dire 6,16%.
Si l'on estime le pourcentage des contrats à stratégie déviante parmi les 534 mains qui en contiennent au moins 1, on arrive à 34 165 / 165 870, soit 20,597%.

Lorsqu'on examine de quel type sont les substitutions de stratégies, on découvre, dans l'immense majorité des cas que c'est la stratégie max qui supplante la stratégie n-optimale.

Sur les 33 728 contrats à stratégie déviante que nous avons dénombrés dans le tableau ci-dessus (i.e. 34165-437), 31 001, soit 90,74% voient leur stratégie n-optimale remplacée par la stratégie max.
Dans 718 cas, soit 2,1%, la stratégie n-optimale qui était aussi la stratégie max est remplacée par une autre.
Une règle générale assez simple semble donc pouvoir être dégagé à la table: dès qu'une stratégie n-optimale présente un rendement nettement inférieur à la stratégie max, elle doit être remplacée par elle.
Nous avons calculé la valeur de ces écarts de rendement.
Sur l'ensemble des 131 705 contrats normalement résolus par la stratégie n-optimale, qui se confond dans 79,64% cas avec la stratégie max, l'écart moyen entre ces deux stratégies est de 0,011 point IMP et l'écart-type est de 0,0349 point IMP.
Sur l'ensemble des 33728 contrats déviants en revanche, l'écart moyen entre la stratégie max et la stratégie n-optimale est de 0,134 point IMP et l'écart-type est de 0,183 point IMP.
Il y a donc une différence de 1 à 12 entre les deux. Cette différence est statistiquement très significative.
On observe également que les stratégies n-optimale et max qui sont confondues dans 79,64% des cas lorsque les contrats sont normaux, ne le sont plus que dans 2,12% des cas (718 sur 33 728) lorsque les contrats demandent des stratégies déviantes.

Ces faits montrent la force de la stratégie max et sa sensibilité globale aux systèmes de cotation qui ont tendance à renforcer les meilleurs rendements moyens. En effet dès qu'une stratégie n-optimale n'est pas max, si son espérance de gain s'éloigne trop de celle de cette dernière (plus de 0,1 IMP en moyenne) elle est rattrapée et remplacée par la stratégie max.





5. Les particularités du système de cotation du tournoi par paires.

Considérons le tableau suivant.

  Stratégie 1 Stratégie 2 Stratégie 3 1 - 2 1 - 3 2 - 3
Monde 1 (.20)
300
500
400
-200
-100
+100
Monde 2 (.25)
400
200
500
+200
-100
-300
Monde 3 (.15)
200
300
500
-100
-300
-200
Monde 4 (.35)
500
400
300
+100
+200
+100
Monde 5 (.05)
300
500
100
-200
+200
+400
Total pondéré
380
360
390
+20
-10
-30


Il n'y a aucune ambiguité sur le choix de la meilleure stratégie dans ces 5 mondes, c'est la troisième.
Il est également clair que les différences entre les totaux de colonnes sont égales aux sommes des différences (colonnes 4, 5 et 6).
Convertissons maintenant ces scores en rang selon la logique du tournoi par paires.

  Stratégie 1 Stratégie 2 Stratégie 3 1 - 2 2 - 3 3 - 1
Monde 1 (.20)
3
1
2
-.20
+.20
+.20
Monde 2 (.25)
2
3
1
+.25
-.25
+.25
Monde 3 (.15)
3
2
1
-.15
-.15
+.15
Monde 4 (.35)
1
2
3
+.35
+.35
-.35
Monde 5 (.05)
2
1
3
-.05
+.05
-.05
Total pondéré
 
 
 
+.20
+.20
+.20


On constate que la stratégie 1 est supérieure à la 2, la 2 à la 3 et la 3 à la 1. Aucune des trois ne domine les deux autres, il n'y a pas dans ce cas de stratégie à préconiser pour le tournoi par paires avec la position qui mène à ce tableau de résultats. Ces positions sont rares, on n'en trouve que 5 dans les 2013 de l'échantillon étudié:

AR95 - V82 ; AX98 - R432 ; A974 - V832 ; RDX84 - 32 ; R987 - D432



6. Les particularités du système de cotation en IMP.

Soit le tableau de points ci-dessous.

  Stratégie 1 Stratégie 2 Stratégie 3
Monde 1 (.20)
300
400
500
Monde 2 (.20)
400
200
300
Monde 3 (.20)
200
300
400
Monde 4 (.20)
500
400
300
Monde 5 (.20)
210
300
90
Rendement
322
320
318


Le classement est non ambigu et, là aussi, les sommes des différences sont égales aux différences des sommes. Si l'on convertit les écarts de points entre les stratégies en points IMP, leur comparaison donne:

1 vs 2 = -3 +5 -3 +3 -3 = -1
2 vs 3 = -3 -3 -3 +3 +5 = -1
3 vs 1 = +5 -3 +5 -5 -3 = -1

Il n'y a plus de stratégie dominante. La raison en est cette fois l'absence de monotonie de l'échelle IMP et même, son absence de conservation du caractère euclidien des mesures. Par exemple 20 points = 10 points + 10 points mais, après conversion en imp, nous avons 1 = 0 + 0.

Les mains qui n'ont pas de stratégie en match par quatre sont également très rares. Rappelons que nous en avions 5/2013 = .0024 pour le tournoi par paires. Il y en a 15 / 2013 pour le match par quatre, soit .0072, mais si on effectue le calcul à partir des contrats et non pas des mains, ces 15 mains génèrent 437 stratégies défectives, soit 437 / 554 472 = .0007.

Ces 15 mains sont les suivantes:

AR95 - V82 ; AX98 - R432 ; A974 - V832 ; RDX84 - 32 ; R987 - D432

ARV9 - 432 ; AV94 - R32 ; AR876 - V92 ; AX843 - R72 ; AX86543 - D2

ADX8 - 432 ; ADX96 - 5432 ; AD432 - X987 ; A732 - VX8 ; R954 - V32



On a remarqué que les 5 premières n'ont pas non plus de stratégie dominante en tournoi par paires, ce qui permet d'énoncer une loi empirique : si une main est défective en tournoi par paires, elle aura aussi au moins un contrat défectif en match par quatre.

AX98 - R432 doit être signalée comme une main tout à fait exceptionnelle de ce point de vue: elle comporte à elle seule 197 contrats défectifs (soit 45% de l'ensemble des contrats défectifs), dont tous ses contrats vulnérables surcontrés!
Elle possède 6 stratégies principales qui agissent de la facon suivante:

  Stratégie 1 Stratégie 2 Stratégie 3 Stratégie 4 Stratégie 5 Stratégie 6
Perd 3 levées contre
D sèche en O (.0565)
D sèche en E (.0565)
DV76(5) en E (.0848)
DV76(5) en O (.0848)
D sèche en O (.0565)
D sèche en E (.0565)
Gagne 4 levées contre
D sèche en E (.0565)
D sèche en O (.0565)
DV en O et D en E (.904)
DV en E et D en O (.904)
DV en E (.0339)
DV en O (.0339)


Les stratégies 1,2,5 et 6 sont 3-optimales; les stratégies 3 et 4 sont 4-optimales. Elles sont symétriques deux à deux.