Logo Winamax

Topic-icon Stratégie ... pas si simplifiée que ça.

Plus d'informations
11 Avr 2008 17:49 - 11 Avr 2008 17:51 #21 par fiastre
Réponse de fiastre sur le sujet Stratégie ... pas si simplifiée que ça.
SPI écrit:

Ben pour moi, doubler rapidement (et plus même), donc avoir un gros tapis rapidement minimise les risques tout au long de la suite du tournoi en ne jouant que des tapis inférieurs, sans risquer l'élimination directe.

Oui, si tu doubles: mais tu n'as qu'une chance sur deux.
Quand tu es à 3, dans les places payées, avec des stacks identiques, et que les deux autres vont au tapis, il ne faut pas t'en mêler: ta probabilité de finir premier reste la même et ton espérance mathématique augmente automatiquement puisque tu es sûr de finir au moins deuxième...Par voie de conséquence, puisque le jeu est à somme nulle, l'espérance mathématique de chacun des deux autres diminue...

Un petit jeu qui a un petit quelque chose à voir.
comme dans le bon, la brute et le truand, trois individus disputent un "triel" (un duel à 3). Ils sont aux trois sommets d'un triangle:
A est un mauvais tireur qui atteint sa cible une fois sur 3
B est un bon tireur qui atteint sa cible 2 fois sur 3
C est un excellent tireur qui atteint toujours sa cible
Le tirage au sort désigne l'ordre dans lequel ils vont tirer: A, puis B, puis C et ainsi de suite
Qui A doit-il viser ?
Dernière édition: 11 Avr 2008 17:51 par fiastre.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
11 Avr 2008 18:03 - 11 Avr 2008 18:06 #22 par SPI
Réponse de SPI sur le sujet Stratégie ... pas si simplifiée que ça.
The good, the bad and the ugly :

ce qu'il faut surtout c'est ne pas se retrouver en tête à tête avec C car si on le rate, lui ne nous ratera.
Si A tire sur B et qu'il le flingue alors c'est à C de tirer et on est mort.
Donc je tire sur C en espérant qu'il m'en veule pas trop par la suite si je le rate...
Dernière édition: 11 Avr 2008 18:06 par SPI.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
11 Avr 2008 20:09 - 11 Avr 2008 20:09 #23 par FiRenZ
Réponse de FiRenZ sur le sujet Stratégie ... pas si simplifiée que ça.
SPI écrit:

FiRenZ écrit:

Quand on est à la moyenne, là ça devient plus dur. Peut-être qu'il faudrait proposer aux joueurs ayant un stack légèrement plus gros que le notre. Afin qu'ils puissent éviter la confrontation dans le risque qu'ils se trouvent short stack s'ils le jouent et perdent.

Et s'ils acceptent t'as 1 chance sur 2 de te faire sortir à chaque coup que tu vas jouer, c'est pas viable sur le long terme.


Oui seulement s'ils acceptent ! Là est toute la différence ! Tu as une espérance de gain positive si tu as bien ciblé, et que tu sais qu'il peut refuser.
OK elle est légère l'espérance mais c'est mieux que 0
Dernière édition: 11 Avr 2008 20:09 par FiRenZ.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
11 Avr 2008 22:37 - 11 Avr 2008 22:44 #24 par fiastre
Réponse de fiastre sur le sujet Stratégie ... pas si simplifiée que ça.
Dans les années 80, Robert Axelrod, un mathématicien, décida d'appliquer l'expérimentation mathématique au fameux problème du "dilemme du prisonnier". Il demanda à de nombreux confrères, mathématiciens , économistes, sociologues, philosophes, etc.de lui indiquer des stratégies à appliquer. Il les programma sur ordinateur et organisa un gigantesque tournoi dans lequel toutes ces stratégies s'affrontaient. Et de manière expérimentale, il trouva la meilleure....
On pourrait faire pareil ici, si quelqu'un se sent d'écrire le programme....
On peut inventer plein de stratégies. Quelques exemples:
- A: je défie à chaque fois n'importe qui au hasard; j'accepte tous les défis
- B : je ne défie personne, je refuse tous les défis
- C: je ne défie personne, j'accepte tous les défis
- D: je défie n'importe qui au hasard, je refuse tous les défis
- E: je défie toujours le plus petit tapis, je refuse tous les défis
- F: je défie toujours le plus gros tapis, je refuse tous les défis
- G: je ne défie personne, j'accepte les défis seulement des tapis plus gros
- G: je ne défie personne, j'accepte les défis seulement des tapis plus petits
- H: je défie toujours le plus petit tapis, j'accepte les défis des tapis plus petits
- I: je défie toujours le plus gros tapis, j'accepte les défis des tapis plus gros
- J: si je suis le plus petit tapis, je défie le tapis juste au dessus de moi, j'accepte tous les défis
- K: si je suis le plus petit tapis, je défie le tapis juste au dessus de moi, je refuse tous les autres défis
- L: si je suis le plus petit tapis, je défie le plus gros tapis, j'accepte tous les défis
- M: si je suis le plus petit tapis, je défie un tapis plus gros que moi, je refuse tous les autres défis
- N: si je suis en dessous de la moyenne, je défie le plus petit tapis, j'accepte tous les défis
- O: si je suis au dessus de la moyenne, je défie le plus petit tapis, j'accepte tous les défis
- P: j'essaie de faire (proposer ou accepter) un défi tous les x tours. SI j'ai accepté k défis et qu'il y a eu n tours , je regarde si x<k/x. Si oui, je propose un défi au hasard, sinon je passe.
- Q: je propose un défi au plus petit tapis. Si je double, j'arrête quand je suis au dessus de la moyenne.
- R: je propose un défi au plus petit tapis. Si je double, je continue. J'arrête quand que je suis au dessus du double de de la moyenne. (ou du triple, du quadruple, etc.)
- S: je propose ( au plus petit tapis) des défis ou j'accepte des défis tant que je ne suis pas chipleader. Si je suis chipleader, j'attends.
- T: je ne fais rien tant que la moitié des joueurs n'est pas éliminée. Après je fais des défis à chaque coup, face au plus petit tapis ou à celui qui me le propose.
- U: je repère les joueurs qui ont refusé des défis. Je défie systématiquement celui qui en a refusé le plus. J'accepte tous les défis.
- V: je propose un défi au chipleader ou j'accepte les défis jusqu'à atteindre la bulle (places payées +racine carrée du nombre de place payées). A la bulle je ne propose ni n'accepte aucun défi. Dans les places payées je propose un défi au plus petit stack et je les accepte tous.
- W: je propose un défi au chipleader ou j'accepte les défis jusqu'à atteindre la bulle (places payées +racine carrée du nombre de place payées). A la bulle je ne propose ni accepte aucun défi. Dans les places payées , je ne fais plus rien.
- X: je tire au sort à chaque coup,avec un dé à n faces. Quand un nombre de 1 à k sort, je propose un défi en tirant au sort celui à qui je le propose. Quand on me propose un défi, je tire au sort avec la même logique pour savoir si je l'accepte.
- Y: je défie systématiquement les barbus. J'accepte les défis uniquement de la part des filles.
- Z: j'applique une des 25 stratégies ci-dessus au hasard.

Bon, je m'arrête quand j'ai épuisé les 26 lettres de l'alphabet. Il y a des stratégies qui vous semblent idiotes dans celles que j'ai énoncées ? Moi aussi. Mais ce n'est pas une raison pour ne pas les inclure dans le modèle. En effet, s'il y a des joueurs qui appliquent des stratégies idiotes (et il y en a sûrement !), il faut voir quelles sont les meilleures stratégies face à ces joueurs.
Je crois qu'Axelrod avait recueilli près d'un millier de propositions de stratégies. On peut essayer de se contenter de moins. L'important c'est de ne pas éliminer trop vite les hypothèses en se contentant d'idées reçues et plus on avance, plus je constate qu'il y en a vraiment partout au poker, parce que jusqu'à présent on n'a pas démontré grand chose...
Dernière édition: 11 Avr 2008 22:44 par fiastre.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
12 Avr 2008 12:12 #25 par FiRenZ
Réponse de FiRenZ sur le sujet Stratégie ... pas si simplifiée que ça.
Mathématiquement parlant, nous n'arriverons probablement jamais à une stratégie absolue.

On pourrait trouver expérimentalement une bonne stratégie. Mais il y a le facteur humain à prendre en compte, et ce facteur est en perpétuel changement. Et la bonne stratégie expérimentée pourrait se changer en mauvaise stratégie.

Admettons un jour qu'on arrive à la conclusion que la meilleure façon de rentrer dans les places payées est de ne jouer aucun coup, refuser tous les duels. Quelques personnes vont s'en apercevoir et vont adopter cette stratégie, puis de plus en plus, jusqu'à arriver à une masse critique qui fera que cette stratégie deviendra une mauvaise stratégie et ne fonctionnera plus.

Ce qu'on arriverait peut-être à démontrer c'est qu'il y a des idées reçues (un tas probablement), et là ça devrait être vraiment intéressant.

On le voit dans le monde du poker de tournoi. La télévision, internet (et probablement Hansen) ont amené des façons vraiment différentes de jouer au poker, la vieille école a résisté un moment. Mais regardez les finales des EPT aujourd'hui : l'âge moyen dépasse rarement 25 ans...

Tout change, tout est en mouvement. La stratégie optimale au temps t, ne le sera plus au temps t+1.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
12 Avr 2008 13:19 #26 par Wolverine
Réponse de Wolverine sur le sujet Stratégie ... pas si simplifiée que ça.
Entièrement d'accord avec FIRenZ.

Les stratégies évoluent d'années en années(lire les notes de Doyle Bronson dans Super system 2 pour suivre l'évolution des stratégies). Steinitz à la fin du 19eme siècle ne jouait pas comme un Bobby Fisher ou comme un Kasparov dans la fin du 20ieme siècle. Ces joueurs s'auto-adaptent à l'environnement et aux adversaires de l'époque. Quand je joue contre mon petit neveu autant oublier les bibliothèques d'ouverture...

Je débute mais je serai enclin à penser que comme aux Echecs la stratégie évolue dans le temps et dans les différentes phases d'un tournoi mais qu'en plus les stratégies évoluent suivant l'attitude des joueurs d'une même table. De plus la stratégie doit forcément évoluer suivant la nature de la population de la table. Je pense qu'un joueur peut très bien avoir une stratégie Lambda au sein d'une table ou les autres joueurs ont une stratégie autre mais que ce même joueur changera sa stratégie si toute la table adopte dans sa majorité la même stratégie Lambda.

C'est dans ce sens que je pense que les simulations ne doivent pas trop s'éloigner des réalités "techniques" d'un vrai tournoi car les résultats obtenus sur une table de 100 joueurs ne seront pas applicables (selon moi) à un tournoi avec les mêmes joueurs virtuels et les mêmes stratégies sur 10 tables de 10 joueurs. Pour revenir aux Echecs le problème de pouvoir poser n reines sur un échiquier sans que ces dernières ne soient en prise est un beau problème intellectuel mais n'apporte strictement rien au joueur qui veut progresser aux Echecs. (Désolé si je parle souvent des Echecs mais je me raccroche aux domaines que je maitrise un peu mieux que le Poker, j'ai écrit un programme de jeux d'Echecs, il y a vingt ans, p#%t@& 20 ans! je me fais vieux!)

J'ai commencé à faire évoluer un programme que j'avais écrit il y a près de 2 mois pour simuler un tournoi de Poker avec des joueurs de stratégies simplifiées différentes (eh oui l'idée me trottaient depuis plusieurs semaines, je suis un fan de jeux de stratégies, de stats et proba et informaticien, je compte créér un blog sur les résultats de ces stratégies simulées simplifiées afin d'avoir les commentaires d'un maximum de personnes) pour le transformer (le simplifier) dans le sens de vos règles du FlipCoin. On pourra s'amuser à faire de multiples simulations sur 1 table de 100 et sur 10 tables de 10 pour voir si mon intuition est bonne (je ferai les mêmes simulations avec les mêmes joueurs et la même répartition de stratégies) avec une simulation répétée n fois. Les algorithmes développés n'étant pas optimisés dans l'optique d'une table "gigantesque" de 100 joueurs j'ai peur que dans cette dernière configuration le programme "rame" mais on verra bien. Je n'ai pas envie de tout casser dans mon code pour l'optimiser pour cette mega-table, cela me prendrait trop de temps. Si personne ne vous a apporté un bout de code dans ce sens d'ici là laissez moi une semaine pour faire cette modif et faire des simulations selon vos règles. Le code actuel est écrit en Php mais facilement adaptable. D'ailleurs je réécris ma nouvelle version de simulateur (de "vrai poker") en VB.Net avec une base SQL-Server pour enregistrer les résultats des simulations et pouvoir extrapoler des statisques par rapport aux résultats enregistrées dans la base.

Pour finir sur le sujet j'ai regardé un grand nombre de vidéo de personnes commentant leurs sessions de Cash Game , ces dernièrs utilisaient des logiciels comme PokerTracker en faisant des commentaires du style vous voyez ce joueur n'est pas bon car son coefficient machin-chose est inférieur à tant alors qu'il devrait être entre machin chose et bidule truc. Je serai extrêmement curieux de connaitre les stats pokertrackéisées de grands joueurs de ce monde pour voir si ils correspondent à ces courants de pensées sur les bonnes stats à avoir. Je ne serai pas étonné qu'il y ait de belles surprises...

@+
Wolverine

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
12 Avr 2008 17:10 - 12 Avr 2008 17:16 #27 par Jupiter
Réponse de Jupiter sur le sujet Stratégie ... pas si simplifiée que ça.
fiastre écrit:

Jupiter écrit:

* 1 * si on se place d'un pur point de vue mathématique, une évidence me semble s'imposer :
en ne jouant pas, ou en refusant les coin flips, on est sûr de ne pas pouvoir gagner, puisqu'il y aura obligatoirement des joueurs qui auront plus de jetons que nous !
Il faut donc dès le départ prendre le risque à mon avis

Jean-Paul, ça ne me semble pas si évident que tu le dis. Si 99 joueurs de lancent de manière acharnée dans des coin-flips, celui qui ne fait rien a de grandes chances de finir deuxième, et j'ai précisé que le but, ce n'est pas forcément d'être premier, c'est de maximiser son espérance d'argent payé...

Là, tu pousses Pierre ! si les 99 se lancent de façon acharnée dans des coin flips, quelle est la probabilité qu'un seul les gagne tous, pour t'offrir la seconde place ?
On est dans du gaussien vu le nombre de coin flips qui vont se jouer, donc beaucoup plus de probabilité que 40 à 60 joueurs doublent, ce qui diminue énormément tes chances avec tes 1.000 en ce cas, et si ça continue lke plus probable est qu'on retrouve 17 à 23 joueurs avec près de 5.000, auquel cas tes 1.000 n'ont plus qu'une espérance minuscule, c'est ça que je voulais dire
Et est toujours loin du vrai poker de tournoi, ou en faisant ça, ce n'est pas 1.000, mais 300 ou 400 qu'il te restera au mieux à ce stade en ne bougeant pas, alors là, tu fais quoi face aux 5.000 qui t'entourent ? Tu t'envoies en l'air obligatoirement avec des chances infimes.
Soit dit en passant, tes "dédits" n'ont rien à voir avec les blinds et ante, mis obligatoirement qu'on joue ou pas ! et ça change tout !!

Je me vois bien d'accord avec notre ami : comme dans beaucoup d'autres domaines, les "simplifications" ont un certain intérêt, mais il faut savoir en connaître les limites, ce qui n'est pas du tout le cas ici... La beauté du Hold'Em, surtout en No-Limit, c'est justement d'être à connaissance imparfaite
Dernière édition: 12 Avr 2008 17:16 par Jupiter.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
12 Avr 2008 18:39 - 12 Avr 2008 21:19 #28 par fiastre
Réponse de fiastre sur le sujet Stratégie ... pas si simplifiée que ça.
Jupiter écrit:

Là, tu pousses Pierre ! si les 99 se lancent de façon acharnée dans des coin flips, quelle est la probabilité qu'un seul les gagne tous, pour t'offrir la seconde place ?

Elle est égale à 1, Jean-Paul !
Chaque coin-flip a une chance sur deux d'éliminer un joueur (quand le petit tapis perd). Donc si 99 joueurs se lancent des coin-flips acharnés, il faudra environ 196 duels pour que 98 joueurs soient éliminés, soit deux tours de table...
Si les joueurs défient n'importe qui au hasard, tu sera défié environ un nombre de fois égal à:
2/99+2/98+2/97+.......+2/3+2/2
Ca fait à peu près 2xln(99)+0,577, mais calculé précisément dans excel, ça nous donne 8,2. C'est à dire qu'en refusant les coin-flips proposés, tu vas descendre à 92 jetons , assuré de la seconde place et avec 1 chance sur 100 de remporter la prmière face à un joueur qui en a 9908.
Bien sûr, si on te défie plus, c'est plus dur à tenir. Il faut être défié 13 fois plus que la moyenne des autres joueurs pour ne pas tenir le coup...

Je suis d'accord pour ajouter un ante d'un jeton à chaque tour de table. Ainsi il est impossible que personne ne fasse jamais rien. (Dans ma démonstration ci-dessus, ça n'aurait coûté que 2 jetons de plus à ma stratégie d'immobilisme - qui bien sûr ne se justifie que par la frénésie de coin-flips des autres !).

Et bien sûr que c'est très simplifié par rapport au poker. Donc un joueur qui maîtrise parfaitement la stratégie du vrai tournoi, devrait maîtriser encore mieux celle de ce jeu...Moi, je ne maîtrise ni l'une ni l'autre, donc j'essaie cette approche.
Dernière édition: 12 Avr 2008 21:19 par fiastre.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
12 Avr 2008 18:55 - 12 Avr 2008 18:56 #29 par Jupiter
Réponse de Jupiter sur le sujet Stratégie ... pas si simplifiée que ça.
Ok !

c'est amusant, parce qu'à mon avis (mais je ne maîtrise pas tout, loin de là), ça ne me semble rien apporter à la stratégie en tournoi,

mais ça démontre parfaitement l'efficacité d'une recommandation tactique de Harrington :
jouer à l'inverse du style dominant de la table :silly:
Dernière édition: 12 Avr 2008 18:56 par Jupiter.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
14 Avr 2008 12:14 #30 par Bart2Mars
Réponse de Bart2Mars sur le sujet Stratégie ... pas si simplifiée que ça.
Vraiment très intéressant comme problême!
Je propose une chose:
Qu'au prochain live MH on tente l'expérience en parallèle du poker. Chacun aurrait un "side stack" dédié à ceu jeu et comme on est à peu près 100 et que ça devrait pas durer très longtemps, c'est tout à fait possible...Non?

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
14 Avr 2008 22:32 #31 par Wolverine
Réponse de Wolverine sur le sujet Stratégie ... pas si simplifiée que ça.
Bart2Mars écrit:

Vraiment très intéressant comme problême!
Je propose une chose:
Qu'au prochain live MH on tente l'expérience en parallèle du poker. Chacun aurrait un "side stack" dédié à ceu jeu et comme on est à peu près 100 et que ça devrait pas durer très longtemps, c'est tout à fait possible...Non?



Réponse: Non ;-)

Mais c'est dommage que je ne puisse pas être là pour le prochain Live, j'avais vraiment aimé ma première et très courte (sic) expérience de la dernière fois. J'aurai aimé voir la tête du type qui participe à cette simulation Live et à qui on dit:

- Alors toi tu vas simuler la stratégie type 'B'.
- Chouette! Super et c'est quoi?
- Tu ne défie personne et tu refuse tous les défis...

Super palpitant! ;-)

Plus sérieusement il y a 2 choses qui rendent ce type d'expérience Live relativement inutile.

1) Pour qu'une expérimentation de ce type puis avoir un "sens" statistiquement parlant il faut un échantillon très important. Donc il faudrait simuler non pas une partie mais N parties avec un N très grand (le plus grand possible, les stateux pourront peut-être dire le N minimum). Et non seulement N partie mais en plus avec diverses proportions différentes des X stratégies potentielles prédéfinies.

2) Contrairement à ce que vous pourriez penser une simple simulation live d'une seule partie pourrait durer très longtemps. Je le sais car j'ai fini d'écrire 99% du programme de simulation (reste à trouver mes derniers petits bugs, j'avais annoncé un programme opérationnel pour la fin de la semaine donc je suis largement dans les temps) et quand je trace pas à pas le code je me rend déjà compte que la population de joueur diminue relativement lentement car, je suppose que c'est la raison, beaucoup des stratégies prédéfinies ont pour défense de refuser tout défi.
Comme dans mes simulations les Blinds sont faibles au départ et les antes inexistants cela prend pas mal de temps (en nombre de mains) pour que le nombre de joueurs diminue de beaucoup...

Pour les curieux un programme de simulation de ce type prend un petit millier de ligne de code (je l'ai écrit en VB.NET).
Le source actuel est visible ici:

www.marcvallee.com/poker/simulation/sourcecode.html

Of course je donnerai le source final aux personnes intéressées pour qu'elles puissent rajouter leurs propres stratégies. Comme ce source est un "portage" de mon autre simulateur qui était écrit en PHP il y des parties qui peuvent sembler "bizarres" ou "inutiles" mais c'est qu'il y a beaucoup de choses autour qui ont été enlevées. Ce simulateur simule des tournois de N tables de M joueurs avec la gestion de l'équilibrage des tables au fur et à mesure des éliminations. Dans la version finale du simulateur je voudrais que l'on puisse indiquer facilement la gestion des blinds et des Antes, indiquer le nombre de tournois à simuler (du style 1000, 10000, etc, pas grave on laisse tourner l'ordi pendant ses Sit&Go préférés) et envoyer le résultat chiffré dans un fichier ou une base de données (mon autre version travaille avec SQL-Server mais bon pas tout le monde a une base installée sur sa bécane, à la limite je peux l'envoyer vers une base Access)

Voili, à bientôt pour de palpitantes simulations.
Il sera alors interressant d'interroger préalablement un panel de personnes pour leur demander quelle est leur "intuition" fasse aux résultats des diverses stratégies et de comparer avec les résultats obtenus par les simulations.

De belles analyses en perspective...

Wolverine, conquérant de l'inutile

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
18 Avr 2008 11:10 - 18 Avr 2008 11:12 #32 par fiastre
Réponse de fiastre sur le sujet Stratégie ... pas si simplifiée que ça.
Très intéressant Wolverine, bon courage.
Moi, je vais essayer une autre méthode qui est celle de la récurrence ou de la récursivité, bref, d'y aller petit à petit: raisonner à partir de la fin du tournoi. Quelle est la bonne stratégie quand on est plus que 2? Plus que 3 ? Plus que 4 , etc..?
Alors commençons:
A 2 joueurs
Si le petit stack ne fait rien et le gros non plus, le petit va perdre du fait des antes. Il doit donc obligatoirement défier le gros. Le gros doit bien sûr accepter sinon son tapis va diminuer du fait des blinds de dédit et le petit va recommencer. Le gros acceptant tous les défis du petit a aussi du coup intérêt à défier le petit (au cas certes improbable où il refuserait).
Le jeu consiste donc en une succession continue de défis de la part des deux joueurs. Si l'un d'entre eux refuse des défis, il perd des jetons et diminue ses chances de gagner.
La seule bonne stratégie est: défier sans cesse et accepter tout défi.
La probabilité d'avoir la première place est égale à son tapis sur les total des deux.
Si les stacks sont S1 et S2 et les premier et deuxième prix P1 et P2, l'espérance du joueur 1 est;
E1= (S1/(S1+S2))xP1+(S2/(S1+S2))xP2
et celle du joueur 2:
E2= (S2/(S1+S2))xP1+(S1/(S1+S2))xP2
Voilà. A moins que quelqu'un ne trouve une erreur dans le raisonnement ci-dessus, la stratégie à 2 joueurs est entièrement résolue.
Il n'y a plus qu'à passer à celle à 3 joueurs, mais c'est l'heure du pastis.
Dernière édition: 18 Avr 2008 11:12 par fiastre.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
19 Avr 2008 21:41 #33 par Wolverine
Réponse de Wolverine sur le sujet Stratégie ... pas si simplifiée que ça.
Pour les curieux les résultats arrivent (max demain soir)
Les bugs de simulation semblent résolus (je fais encore pas mal de vérifications fastidieuses histoire que les résultats veuillent dire quelque chose) et pour la petite histoire le programme simule un tournoi de 1000 joueurs répartis sur 100 tables en environ 50 millisecondes ;-)
Bref quand je lance 100 simulations de ce type de tournoi cela prend environ 1/2 seconde... (si je ne me suis pas trompé dans les algos).
Dans mes tests le nombre moyen de mains jouées par tournoi tourne dans les 200. Le tout pour une simulation avec une répartition aléatoire des joueurs de stratégies A à G.
Le tout est enregistré dans une base Access pour que les stateux puissent en tirer leurs propres interprétations. Le transfert vers Excel devrait être EZ.

A+ pour les résultats...

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
20 Avr 2008 14:19 #34 par fiastre
Réponse de fiastre sur le sujet Stratégie ... pas si simplifiée que ça.
J'attends ça avec impatience. Je suppose qu'on pourra faire varier la composition initiale ?
Bon, en attendant on attaque la table à 3.

La table à 3

Appelons les joueurs S3 pour le plus petit tapis, S2 le moyen et S1 le gros.
Si personne ne fait rien, S3 va perdre du fait des antes. Donc S3 doit défier. Qui ? Il a bien sûr intérêt à défier S2 car:
- s'il perd, c'est pareil
- s'il gagne, il aura gagné le même nombre de jetons, mais il aura plus rapproché S2 de l'élimination qu'il n'aurait pu le faire pour S3. Donc, il s'est plus rapproché de la deuxième place et a maximisé son espérance de gain.
S2 doit accepter le défi, car sinon il perd le blind de dédit et S1 recommence.
A son tour, S2 peut attendre ou défier S1, c'est pareil.
Quant à S1, il n'a qu'à ne rien faire et attendre l'élimination de S2 ou S3...
Voici les meilleurs stratégies pour chacun, si chacun joue bien.
Mais il faut aussi examiner les stratégies de chacun si les autres jouent mal...
Si S3 est défié par S1, il doit accepter sinon il perd le blind et S1 recommence.
Idem si S1 est défié par S3.
Si S1 et S2 se défient entre eux, c'est une aubaine pour S3 qui n'a qu'à les regarder faire.
En conclusion, les bonnes stratégies seraient:
- pour S3: défier S2 sauf si S1 et S2 se défient entre eux, accepter les défis
- pour S2: ne rien faire, accepter les défis
- pour S1: ne rien faire, accepter les défis

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
20 Avr 2008 16:22 #35 par Jupiter
Réponse de Jupiter sur le sujet Stratégie ... pas si simplifiée que ça.
Je continue à être très sceptique sur la validité de ce jeu pour le vrai poker (en Limit à la rigueur et encore, en No-Limit c'est beaucoup trop simplifié)

Ceci dit, le jeu est amusant en soi..
Alors comme c'est du tournoi, plutôt que de l'espérance de gain, je préférerais baser les tactiques sur un calcul ICM..
auquel cas, je ne pas si sûr que pour S3 ce soit très différent de défier S1 ou S2... à vérifier !

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
20 Avr 2008 17:04 #36 par Wolverine
Réponse de Wolverine sur le sujet Stratégie ... pas si simplifiée que ça.
Entièrement d'accord. Intérêt limité pour le vrai poker mais très amusant pour vérifier ses intuitions sur un problème simplifié.

Je viens de finir la simulation de 1000 tournois de 1000 participants tirés au sort parmi les stratégies A à Z mais sans compter les Y ;-)

Durée moyenne de chaque tournoi simulé: 157 milliseconde sur mon vieux portable.
Nombre moyen de mains jouées par tournoi: 7329 soit un peu plus de 7 millions de mains sur l'ensemble de la simulation.

Pour les gains j'ai repris la répartition des récompenses d'un buy-in 1$ avec 1000 participants sur Everest.

Je suis en train de finir des requêtes dans la base Access pour l'analyse globale des résultats (classement moyen, gain moyen, gains totaux par stratégies, nombre d'attaque déclanchées, nombre de défi acceptés ou refusés en moyenne etc).

Etant donné que les pizzas viennent d'arriver (il y a des priorités dans la vie) et qu'il reste un "petit" travail de mise en forme les différents tableaux des résultats seront postés d'ici 21h00...

A+

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
20 Avr 2008 17:15 #37 par nicokent
Réponse de nicokent sur le sujet Stratégie ... pas si simplifiée que ça.
excellent wolverine, merci pour ton implication dans ce problème simplifié mais qui en intéressera plus d'un.

Le Poker est un sport.
Beaucoup de passionnés, peu de professionnels.
Ne vous noyez pas.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
20 Avr 2008 19:17 #38 par Wolverine
Réponse de Wolverine sur le sujet Stratégie ... pas si simplifiée que ça.
Les résultats sont ici: www.marcvallee.com/poker/simulation/

Je ne sais pas comment copier les tableaux de résultats dans ce forum donc si quelqu'un veut s'en charger merci d'avance...

Les sources du programme sont evidement libres de droit donc n'hésitez pas à le piquer, le copier, le débugger, l'améliorer afin d'en faire profiter d'autres personnes ou pour simuler d'autres types de stratégies...

Alors ... Est-ce que vos intuitions se sont avérées justes sur l'efficacité (relative) comparées des différentes stratégies?

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
20 Avr 2008 22:11 - 20 Avr 2008 22:19 #39 par fiastre
Réponse de fiastre sur le sujet Stratégie ... pas si simplifiée que ça.
Passionnant Wolverine !
Un question préalable: dans ma liste, il y avait par erreur 2 stratégies qui s'appelaient G. Laquelle as-tu mise ou pas ?
Maintenant quelques commentaires.
Je constate d'abord avec joie que la stratégie qui réussit le mieux est la J: "Si je suis le plus petit tapis, je défie le tapis qui est juste au dessus de moi, j'accepte tous les défis.". Or en commençant mon analyse récursive, c'est la stratégie que j'ai trouvée la meilleure à 2 joueurs et à 3 joueurs, et que je supposais bien pouvoir être étendue au moins jusqu'à la fin des places payées...
Vient ensuite la U: "Je repère les joueurs qui ont refusé des défis. Je défie systématiquement celui qui en a refusé le plus. J'accepte tous les défis."Voici quelque chose de fabuleusement intéressant: une stratégie qui repère les joueurs timorés, les défie, et empoche les blinds de dédit quand ils refusent...Autrement dit une stratégie qui repère les souris pour faire le chacal !
En troisième vient la C: "je ne défie personne, j'accepte tous les défis", autrement dit une stratégie toujours attentiste. Je suis un peu plus surpris. Il faudrait voir si cette stratégie résiste lorsque les joueurs agressifs sont moins nombreux (ici, elle doit profiter de l'hécatombe).
En quatrième position la V, startégie un peu bizarre et complexe: "Je propose un défi au chipleader ou j'accepte les défis jusqu'à atteindre la bulle (places payées +racine carrée du nombre de place payées). A la bulle je ne propose ni n'accepte aucun défi. Dans les places payées je propose un défi au plus petit stack et je les accepte tous." On peut remarquer que quand elle atteint les places payées, cette stratégie est strictement identique à la stratégie leader J. Elle mériterait d'être approfondie.
En cinquième position vient la S: "je propose ( au plus petit tapis) des défis ou j'accepte des défis tant que je ne suis pas chipleader. Si je suis chipleader, j'attends." une stratégie qui cherche à grossir en taquinant la short stack tant qu'elle n'est pas en tête. Amusant.
Après les performances baissent pas mal...
Regardons par la fin:
La plus mauvaise stratégie est la B :" je ne défie personne, je refuse tous les défis"I Il est clair que l'immobilisme total ne peut que conduire à constater l'érosion des jetons.
Vient en avant-dernière la O: "si je suis au dessus de la moyenne, je défie le plus petit tapis, j'accepte tous les défis". Il est clair que cette stratégie a une faille grave: si elle est en dessous de la moyenne, elle ne fait rien, et elle a donc peu de chances de passer au dessus de la moyenne et de faire quelque chose...
Voyons maintenant quelques autres stratégies:
La A: "je défie à chaque fois n'importe qui au hasard; j'accepte tous les défis", qu'on pourrait appeler"chacal fou". Elle ne réussit pas mal, mais n'est pas au top.
La Z:" j'applique une des 25 stratégies ci-dessus au hasard." fait mieux que la moyenne...Ce n'est peut-être pas tout à fait du au hasard. idem pour la X: "je tire au sort à chaque coup,avec un dé à n faces. Quand un nombre de 1 à k sort, je propose un défi en tirant au sort celui à qui je le propose. Quand on me propose un défi, je tire au sort avec la même logique pour savoir si je l'accepte."
Au fait wolverine, quelles valeurs as-tu prises pour la X et la P?
Enfin, deux autres constatations:
- l'analyse de paires de stratégies voisines montre qu'il n'est jamais rentable de refuser les défis (ce qui confirme aussi mon analyse pour 2 et 3)...
- la comparaison de J et L semble aussi montrer que si on est le plus petit tapis, il vaut mieux défier celui juste au dessus que le chipleader.

Ce ne sont que des premières constatations dans ce tournoi particulier. Il faut donc les prendre avec pécaution avant de conclure. Par exemple, une stratégie 1 peut performer en tirant partie des faiblesses d'une stratégie 2. Supprimons 2 et 1 devient beaucoup moins bon. Si tu y est prêt Wolverine, on peut faire beaucoup d'autres tournois en faisant varier les proportions, en inventant d'autres stratégies, en faisant des populations composées de 2 sratégies seulement pour évaluer leurs performances l'une par rapport à l'autre, etc...On peut aussi améliorer les règles.

En tout cas, je suis persuadé que malgré les simplifications, ce type d'analyse peut permettre de comprendre des choses qui restent aujourd'hui très nébuleuses et truffées d'idées reçues au poker (comme la stratégie de tournoi !), et le faire progresser.
Dernière édition: 20 Avr 2008 22:19 par fiastre.

Connexion ou Créer un compte pour participer à la conversation.

Plus d'informations
20 Avr 2008 22:52 - 20 Avr 2008 22:57 #40 par fiastre
Réponse de fiastre sur le sujet Stratégie ... pas si simplifiée que ça.
Jupiter écrit:

Alors comme c'est du tournoi, plutôt que de l'espérance de gain, je préférerais baser les tactiques sur un calcul ICM..
auquel cas, je ne pas si sûr que pour S3 ce soit très différent de défier S1 ou S2... à vérifier !

prenons un exemple:
S3=200
S2=300
S1=500
Que S3 défie S2 ou S1, il y a une chance sur 2 qu'il perde, et qu'il finisse ainsi 3ème .
Il y a aussi une chance sur 2 qu'il gagne, mais là le résultat est alors différent.
Premier cas : s'il a défié S1,
S3=400
S2=300
S1=300
Deuxième cas : s'il a défié S2,
S3=400
S2=100
S1=500
j'appelle p1,p2,p3 les probabilités pour S3 de finir respectivement 1er, 2ème, 3ème
Dans les deux cas, S3 a donc une proba p1=0,4 de finir premier. Il nous reste le calul de la probabilité qu'il finisse second.
Premier cas:
- soit S1 finit premier avec une proba de 0,3 et alors S3 finit second avec une proba de 4/7=0,57
- soit S2 finit premier avec une proba de 0,3 et alors S3 finit second avec une proba de 4/7=0,57
donc p2= 0,3x0,57+0,3x0,57=0,34 et p3=0,26
Deuxième cas:
- soit S1 finit premier avec une proba de 0,5 et alors S3 finit second avec une proba de 0,8
- soit S2 finit premier avec une proba de 0,1 et alors S3 finit second avec une proba
de 4/9=0,44
Donc p2= 0,5x0,8+0,1x0,44= 0,44 et p3=0,16
On peut donc voir que, quelle que soit la structure des prix, pourvu qu'elle soit croissante bien sûr, on sera plus payé dans le premier cas que dans le second.
Si les gains sont G1 pour le premier, G2, et G3
En défiant S1
p1= 0,20
p2= 0,17
p3= 0,63
E1=0,20G1+0,17G2+0,63G3
En défiant S2
p1= 0,20
p2= 0,22
p3= 0,58
E2=0,20G1+0,22G2+0,58G3
Si G2>G3 (la condition G1>G2 n'est même pas nécessaire) alors E2>E1

Ca peut sans doute se démontrer pour n'importe quelle valeurs de S1>S2>S3 mais ça serait un peu lourd ici. L'important c'est en fait qu'en t'attaquant à la petite stack, si tu gagnes, tu lui fais proportionnellement plus de mal qu'à la grosse, donc tu la rapproches plus de la sortie et tu avances plus dans la hiérarchie des places payées.
Dernière édition: 20 Avr 2008 22:57 par fiastre.

Connexion ou Créer un compte pour participer à la conversation.

Temps de génération de la page : 0.171 secondes