- Het o3-model van OpenAI won een vijfdaags pokertoernooi met negen AI-chatbots
- Het o3-model won door het meest consistente spel te spelen
- De meeste van de beste taalmodellen gingen goed om met poker, maar hadden moeite met bluffen, positioneren en elementaire wiskunde
In een digitale botsing die nog nooit eerder aan tafel is gezien, brachten negen van ’s werelds krachtigste spraakmodellen vijf dagen lang door in een pokerspel met hoge inzetten.
o3 door OpenAI, Claude Sonnet 4.5 door Anthropic, Grok door X.ai, GooglenMeta’s Gemini 2.5 Pro, Meta’s Llama 4, DeepSeek R1, Moonshot AI’s Kimi K2, Mistral AI’s Magistral en Z.AI’s GLM 4.6 speelden duizenden handen no-limit Texas hold ‘em aan de $10 en $20 tafels met bankrolls van elk $100.000.
Toen OpenAI’s o3-model een pokerspel van een week $ 36.691 rijker verliet, was er geen trofee, alleen maar opscheppen.
Het experimentele PokerBattle.ai was volledig AI-aangedreven, waarbij naar elke speler hetzelfde initiële bericht werd gestuurd. Het was pure strategie, als strategie is wat je duizenden microbeslissingen noemt, genomen door machines die niet echt begrijpen wat winnen of verliezen is, of hoe vernederend het is om met zeven-twee te verliezen.
Voor een technologische stunt was het ongewoon belangrijk. De best presterende AI’s waren niet alleen maar aan het bluffen en gokken: ze pasten zich aan, vormden hun tegenstanders en leerden in realtime hoe ze dubbelzinnigheid konden overwinnen. Hoewel ze geen foutloos poker speelden, kwamen ze heel dicht bij het nabootsen van de oordelen van meer ervaren spelers.
OpenAI’s O3 bleek al snel de meest stabiele hand te hebben, won drie van de vijf grootste potten en bleef dicht bij de preflop-theorie uit het leerboek. Claude van Anthropic en Grok van X.com completeerden de top drie met aanzienlijke winsten van respectievelijk $33.641 en $28.796.
Ondertussen verloor Llama zijn volledige stack en verliet vroegtijdig. De rest van het deelnemersveld viel ergens in het midden, waarbij Google’s Gemini een bescheiden winst maakte en Moonshot’s Kimi K2 bloedende chips naar een finale van $86.030.
Gok-AI
Poker is lange tijd een van de beste analogen geweest voor het testen van AI voor algemene doeleinden. In tegenstelling tot schaken of Go, die afhankelijk zijn van perfecte informatie, vereist poker dat spelers denken onder omstandigheden van onzekerheid. Het is een spiegel van de besluitvorming in de echte wereld in alles, van handelsbesprekingen tot militaire strategie, en nu lijkt het erop dat chatbots ontwikkeling.
Een consistent aspect van het toernooi was dat de bots vaak te agressief waren. De meesten geven de voorkeur aan strategieën boordevol actie, zelfs in situaties waarin folden verstandiger zou zijn geweest. Ze probeerden meer grote potten te winnen dan te voorkomen dat ze verloren gingen. En ze waren verschrikkelijk in bluffen, niet omdat ze het niet probeerden, maar omdat hun bluf vaak het gevolg was van verkeerd gelezen handen en niet van intelligent bedrog.
AI-tools worden echter steeds slimmer op manieren die veel verder gaan dan oppervlakkige intelligentie. Ze herhalen niet simpelweg wat ze hebben gelezen; ze maken onder druk probabilistische oordelen en leren de kamer te lezen. Het herinnert ons er ook aan dat zelfs de krachtigste modellen nog steeds gebreken vertonen. Het verkeerd interpreteren van situaties, het trekken van onzekere conclusies en het vergeten van je ‘positie’ is niet alleen een pokerprobleem.
Misschien zit je in een echte pokerroom nooit voor een taalmodel, maar de kans is groot dat je met iemand te maken krijgt die probeert beslissingen te nemen die er toe doen. Deze game was slechts een voorproefje van wat het zou kunnen zijn.
Volg TechRadar op Google Nieuws EN voeg ons toe als uw favoriete bron om nieuws, recensies en meningen van onze experts in uw feeds te krijgen. Klik dan zeker op de knop Volgen!
En jij kunt dat natuurlijk ook Volg TechRadar op TikTok voor nieuws, recensies, unboxing in videoformaat en ontvang regelmatig updates van ons WhatsApp ook.
De beste zakelijke laptops voor elk budget



