OpenAI publiceerde donderdag zijn reactie op het indrukwekkende Gemini 3 Pro-model van Google:GPT-5.2– en zo te zien op basis van enkele onderlinge benchmarktestscores lijkt het een winnaar. Het nieuwe model behaalde de hoogste scores in een reeks benchmarktests op het gebied van coderen, wiskunde, wetenschap, gereedschapsgebruik en visie. (Benchmarks moeten uiteraard worden gecombineerd met gebruik in de praktijk om het hele verhaal te vertellen. Maar toch…)
OpenAI zegt dat GPT-5.2, een redeneermodel, prestatiescores op expertniveau behaalde op zijn GDPval-benchmark, die de prestaties evalueert op 44 professionele taken uit de echte wereld, waaronder zaken als het maken van spreadsheets, het opstellen van documenten, het maken van presentaties en meer.
GPT-5.2 presteerde beter dan Gemini 3 Pro in de SWE-Bench Pro (software engineering taak) benchmark met een score van 55,6% (versus 43,3% voor Gemini 3 Pro). Het behaalde een 86,2% op de ARC-AGI-1 benchmark voor abstract redeneren, vergeleken met de 75% score van de Gemini 3 Pro. Het behaalde een score van 92,4% op de GPQA Diamond-benchmark (wetenschappelijke vragen), vergeleken met de Gemini 3 Pro’s score van 91,9%.
Het nieuwe model is verkrijgbaar in drie varianten. GPT-5.2 Instant is handig voor het zoeken van informatie en instructies, het ontwikkelen van vaardigheden, studeren en loopbaanbegeleiding. GPT-5.2 Thinking is handig voor moeilijkere professionele taken zoals het opmaken van spreadsheets en het maken van presentaties. GPT-5.2 Pro heeft volgens het bedrijf meer tijd nodig om antwoorden te genereren, maar is het “slimste en meest betrouwbare” model voor het genereren van nauwkeurige antwoorden in complexe domeinen zoals programmeren.
Voor de vele ontwikkelaars die nu agents bouwen, zegt OpenAI dat GPT-5.2 met redenering het sterkste aanbod tot nu toe is, met “significante verbeteringen in algehele intelligentie, begrip van lange contexten, herinnering van agenttools en visie.”
OpenAI heeft er naar verluidt op aangedrongen om GPT-5.2 vóór het einde van het jaar uit te brengen, zodat het Google’s Gemini 3-release kan tegengaan. Het bedrijf bracht GPT-5 in augustus uit en luidde het in als de volgende grote doorbraak in zijn geschiedenis NAAR DE onderzoek. GPT-5 was een model “systeem”, dat een “router” gebruikte om de juiste vragen naar gespecialiseerde modellen te sturen. Hij noemt GPT-5.2 een “verenigd systeem dat automatisch kiest hoe te reageren op basis van de complexiteit van de taak.”
Het toegenomen vermogen van het GPT-5.2-model om multimodale invoer (audio, video, afbeeldingen, tekst, enz.) te verwerken en te beredeneren is aanzienlijk, omdat Google Gemini 3 dit heel goed doet.
Het nieuwe model werd bijvoorbeeld gevraagd om de kenmerken van een afbeelding van een printplaat te analyseren en vervolgens alle kleine componenten te identificeren en te labelen. OpenAI zegt dat GPT-5.2 dit met veel meer details en precisie deed dan het vorige GPT-5.1-model. Wanneer redeneren wordt geïntroduceerd, kan het model mogelijk problemen in mechanische systemen diagnosticeren door visuele signalen te herkennen.
Alle drie de varianten van GPT-5.2 zijn vandaag beschikbaar in ChatGPT, te beginnen met betaalde abonnees en beschikbaar voor ontwikkelaars via de API. Microsoft, een grote investeerder in OpenAI, zegt dat het GPT-5.2 vandaag naar Microsoft 365 Copilot- en Copilot Studio-gebruikers wereldwijd zal brengen.
In gerelateerd nieuws heeft OpenAI ook aangekondigd dat het een licentie heeft verkregen omgaan met Disney Hierdoor kunnen Sora 2-gebruikers Disney-personages gebruiken in afbeeldingen die ze genereren en delen met behulp van de app. Bovendien zal Disney een aandeleninvestering van $1 miljard doen in OpenAI, met een optie om in de toekomst meer aandelen te kopen.



