OpenAI werd donderdag uitgebracht GPT-5.3-codeeen nieuw model dat de Codex-coderingsagent uitbreidt tot meer dan het schrijven en beoordelen van code om een veel breder scala aan werktaken uit te voeren. De release komt terwijl de concurrentie steeds groter wordt NAAR DE bedrijven die strijden om marktaandeel op het gebied van door AI aangedreven codeertools.
OpenAI zegt dat GPT-5.3 de codeerprestaties van GPT-5.2-Codex combineert met de redeneer- en professionele kennismogelijkheden van GPT-5.2, waardoor het 25% sneller werkt. Hierdoor kan GPT-5.3-Codex langlopende taken uitvoeren die zoeken met zich meebrengen, met behulp van tools zoals zoeken op internet of databaseoproepen, en complexe uitvoering en planning van zowel algemene werk- als softwareontwikkelingstaken.
Codex heeft meer dan 1 miljoen ontwikkelaars bereikt, zegt OpenAI. En hoewel de Claude Code van Anthropic ook snel wordt toegepast, blijven vergelijkende gegevens tussen de twee tools schaars. Semi-analyse relaties dat 4% van de publieke commits van GitHub, of van de nieuwe code die naar repositories wordt geüpload, momenteel door Claude Code wordt gemaakt, en verwacht dat dit cijfer tegen eind 2026 20% of meer zou kunnen bereiken.
Verbetering van de benchmark
OpenAI zegt dat GPT-5.3-Codex nu de beste score heeft van elk model op SWE-Bench Pro, dat real-world software-engineering in vier programmeertalen evalueert. Hetzelfde geldt voor Terminal-Bench 2.0, dat de terminalvaardigheden meet die codeeragenten nodig hebben.
Nog belangrijker is dat het nieuwe model in staat is grotere hoeveelheden informatie in overweging te nemen tijdens het werken aan een taak, en ook langere tijd over die taken kan redeneren zonder menselijke tussenkomst. Tijdens het testen zegt OpenAI dat het heeft waargenomen dat de GPT-5.3-Codex autonoom de game-ontwikkeling over miljoenen tokens itereert met behulp van generieke instructies zoals ‘repareer de bug’ of ‘verbeter het spel’.
Rivaliserende bedrijven maken soortgelijke beweringen. Anthropic zegt dat het nieuw is Claude Opus 4.6-modelwanneer het Claude Code aanstuurt, kan het ook grotere codebases begrijpen en beter geïnformeerde beslissingen nemen over hoe nieuwe code moet worden toegevoegd. In een blogpost donderdag zei het bedrijf dat Opus 4.6 topscores behaalde in verschillende branchebenchmarks, waaronder Humanity’s Last Exam, dat complexe multidisciplinaire redeneringen meet, GDPval-AA, dat zich richt op economisch waardevol kenniswerk, en BrowseComp, dat het zoeken naar moeilijk te vinden informatie test.
Naast coderen is er ook kenniswerk
OpenAI zegt dat GPT-5.3-Codex is ontworpen om de gehele levenscyclus van software te ondersteunen, inclusief het debuggen, implementeren en monitoren van code, het schrijven van productvereistendocumenten en het uitvoeren van onderzoek. Dezelfde agentvaardigheden kunnen van toepassing zijn op taken die ver buiten de softwareontwikkeling liggen, zegt het bedrijf, en strekken zich uit tot taken als het maken van dia’s en het analyseren van gegevens in spreadsheets. (Anthropic heeft Claude Code in een vergelijkbare richting gestuurd en gepositioneerd om een bredere groep informatiewerkers te ondersteunen met een breder scala aan zakelijke taken.)
Op GDPval, een OpenAI-beoordeling die de prestaties meet op zeer specifieke kenniswerktaken in 44 beroepen, komt GPT-5.3-Codex overeen met GPT-5.2 door krachtigere codeermogelijkheden toe te voegen. Op OSWorld-Verified, dat computergebruik in een visuele desktopomgeving test, behaalde GPT-5.3-Codex een nauwkeurigheid van 64,7 procent vergeleken met 38,2 procent voor zijn voorganger.
GPT-5.3-Codex is het eerste model dat OpenAI classificeert als “High Capable” voor cybersecurity-gerelateerde taken onder zijn Preparedness Framework, en het eerste dat het bedrijf rechtstreeks heeft getraind om softwarekwetsbaarheden te identificeren. OpenAI stelt $10 miljoen aan API-credits beschikbaar om de cyberverdediging te versnellen, met name voor open source-software en kritieke infrastructuursystemen.
ChatGPT-abonnees kunnen de GPT-5.3-Codex-sjabloon gebruiken als het brein voor Codex terwijl ze de codeertool gebruiken via de Codex-app, de Integrated Development Environment (IDE)-interface of binnen de opdrachtregelinterface van hun computer.



