Anthropic heeft zijn nieuwste model gelanceerd, de Claude Opus 4.5, waarmee het bedrijf weer bovenaan de referentiekaarten staat NAAR DE software codering.
Opus 4.5 scoort boven de 80% op de veelgebruikte SWE-bench, die modellen test voor software-engineeringvaardigheden. GooglenDe indrukwekkende Gemini 3 Pro, die vorige week werd gelanceerd, behaalde kortstondig de topscore met 76,2%.
Scott White, productmanager Claude bij Anthropic, vertelt het verhaal Snel bedrijf dat het model ook hoger scoorde dan welk mens dan ook in de technische opdracht die het bedrijf geeft aan kandidaten voor technische banen.
Natuurlijk doet Opus 4.5 veel meer dan alleen code schrijven. Antropisch zegt dat het ook het “beste model ter wereld” is voor het aandrijven van AI-agenten en het besturen van een computer, en dat het aanzienlijk beter is dan andere modellen bij taken als diepgaand onderzoek en het werken met dia’s en spreadsheets.
Opus 4.5 behaalde ook state-of-the-art (betere) scores in verschillende andere belangrijke benchmarks, waaronder ‘Agent Coding SWE-bench geverifieerd’, ‘Agent Tool gebruikt T-2 Bench’ en ‘Nieuwe ARC-AGI-2 probleemoplossing’.
Een van de belangrijkste uitdagingen bij het toepassen van AI in echte werkomgevingen is het vermogen van het model om met complexiteit en ambiguïteit om te gaan. White zegt dat klanten van Anthropic vinden dat Opus 4.5 beter is dan eerdere modellen in het omgaan met onzekerheid en het omgaan met afwegingen zonder veel handarbeid van menselijke werknemers.
Enterprise-klanten gebruiken steeds vaker antropogene modellen voor kantoorautomatisering, financiële modellering en documentcreatie, zegt White. Fundamentele Research Labs rapporteerden 20% verbetering in nauwkeurigheid en 15% efficiëntiewinst in Excel-automatiseringstaken met behulp van het nieuwe model, voegt hij eraan toe.
Anthropic is de afgelopen maanden goed op stoom gekomen, met de release van Claude Sonnet 4.5 en Haiku 4.5, evenals nieuwe producten zoals Claude Skills, Claude Code en branchespecifieke releases voor financiële dienstverlening en levenswetenschappen.
Opus 4.5 wordt het nieuwe standaardsjabloon voor abonnees van hoogwaardige abonnementen en zal beschikbaar zijn als vervolgkeuzemenu voor Pro-, Standard-, Team- en Enterprise-gebruikers. Het is ook beschikbaar voor ontwikkelaarsklanten via de application programming interface (API) van het bedrijf, maar ook via Amazon Bedrock, Google Vertex en Microsoft Azure-clouds.
Anthropic zegt dat het ook de toegang tot een bètaversie van de Claude-plug-in uitbreidt Chroombeschikbaar in beperkte preview voor alle Mac-gebruikers. Het bedrijf stelt Claude voor Excel ook in bèta beschikbaar voor Mac Team- en Enterprise-gebruikers, en gaat verder dan de vorige zoekvoorbeeld op uitnodiging.



