- Claude wordt veel meer gebruikt door ontwikkelaars dan door klantenservice, verkoop, financiën of e-commerce
- Hij functioneert nu meer zelfstandig dan ooit tevoren, ook bij complexe taken
- Claude verduidelijkt details meer dan mensen ze onderbreken
Anthropic onthulde dat ongeveer de helft van alle oproepen naar openbare API-tools afkomstig is van software-engineering, terwijl andere sectoren zoals klantenservice, verkoop, financiën en e-commerce ze vertegenwoordigen elk slechts een paar procentpunten.
Bovendien blijkt Claude Code langer autonoom te werken dan ooit tevoren, nu ruim 45 minuten vergeleken met minder dan 25 minuten slechts drie maanden geleden.
OpenAI zegt dat de toename van de autonomie niet alleen van toepassing is op de nieuwste krachtige modellen, wat duidt op een bredere verschuiving naar agentische AI in plaats van te experimenteren met de nieuwste modellen.
Agentic AI is er en komt het meest voor bij het coderen
In een nieuwe blogartikelOpenAI heeft geschetst hoe gebruikers vertrouwen beginnen op te bouwen in AI naarmate taken ambitieuzer worden, maar er is nog steeds sprake van ‘overdistributie’ waardoor modellen zelfs beter in staat zijn dan gebruikers momenteel toestaan. Externe evaluaties tonen ook aan dat de modellen onder ideale omstandigheden veel langere taken aankunnen.
Claude helpt ook op het gebied van vertrouwen en stelt vaker verhelderende vragen dan mensen onderbreken.
In termen van coderen lijkt het erop dat hoe complexer de taak, hoe minder menselijke controle er is. Complexe zaken, zoals het ontdekken van exploits en het schrijven van compilers, hebben ongeveer 67% menselijk toezicht, vergeleken met 87% toezicht op eenvoudige API-taken.
Claude stelt ook ongeveer twee keer zoveel vragen over taken met een hoge complexiteit als over eenvoudige taken.
Vooruitkijkend besprak Anthropic het belang van trainingsmodellen om onzekerheid te herkennen en proactief verhelderende vragen te stellen. Het bedrijf ontmoedigt ook het opleggen van handmatige goedkeuring voor elke actie, met het argument dat dit voor wrijving zorgt zonder noodzakelijkerwijs de veiligheid te vergroten.
Volg TechRadar op Google Nieuws EN voeg ons toe als uw favoriete bron om nieuws, recensies en meningen van onze experts in uw feeds te krijgen. Klik dan zeker op de knop Volgen!
En jij kunt dat natuurlijk ook Volg TechRadar op TikTok voor nieuws, recensies, unboxing in videoformaat en ontvang regelmatig updates van ons WhatsApp ook.



