Home Nieuws Waarom de meeste pilots voor AI-codering op ondernemingsniveau ondermaats presteren (hint: dit...

Waarom de meeste pilots voor AI-codering op ondernemingsniveau ondermaats presteren (hint: dit is niet het model)

3
0
Waarom de meeste pilots voor AI-codering op ondernemingsniveau ondermaats presteren (hint: dit is niet het model)

Kunstmatige intelligentie in software-engineering is veel verder gegaan dan automatisch aanvullen. De opkomende grens is Agentische codering: AI-systemen die veranderingen kunnen plannen, in meerdere stappen kunnen uitvoeren en kunnen herhalen op basis van feedback. Ondanks de hype rond ‘AI-agents die coderen’ presteren de meeste bedrijfsimplementaties echter ondermaats. De beperkende factor is niet langer het model. Zijn context: De structuur, geschiedenis en bedoeling rondom de code zijn gewijzigd. Met andere woorden, bedrijven worden nu geconfronteerd met een systeemontwerpprobleem: ze hebben de omgeving waarin deze agenten opereren nog niet ontworpen.

De transitie van hulpverlening naar agency

Het afgelopen jaar heeft er een snelle evolutie plaatsgevonden van ondersteunende codeertools naar op agenten gebaseerde workflows. Onderzoek begint te formaliseren wat het gedrag van agenten in de praktijk betekent: het vermogen om te redeneren via ontwerp, testen, uitvoering en validatie in plaats van geïsoleerde fragmenten te genereren. Ik werk als dynamische actie resampling laat zien dat het toestaan ​​van agenten om hun beslissingen te vertakken, te heroverwegen en te herzien de resultaten in grote, onderling afhankelijke codebases aanzienlijk verbetert. Op platformniveau creëren leveranciers zoals GitHub nu speciale agent-orkestratieomgevingen, zoals Agent-copiloot en agenthoofdkwartierter ondersteuning van samenwerking tussen meerdere agenten binnen echte zakelijke pijplijnen.

Maar vroege veldresultaten vertellen een waarschuwend verhaal. Wanneer organisaties agenttools introduceren zonder aandacht te besteden aan de workflow en de omgeving, kan de productiviteit afnemen. Uit een gerandomiseerde controleproef van dit jaar bleek dat ontwikkelaars die AI-ondersteuning gebruikten in ongewijzigde workflows taken langzamer voltooiden, grotendeels als gevolg van controle, herbewerking en verwarring over de bedoelingen. De les is simpel: autonomie zonder orkestratie leidt zelden tot efficiëntie.

Omdat context-engineering de echte oplossing is

Bij elke mislukte implementatie die ik heb waargenomen, kwam de mislukking voort uit de context. Wanneer agenten geen gestructureerd begrip hebben van een codebasis, met name de relevante modules, afhankelijkheidsgrafiek, testharnas, architecturale conventies en veranderingsgeschiedenis. Ze genereren vaak resultaten die correct lijken, maar los staan ​​van de realiteit. Te veel informatie overweldigt de agent; te weinig dwingt hem om te raden. Het doel is niet om het model van meer tokens te voorzien. Het doel is om te bepalen wat zichtbaar moet zijn voor de agent, wanneer en in welke vorm.

Teams die aanzienlijke verbeteringen zien, beschouwen context als een technisch oppervlak. Ze creëren tools voor het maken van snapshots, het comprimeren en het maken van bestandsversies werkgeheugen van de agent: wat blijft bestaan ​​tijdens de beurten, wat wordt weggegooid, wat wordt samengevat en wat is gekoppeld in plaats van inline. Ze ontwerpen overlegfasen in plaats van elicitatiesessies. Ze maken de specificatie tot een eersteklas artefact, iets dat kan worden beoordeeld, getest en eigendom is, en niet een voorbijgaande chatgeschiedenis. Deze verschuiving is in lijn met een bredere trend die sommige onderzoekers omschrijven als ‘specificaties die de nieuwe bron van waarheid worden’.

De workflow moet mee veranderen met de tools

Maar context alleen is niet genoeg. Bedrijven moeten de workflows rond deze agenten opnieuw ontwerpen. ALS McKinsey-rapport 2025 “Een jaar kunstmatige intelligentie” Houd er rekening mee dat productiviteitswinst niet voortkomt uit het in lagen aanbrengen van AI bovenop bestaande processen, maar uit het heroverwegen van het proces zelf. Wanneer teams simpelweg een agent in een ongewijzigde workflow laten vallen, creëren ze wrijving: ingenieurs besteden meer tijd aan het testen van door de AI geschreven code dan ze zouden hebben besteed aan het schrijven ervan. Agenten kunnen alleen maar versterken wat al gestructureerd is: modulaire, goed geteste codebases met duidelijke eigenschappen en documentatie. Zonder deze fundamenten wordt autonomie een chaos.

Veiligheid en governance vereisen ook een mentaliteitsverandering. Door AI gegenereerde code introduceert nieuwe vormen van risico: ongecontroleerde afhankelijkheden, subtiele licentieschendingen en ongedocumenteerde modules die aan peer review ontsnappen. Volwassen teams beginnen de activiteiten van agenten rechtstreeks in hun eigen team te integreren CI/CD-pijplijnenagenten behandelen als autonome bijdragers wier werk dezelfde statische analyses, auditlogboeken en goedkeuringspoorten moet doorstaan ​​als welke menselijke ontwikkelaar dan ook. GitHub-documentatie benadrukt dit traject, waarbij Copilot-agenten niet worden gepositioneerd als vervanging voor ingenieurs, maar als georkestreerde deelnemers aan veilige, controleerbare workflows. Het doel is niet om een ​​AI ‘alles te laten schrijven’, maar om ervoor te zorgen dat wanneer zij actie onderneemt, dit binnen gedefinieerde vangrails gebeurt.

Waar moeten zakelijke besluitvormers zich nu op concentreren?

Voor technische leiders begint de weg voorwaarts met voorbereiding in plaats van met hype. Monolieten met schaarse tests leveren zelden nettowinst op; Agents gedijen goed waar tests gezaghebbend zijn en iteratieve verfijning kunnen stimuleren. Dit is precies de cyclus Antropisch vereist encryptieagenten. Proefprojecten met een beperkte reikwijdte (testgeneratie, modernisering van bestaande systemen, geïsoleerde refactorings); behandel elke implementatie als een experiment met expliciete statistieken (ontsnappingspercentage van defecten, duur van de PR-cyclus, percentage mislukte wijzigingen, verbrande beveiligingsresultaten). Naarmate uw gebruik groeit, moet u agents behandelen als een data-infrastructuur: elk plan, context-snapshot, actielogboek en testrun zijn gegevens die samenkomen in een doorzoekbaar geheugen van technische intenties en blijvend concurrentievoordeel.

Achter de schermen is agentcodering niet zozeer een gereedschapsprobleem als wel een dataprobleem. Elke contextsnapshot, testiteratie en codebeoordeling wordt een vorm van gestructureerde gegevens die moeten worden opgeslagen, geïndexeerd en hergebruikt. Naarmate deze agenten zich steeds meer verspreiden, zullen bedrijven te maken krijgen met een geheel nieuwe laag gegevens: een laag die niet alleen vastlegt wat er is gebouwd, maar ook hoe daarover werd geredeneerd. Deze wijziging transformeert ontwerplogboeken in een kennisgrafiek van intentie, besluitvorming en validatie. In de loop van de tijd zullen organisaties die dit contextuele geheugen kunnen zoeken en reproduceren de organisaties overtreffen die code nog steeds als statische tekst behandelen.

Het komende jaar zal waarschijnlijk bepalen of agent-gebaseerde codering een hoeksteen van de bedrijfsontwikkeling wordt of een andere overdreven belofte. Het verschil zal neerkomen op context-engineering: hoe teams op intelligente wijze het informatiesubstraat ontwerpen waarop hun agenten vertrouwen. De winnaars zullen degenen zijn die autonomie niet als magie zien, maar als een verlengstuk van gedisciplineerd systeemontwerp: duidelijke workflows, meetbare feedback en rigoureus bestuur.

Tot slot

Platformen komen samen op het gebied van orkestratie en vangrails, en onderzoek blijft de contextcontrole op het moment van inferentie verbeteren. De winnaars van de komende 12 tot 24 maanden zullen niet de teams met het meest opvallende model zijn; zij zullen degenen zijn die de context als hulpmiddel ontwerpen en de workflow als product behandelen. Doe dit en de autonomie neemt toe. Sla het over en de beoordelingswachtrij zal dat doen.

Context + agent = hefboomwerking. Sla de eerste helft over en de rest valt uiteen.

Dhyey Mavani versnelt generatieve AI op LinkedIn.

Lees meer van onze gastschrijvers. Of overweeg om uw eigen bericht in te dienen! Zie de onze richtlijnen hier.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in