Home Nieuws De nieuwe agentstructuur past zich aan aan door mensen ontworpen AI-systemen en...

De nieuwe agentstructuur past zich aan aan door mensen ontworpen AI-systemen en voegt geen gevolgtrekkingskosten toe voor de implementatie

3
0
De nieuwe agentstructuur past zich aan aan door mensen ontworpen AI-systemen en voegt geen gevolgtrekkingskosten toe voor de implementatie

Agents die op de huidige modellen zijn gebaseerd, breken vaak met eenvoudige wijzigingen (een nieuwe bibliotheek, een wijziging in de workflow) en hebben een menselijke ingenieur nodig om dit te repareren. Dit is een van de meest hardnekkige uitdagingen bij het implementeren van kunstmatige intelligentie voor ondernemingen: het creëren van agenten die zich kunnen aanpassen aan dynamische omgevingen zonder constante monitoring. Hoewel de huidige modellen krachtig zijn, zijn ze grotendeels statisch.

Om dit probleem aan te pakken hebben onderzoekers van de Universiteit van Californië, Santa Barbara, zich ontwikkeld Groep evoluerende agenten (GEA), een nieuw raamwerk waarmee groepen AI-agenten samen kunnen evolueren, ervaringen kunnen delen en hun innovaties kunnen hergebruiken om in de loop van de tijd autonoom te verbeteren.

Bij experimenten met complexe codeer- en software-engineeringtaken presteerde GEA aanzienlijk beter dan de bestaande raamwerken voor zelfverbetering. Misschien wel het meest opvallend voor zakelijke besluitvormers was dat het systeem autonoom agenten ontwikkelde die de prestaties van structuren die nauwgezet door menselijke experts waren ontworpen, evenaren of zelfs overtroffen.

De grenzen van de ‘lone wolf’-evolutie.

De meeste bestaande Agentische AI-systemen vertrouw op vaste architecturen ontworpen door ingenieurs. Deze systemen hebben vaak moeite om de capaciteitsbeperkingen te overwinnen die hun oorspronkelijke ontwerpen oplegden.

Om dit probleem op te lossen, hebben onderzoekers lang geprobeerd zelfontwikkelende agenten te creëren die hun code en structuur autonoom kunnen aanpassen om hun aanvankelijke beperkingen te overwinnen. Deze mogelijkheid is essentieel voor het beheren van open omgevingen waarin de agent voortdurend nieuwe oplossingen moet verkennen.

De huidige benaderingen van zelfontwikkeling vertonen echter een ernstige structurele tekortkoming. Zoals de onderzoekers in hun artikel opmerken, zijn de meeste systemen geïnspireerd door biologische evolutie en ontworpen rond ‘individueel gerichte’ processen. Deze methoden maken doorgaans gebruik van een boomgestructureerde aanpak: er wordt één enkele ‘ouder’-agent geselecteerd om nakomelingen te produceren, waardoor verschillende evolutionaire takken ontstaan ​​die strikt van elkaar geïsoleerd blijven.

Klassieke structuur van de zichzelf ontwikkelende agent (bron: arXiv)

Deze isolatie creëert een silo-effect. Een agent in de ene vertakking heeft geen toegang tot gegevens, tools of workflows die zijn ontdekt door een agent in een parallelle vertakking. Als een specifieke lijn niet wordt geselecteerd voor de volgende generatie, sterft elke waardevolle ontdekking die door die agent wordt gedaan, zoals een nieuw foutopsporingshulpmiddel of een efficiëntere testworkflow, daarmee.

In hun artikel betwijfelen de onderzoekers de noodzaak om zich aan deze biologische metafoor te houden. “AI-agentia zijn geen biologische individuen”, beweren ze. “Waarom zou hun evolutie beperkt blijven door biologische paradigma’s?”

De collectieve intelligentie van agenten in groepsevolutie

GEA verschuift het paradigma door een groep actoren, in plaats van een individu, te behandelen als de fundamentele eenheid van de evolutie.

Het proces begint met het selecteren van een groep masteragenten uit een bestaande repository. Om een ​​gezonde mix van stabiliteit en innovatie te garanderen, selecteert GEA deze agenten op basis van een gecombineerde score van prestaties (vaardigheid in het oplossen van taken) en nieuwheid (hoe verschillend hun capaciteiten zijn van die van anderen).

evolutionaire agent van de groep

Group Evolving Agent (GEA) (bron: arXiv)

In tegenstelling tot traditionele systemen waarbij een agent alleen leert van zijn directe ouder, creëert GEA een gedeelde pool van collectieve ervaringen. Deze pool bevat de evolutionaire sporen van alle leden van de kerngroep, inclusief codewijzigingen, succesvolle oplossingen voor taken en geschiedenis van het aanroepen van tools. Elke agent in de groep heeft toegang tot deze collectieve geschiedenis, waardoor ze kunnen leren van de ontdekkingen en fouten van hun collega’s.

Een ‘reflectiemodule’, aangedreven door een breed taalkundig model, analyseert deze collectieve geschiedenis om patronen op groepsniveau te identificeren. Als de ene agent bijvoorbeeld een krachtige foutopsporingstool ontdekt terwijl een andere agent een testworkflow verfijnt, extraheert het systeem beide informatie. Op basis van deze analyse genereert het systeem ‘evolutionaire richtlijnen’ op hoog niveau die de oprichting van de kindergroep begeleiden. Dit zorgt ervoor dat de volgende generatie de gecombineerde krachten van al haar ouders bezit, in plaats van alleen de eigenschappen van één enkele afstammingslijn.

GEA

Hoe GEA evolutionaire eigenschappen kiest en deelt (bron: arXiv)

Deze Hive Mind-aanpak werkt echter het beste als succes objectief is, zoals bij codeertaken. “Voor minder deterministische domeinen (bijvoorbeeld creatieve generatie) zijn de waarderingssignalen zwakker”, vertelden Zhaotian Weng en Xin Eric Wang, co-auteurs van het artikel, aan VentureBeat. “Het blind delen van resultaten en ervaringen kan ervaringen van lage kwaliteit introduceren die als ruis fungeren. Dit suggereert de behoefte aan sterkere mechanismen voor het filteren van ervaringen” voor subjectieve taken.

GEA in actie

De onderzoekers testten GEA aan de hand van de huidige zichzelf ontwikkelende state-of-the-art referentie, de De machine van Darwin Gödel (DGM), op twee strenge benchmarks. De resultaten lieten een enorme sprong in capaciteit zien zonder dat het aantal gebruikte middelen toenam.

Deze gezamenlijke aanpak maakt het systeem ook robuuster tegen storingen. In hun experimenten hebben de onderzoekers opzettelijk de agenten kapot gemaakt door handmatig bugs in hun implementaties in te voegen. GEA kon deze kritieke bugs in gemiddeld 1,4 iteraties oplossen, terwijl de basislijn vijf iteraties in beslag nam. Het systeem maakt effectief gebruik van ‘gezonde’ leden van de groep om gecompromitteerde leden te diagnosticeren en te patchen.

Op SWE-bench Verified, een benchmark die bestaat uit echte GitHub-problemen, inclusief bugs en functieverzoeken, behaalde GEA een succespercentage van 71,0%, vergeleken met de basislijn van 56,7%. Dit resulteert in een aanzienlijke toename van de productiviteit van autonome engineering, wat betekent dat agenten veel beter in staat zijn om software-onderhoud in de echte wereld te beheren. Op dezelfde manier scoorde GEA op Polyglot, dat het genereren van code in verschillende programmeertalen test, 88,3% ten opzichte van de basislijn van 68,3%, wat wijst op een hoog aanpassingsvermogen aan verschillende technologieën.

GEA versus DGM

GEA versus Darwin-Godel Machine (DGM) (bron: arXiv)

Voor R&D-teams van bedrijven is de belangrijkste bevinding dat GEA AI in staat stelt zichzelf net zo effectief te ontwerpen als menselijke ingenieurs. Op de SWE-bank komt het succespercentage van GEA van 71,0% feitelijk overeen met de prestaties van Open handenhet beste door mensen ontworpen open source-framework. Op Polyglot presteerde GEA aanzienlijk beter dan Aider, een populaire codeerassistent, die 52,0% scoorde. Dit suggereert dat organisaties uiteindelijk de afhankelijkheid van grote teams van tijdige ingenieurs om agentstructuren aan te passen kunnen verminderen, omdat agenten deze optimalisaties autonoom kunnen meta-leren.

Deze efficiëntie strekt zich uit tot kostenbeheersing. “GEA is expliciet een systeem in twee fasen: (1) de evolutie van agentia, en vervolgens (2) gevolgtrekking/distributie”, aldus de onderzoekers. “Na de evolutie zet je één enkele geëvolueerde agent in… zodat de kosten van zakelijke gevolgtrekkingen in wezen onveranderd blijven in vergelijking met een standaard opstelling met één agent.”

Het succes van GEA komt grotendeels voort uit haar vermogen om verbeteringen te consolideren. De onderzoekers volgden de specifieke innovaties die door de agenten tijdens het evolutionaire proces waren uitgevonden. In de basisbenadering verschenen waardevolle instrumenten vaak in geïsoleerde takken, maar slaagden zij er niet in zich te verspreiden omdat die specifieke lijnen eindigden. Bij GEA zorgde het gedeelde ervaringsmodel ervoor dat deze tools werden overgenomen door de best presterende agenten. GEA’s beste agent integreerde eigenschappen van 17 unieke voorouders (die 28% van de bevolking vertegenwoordigen), terwijl de beste basisagent eigenschappen van slechts 9 integreerde. In feite creëert GEA een “superwerknemer” die over de gecombineerde best practices van de hele groep beschikt.

“Een door GEA geïnspireerde workflow in de productie zou agenten in staat stellen eerst een aantal onafhankelijke oplossingen uit te proberen wanneer zich fouten voordoen”, legden de onderzoekers uit over dit zelfherstellende vermogen. “Een reflectieagent (meestal aangedreven door een robuust basismodel) kan vervolgens de resultaten samenvatten… en een uitgebreidere systeemupdate aansturen.”

Bovendien zijn de door GEA ontdekte verbeteringen niet gebonden aan een specifiek onderliggend model. Agenten die zijn geëvolueerd met behulp van één model, zoals Claude, behielden prestatieverbeteringen, zelfs wanneer de onderliggende engine werd vervangen door een andere familie modellen, zoals GPT-5.1 of GPT-o3-mini. Deze overdraagbaarheid geeft bedrijven de flexibiliteit om van sjabloonleverancier te wisselen zonder de aangepaste architectuuroptimalisaties te verliezen die hun agenten leren.

Voor sectoren met strenge compliance-eisen kan het idee om de code zelf aan te passen riskant lijken. Om dit aan te pakken, stellen de auteurs: “We verwachten dat bedrijfsimplementaties niet-evolutionaire vangrails omvatten, zoals sandbox-uitvoering, beleidsbeperkingen en verificatielagen.”

Hoewel de onderzoekers van plan zijn de officiële code binnenkort vrij te geven, kunnen ontwikkelaars al beginnen met het conceptueel implementeren van de GEA-architectuur op bestaande agentframeworks. Het systeem vereist drie belangrijke toevoegingen aan een standaard agentenstack: een ‘ervaringswinkel’ om evolutionaire sporen op te slaan, een ‘reflectiemodule’ om groepspatronen te analyseren, en een ‘updatemodule’ waarmee de agent zijn code kan aanpassen op basis van die inzichten.

Kijkend naar de toekomst zou het raamwerk de ontwikkeling van geavanceerde agenten kunnen democratiseren. “Eén veelbelovende richting is die van hybride evolutiepijplijnen,” aldus de onderzoekers, “waar kleinere modellen al vroeg onderzoek doen om verschillende ervaringen te verzamelen, en sterkere modellen later de evolutie aandrijven met behulp van die ervaringen.”

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in