Home Nieuws Een Meta AI-beveiligingsonderzoeker zei dat een OpenClaw-agent door zijn inbox raasde

Een Meta AI-beveiligingsonderzoeker zei dat een OpenClaw-agent door zijn inbox raasde

1
0
Een Meta AI-beveiligingsonderzoeker zei dat een OpenClaw-agent door zijn inbox raasde

DE post X nu viraal van Summer Yue, beveiligingsonderzoeker bij Meta AI, lijkt in eerste instantie satire. Hij zei tegen zijn OpenClaw AI-agent dat hij zijn overvolle e-mailinbox moest controleren en moest voorstellen wat hij moest verwijderen of archiveren.

De officier bleef in paniek raken. Hij begon al zijn e-mails in een “speed run” te verwijderen, terwijl hij de commando’s van zijn telefoon negeerde die hem zeiden dat hij moest stoppen.

“Ik moest naar mijn Mac mini RENNEN alsof ik een bom onschadelijk wilde maken”, schreef hij, terwijl hij als ontvangen afbeeldingen van de genegeerde stopberichten plaatste.

De Mac Mini, een betaalbare Apple-computer die op een bureau staat en past in de palm van je handis tegenwoordig het voorkeursapparaat geworden om OpenClaw uit te voeren. (De Mini verkoopt ‘als warme broodjes’, zei een ‘verwarde’ Apple-medewerker blijkbaar.) de beroemde kunstmatige intelligentie-onderzoeker Andrej Karpathy toen hij er een kocht om een ​​alternatief voor OpenClaw uit te voeren genaamd NanoClaw.)

Open Klauw is natuurlijk de open source AI-agent die bekendheid verwierf dankzij Moltbook, een sociaal netwerk dat alleen uit AI bestaat. OpenClaw-agenten stonden centraal in dit alles aflevering nu op grote schaal ontkracht op Moltbook waar het erop leek dat AI’s tegen mensen samenzweerden.

Maar de missie van OpenClaw, volgens zijn GitHub-paginais niet gericht op sociale netwerken. Het wil een persoonlijke AI-assistent zijn die op uw apparaten werkt.

Het publiek in Silicon Valley is zo gecharmeerd geraakt van OpenClaw dat ‘klauw’ en ‘klauwen’ het symbool zijn geworden modewoorden naar keuze voor agenten die op persoonlijke hardware draaien. Andere soortgelijke middelen omvatten ZeroClaw, IJzerklauwEN Picoklauw. Het podcastteam van Y Combinator verscheen ook op die van hen meest recente aflevering gekleed in kreeftenkostuums.

Techcrunch-evenement

Boston, MA
|
9 juni 2026

Maar de post van Yue dient als waarschuwing. Zoals anderen op X hebben opgemerkt: als een AI-beveiligingsonderzoeker op dit probleem zou stuiten, welke hoop hebben gewone stervelingen dan?

‘Heb je opzettelijk zijn vangrails getest of heb je een beginnersfout gemaakt?’ vroeg een softwareontwikkelaar op X haar.

‘Een beginnersfout, om eerlijk te zijn,’ antwoordde hij. Ze had haar agent getest met een kleinere ‘speelgoed’-inbox, zoals zij het noemde, en die werkte goed met minder belangrijke e-mails. Hij had haar vertrouwen verdiend, dus overwoog hij haar op het echte werk te laten gaan.

Yue gelooft dat de grote hoeveelheid gegevens in zijn echte inbox “de verdichting teweegbracht”, schreef hij. Compactie vindt plaats wanneer het contextvenster (de huidige registratie van alles wat tijdens een sessie met de AI wordt gezegd en gedaan) te groot wordt, waardoor de agent gedwongen wordt het gesprek samen te vatten, te comprimeren en te beheren.

Op dat moment kan de AI instructies overslaan die de mens nogal belangrijk vindt.

In dit geval heeft hij misschien haar laatste bericht overgeslagen – toen ze hem zei niet te handelen – en teruggekeerd naar de instructies in de ‘speelgoed’-inbox.

Zoals vele anderen op onderstreepte X, instructies zijn niet te vertrouwen fungeren als veiligheidsbarrières. Modellen kunnen deze verkeerd begrijpen of negeren.

Verschillende mensen kwamen met suggesties, variërend van de exacte syntaxis die Yue zou moeten gebruiken om de agent te stoppen, tot verschillende methoden om ervoor te zorgen dat de vangrails beter worden nageleefd, zoals het schrijven van instructies in speciale bestanden of het gebruik van andere open source-tools.

In het belang van maximale transparantie kon TechCrunch niet onafhankelijk verifiëren wat er met de inbox van Yue was gebeurd. (Hij reageerde niet op ons verzoek om commentaar, hoewel hij reageerde op veel vragen en opmerkingen die op X waren geplaatst.)

Maar het maakt niet echt uit.

De kern van het verhaal is dat middelen die zich op kenniswerkers richten, in hun huidige ontwikkelingsstadium riskant zijn. Mensen die beweren ze met succes te gebruiken, bedenken methoden om zichzelf te beschermen.

Op een dag, misschien binnenkort (tegen 2027? 2028?), zijn ze misschien klaar voor wijdverbreid gebruik. God weet dat velen van ons hulp bij e-mail, boodschappenbestellingen en het plannen van tandartsafspraken op prijs zouden stellen. Maar die dag is nog niet gekomen.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in