Home Nieuws ‘Dit zou je bang moeten maken’: de beveiligingsdirecteur van Meta Superintelligence verloor...

‘Dit zou je bang moeten maken’: de beveiligingsdirecteur van Meta Superintelligence verloor de controle over zijn AI-agent en verwijderde zijn e-mails

Door

25 februari 2026

Zoals geïntegreerd NAAR DE in meer aspecten van het dagelijks leven voorkomt, vertrouwen leken op experts om ervoor te zorgen dat technologie veilig kan worden gebruikt. Maar de tegenslag van een Meta-medewerker met AI heeft gebruikers van sociale media bang gemaakt voor de toekomst van AI-uitlijning.

Summer Yue is directeur afstemming bij Meta Superintelligence Labs, de onderzoeks- en ontwikkelingsafdeling van het bedrijf op het gebied van kunstmatige intelligentie. Zijn LinkedIn-bio zegt dat ze “gepassioneerd is om ervoor te zorgen dat krachtige AI’s in lijn zijn met menselijke waarden en geleid worden door een diep begrip van de risico’s ervan.”

Als iemand AI onder controle kan houden, is het Yue, en toch postte hij op 22 februari over het verliezen van de controle over de AI op zijn computer.

In een post die sindsdien bijna negen miljoen views op X heeft opgeleverd, zegt Yue gedeelde schermafbeeldingen uit zijn berichten met de OpenClaw AI-agent. Nadat hij het had gebruikt om een kleine dummy-inbox te organiseren, probeerde hij OpenClaw te vragen zijn echte e-mail te doorzoeken, maar het ging mis toen de agent alle berichten begon te verwijderen die ouder waren dan een week.

Yue schreef dat hij OpenClaw zag “speedrun door (zijn) inbox te verwijderen”, ook al had het hem instructies gestuurd, waaronder: “Doe het niet”, “STOP met niets doen” en “STOP OPENCLAW.”

“Ik kon het niet stoppen vanaf mijn telefoon. Ik moest naar mijn Mac mini rennen alsof ik een bom onschadelijk maakte”, voegde Yue eraan toe.

Nadat hij had voorkomen dat het zijn inbox volledig zou bombarderen, vroeg Yue aan OpenClaw of hij zich zijn instructies herinnerde om geen enkele actie uit te voeren zonder zijn goedkeuring.

‘Ja, dat weet ik nog’, antwoordde hij. ‘En ik heb het overtreden. Je hebt gelijk als je boos bent.’

Niets vernedert je liever dan tegen je OpenClaw te zeggen “bevestig voordat je handelt” en te zien hoe hij snel je inbox leegmaakt. Ik kon het niet stoppen vanaf mijn telefoon. Ik moest naar mijn Mac mini RENNEN alsof ik een bom onschadelijk maakte. pic.twitter.com/XAxyRwPJ5R

— Zomer Yue (@summeryue0) 23 februari 2026

OpenClaw, een open source AI-agent, is controversieel vanwege de verreikende toestemmingen die nodig zijn om te functioneren zoals bedoeld, inclusief toegang tot de e-mailaccounts van gebruikers, berichtenplatforms en andere privé- en potentieel gevoelige informatie.

Voeg dit toe aan het voorbeeld waarin Yue expliciet zijn instructies negeert, en sommige online waarnemers vrezen dat de tool een brug te ver is in termen van de macht van AI om de overhand te krijgen op mensen.

Yue beantwoordde vragen in de antwoorden op zijn bericht, waaronder of hij opzettelijk de grenzen van OpenClaw verlegde of dat hij gewoon een fout had gemaakt.

“Een beginnersfout, om eerlijk te zijn,” antwoordde ze. “Het blijkt dat uitlijningsonderzoekers niet immuun zijn voor verkeerde uitlijning. Ik werd overmoedig omdat deze workflow al weken aan mijn speelgoedinbox werkte. Echte inboxen hebben andere resultaten.”

De fout van Yue ging viraal, waarbij X-gebruikers verbaasd waren dat iemand die zo AI-vaardig was als Yue moeite had om een AI-agent tegen te houden. Sommige posters zeiden dat het incident Meta’s oordeel over de veiligheid van kunstmatige intelligentie in twijfel trok.

Ondertussen dacht minstens één poster na over de grotere implicaties van het incident: “Het is een kwestie van tijd voordat deze mensen de AI smeken om geen kernwapens te lanceren”, grapte de gebruiker, “en dan is het laatste wat er staat: ‘Het spijt me. Je hebt gelijk als je boos bent.’

dit zou je bang moeten maken.
Meta’s directeur Beveiliging en Uitlijning heeft Clawdbot volledige toegang tot zijn computer gegeven.
wat is meta aan het doen??? https://t.co/lAZFR9f1PB pic.twitter.com/XnMyMHSn5H

— Ben (@benhylak) 23 februari 2026

Enigszins zorgwekkend is het feit dat een persoon wiens taak het is om AI op één lijn te brengen, verrast is als een AI de verbale instructies niet precies opvolgt https://t.co/VNl0oq3Ys4

— Brooks Otterlake (@i_zzzzzz) 23 februari 2026

Ik maak me zorgen als ik zie dat een van de mensen die belast is met het opbouwen van een ‘veilige superintelligentie’ in paniek raakt terwijl de AI al zijn e-mails verwijdert. Het is slechts een kwestie van tijd voordat deze mensen de AI smeken om geen kernwapens te lanceren en dan zal het laatste wat ze zeggen zijn: “Het spijt me. Je hebt gelijk als je boos bent.” https://t.co/2235MH3K76

— Nathan J. Robinson (@NathanJRobinson) 23 februari 2026

Meta reageerde niet Snel bedrijfverzoek om commentaar.

Nieuwsbron

‘Dit zou je bang moeten maken’: de beveiligingsdirecteur van Meta Superintelligence verloor de controle over zijn AI-agent en verwijderde zijn e-mails

LAAT EEN REACTIE ACHTER Annuleer reactie

EDITOR PICKS

“Onze dochter verdween twintig jaar geleden, maar kunstmatige intelligentie en een op de camera...

Het debat over Carlsons interview benadrukt de interne conservatieve spanningen met betrekking tot nationalisme

Walton Goggins wist welk moment uit Fallout seizoen 2 fans van The Ghoul leuk...

Trump spreekt in Davos terwijl tariefbedreigingen centraal staan in Groenland