Home Nieuws ‘Dit zou je bang moeten maken’: de beveiligingsdirecteur van Meta Superintelligence verloor...

‘Dit zou je bang moeten maken’: de beveiligingsdirecteur van Meta Superintelligence verloor de controle over zijn AI-agent en verwijderde zijn e-mails

2
0
‘Dit zou je bang moeten maken’: de beveiligingsdirecteur van Meta Superintelligence verloor de controle over zijn AI-agent en verwijderde zijn e-mails

Zoals geïntegreerd NAAR DE in meer aspecten van het dagelijks leven voorkomt, vertrouwen leken op experts om ervoor te zorgen dat technologie veilig kan worden gebruikt. Maar de tegenslag van een Meta-medewerker met AI heeft gebruikers van sociale media bang gemaakt voor de toekomst van AI-uitlijning.

Summer Yue is directeur afstemming bij Meta Superintelligence Labs, de onderzoeks- en ontwikkelingsafdeling van het bedrijf op het gebied van kunstmatige intelligentie. Zijn LinkedIn-bio zegt dat ze “gepassioneerd is om ervoor te zorgen dat krachtige AI’s in lijn zijn met menselijke waarden en geleid worden door een diep begrip van de risico’s ervan.”

Als iemand AI onder controle kan houden, is het Yue, en toch postte hij op 22 februari over het verliezen van de controle over de AI op zijn computer.

In een post die sindsdien bijna negen miljoen views op X heeft opgeleverd, zegt Yue gedeelde schermafbeeldingen uit zijn berichten met de OpenClaw AI-agent. Nadat hij het had gebruikt om een ​​kleine dummy-inbox te organiseren, probeerde hij OpenClaw te vragen zijn echte e-mail te doorzoeken, maar het ging mis toen de agent alle berichten begon te verwijderen die ouder waren dan een week.

Yue schreef dat hij OpenClaw zag “speedrun door (zijn) inbox te verwijderen”, ook al had het hem instructies gestuurd, waaronder: “Doe het niet”, “STOP met niets doen” en “STOP OPENCLAW.”

“Ik kon het niet stoppen vanaf mijn telefoon. Ik moest naar mijn Mac mini rennen alsof ik een bom onschadelijk maakte”, voegde Yue eraan toe.

Nadat hij had voorkomen dat het zijn inbox volledig zou bombarderen, vroeg Yue aan OpenClaw of hij zich zijn instructies herinnerde om geen enkele actie uit te voeren zonder zijn goedkeuring.

‘Ja, dat weet ik nog’, antwoordde hij. ‘En ik heb het overtreden. Je hebt gelijk als je boos bent.’

OpenClaw, een open source AI-agent, is controversieel vanwege de verreikende toestemmingen die nodig zijn om te functioneren zoals bedoeld, inclusief toegang tot de e-mailaccounts van gebruikers, berichtenplatforms en andere privé- en potentieel gevoelige informatie.

Voeg dit toe aan het voorbeeld waarin Yue expliciet zijn instructies negeert, en sommige online waarnemers vrezen dat de tool een brug te ver is in termen van de macht van AI om de overhand te krijgen op mensen.

Yue beantwoordde vragen in de antwoorden op zijn bericht, waaronder of hij opzettelijk de grenzen van OpenClaw verlegde of dat hij gewoon een fout had gemaakt.

“Een beginnersfout, om eerlijk te zijn,” antwoordde ze. “Het blijkt dat uitlijningsonderzoekers niet immuun zijn voor verkeerde uitlijning. Ik werd overmoedig omdat deze workflow al weken aan mijn speelgoedinbox werkte. Echte inboxen hebben andere resultaten.”

De fout van Yue ging viraal, waarbij X-gebruikers verbaasd waren dat iemand die zo AI-vaardig was als Yue moeite had om een ​​AI-agent tegen te houden. Sommige posters zeiden dat het incident Meta’s oordeel over de veiligheid van kunstmatige intelligentie in twijfel trok.

Ondertussen dacht minstens één poster na over de grotere implicaties van het incident: “Het is een kwestie van tijd voordat deze mensen de AI smeken om geen kernwapens te lanceren”, grapte de gebruiker, “en dan is het laatste wat er staat: ‘Het spijt me. Je hebt gelijk als je boos bent.’

Meta reageerde niet Snel bedrijfverzoek om commentaar.



Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in