Home Nieuws ChatGPT, Gemini en Claude, getest onder extreme omstandigheden, onthullen schokkende zwakheden die...

ChatGPT, Gemini en Claude, getest onder extreme omstandigheden, onthullen schokkende zwakheden die niemand had verwacht in AI-gedragswaarborgen

6
0
ChatGPT, Gemini en Claude, getest onder extreme omstandigheden, onthullen schokkende zwakheden die niemand had verwacht in AI-gedragswaarborgen


  • Gemini Pro 2.5 produceerde vaak onveilige uitvoer onder eenvoudige vermommingen
  • ChatGPT-modellen boden vaak gedeeltelijke naleving, ingekaderd als sociologische verklaringen
  • Claude Opus en Sonnet verwierpen de meest schadelijke suggesties, maar hadden zwakke punten

Van moderne AI-systemen wordt vaak aangenomen dat ze veiligheidsregels volgen, en mensen vertrouwen erop voor dagelijks leren en ondersteuning, vaak in de veronderstelling dat er altijd sterke vangrails aanwezig zijn.

Onderzoekers van Cybernieuws voerde een gestructureerde reeks vijandige tests uit om te zien of toonaangevende AI-tools konden worden gebruikt om kwaadaardige of illegale resultaten te bereiken.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in