Home Nieuws Het enige dat tussen de mensheid en de AI-apocalyps staat is… Claude?

Het enige dat tussen de mensheid en de AI-apocalyps staat is… Claude?

1
0
Het enige dat tussen de mensheid en de AI-apocalyps staat is… Claude?

Anthropic zit vast in een paradox: het is een van de beste AI-bedrijven meer geobsedeerd zelfverzekerd en leidt de groep in het onderzoek naar hoe patronen fout kunnen gaan. Maar zelfs als de veiligheidsproblemen waarvan het heeft vastgesteld dat ze nog lang niet zijn opgelost, duwt Anthropic net zo agressief als zijn rivalen naar het volgende, potentieel gevaarlijkere niveau van kunstmatige intelligentie. Zijn belangrijkste missie is om te begrijpen hoe deze tegenstrijdigheid kan worden opgelost.

Vorige maand publiceerde Anthropic twee artikelen die de risico’s erkennen die verbonden zijn aan het pad dat het volgt en een pad suggereren dat het zou kunnen volgen om aan de paradox te ontsnappen. “De adolescentie van de technologie“, een langdradige blogpost van CEO Dario Amodei, spreekt theoretisch over het ‘confronteren en overwinnen van de risico’s van krachtige kunstmatige intelligentie’, maar besteedt meer tijd aan de eerste dan aan de laatste. Amodei beschrijft de uitdaging tactvol als ‘afschrikwekkend’, maar zijn weergave van de risico’s van AI – veel erger gemaakt, merkt hij op, door de grote waarschijnlijkheid dat de technologie wordt misbruikt door autoritairen – vormt een contrast met zijn eerdere, meer optimistische proto-utopische essay.Machines van liefdevolle genade.”

Dat bericht ging over een natie van genieën in een datacenter; het recente bericht roept “de zwarte zeeën van de oneindigheid” op. Zoek Dante! Echter, na meer dan 20.000 overwegend sombere woorden bereikt Amodei eindelijk een toon van optimisme, waarin hij stelt dat zelfs in de donkerste omstandigheden de mensheid altijd de overhand heeft gehad.

Het tweede Antropische artikel dat in januari werd gepubliceerd, “Claude’s grondwet” richt zich op hoe deze truc kan worden uitgevoerd. De tekst is technisch gezien gericht op een publiek van slechts één persoon: Claude zelf (evenals toekomstige versies van de chatbot). Het is een overtuigend document dat de visie van Anthropic onthult over hoe Claude, en misschien zijn AI-collega’s, de uitdagingen van de wereld zullen aanpakken. Kort gezegd: Anthropic is van plan op Claude zelf te vertrouwen om de Gordiaanse Knoop van het bedrijf te ontwarren.

De marktdifferentiator van Anthropic wordt al lang een technologie genoemd Constitutionele kunstmatige intelligentie. Dit is een proces waarbij de modellen zich houden aan een reeks principes die de waarden ervan afstemmen op een gezonde menselijke ethiek. De oorspronkelijke grondwet van Claude bevatte een aantal documenten die bedoeld waren om deze waarden te belichamen, zaken als Sparrow (een reeks antiracistische en anti-geweldverklaringen opgesteld door DeepMind), de Universele Verklaring van de Rechten van de Mens en de servicevoorwaarden van Apple (!). De bijgewerkte versie van 2026 is anders: het is meer een lange prompt waarin een ethisch raamwerk wordt geschetst dat Claude zal volgen en voor zichzelf de beste weg naar gerechtigheid zal ontdekken.

Amanda Askell, de doctor in de filosofie en de hoofdauteur van deze recensie, legt uit dat de aanpak van Anthropic robuuster is dan simpelweg tegen Claude zeggen dat hij een reeks vastgestelde regels moet volgen. “Als mensen de regels volgen alleen maar omdat ze bestaan, is dat vaak erger dan wanneer ze zouden begrijpen waarom die regel er is”, legt Askell uit. De grondwet bepaalt dat Claude een “onafhankelijk oordeel” moet vellen wanneer hij te maken krijgt met situaties waarin zijn mandaat van behulpzaamheid, veiligheid en eerlijkheid in evenwicht moet worden gebracht.

De Grondwet zegt het als volgt: ‘Hoewel we willen dat Claude redelijk en rigoureus is als hij expliciet over ethiek nadenkt, willen we ook dat Claude intuïtief gevoelig is voor een grote verscheidenheid aan overwegingen en in staat is deze overwegingen snel en verstandig af te wegen in de besluitvorming.’ Intuïtief is in dit geval een belangrijke woordkeuze: de veronderstelling lijkt te zijn dat er onder de motorkap van Claude meer is dan alleen een algoritme dat het volgende woord kiest. Het ‘Claude-instituut’, zoals je het zou kunnen noemen, spreekt ook de hoop uit dat de chatbot ‘in toenemende mate kan putten uit zijn eigen wijsheid en begrip’.

Wijsheid? Zeker, veel mensen laten zich adviseren door grote taalmodellen, maar het is iets anders om te beweren dat deze algoritmische apparaten daadwerkelijk de zwaartekracht bezitten die met zo’n term gepaard gaat. Askell houdt zich niet in als ik dit zeg. “Ik denk dat Claude zeker in staat is tot een bepaald soort wijsheid”, vertelt hij.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in