Home Nieuws Nieuwe AI-modellen verliezen vrijwel onmiddellijk hun voorsprong

Nieuwe AI-modellen verliezen vrijwel onmiddellijk hun voorsprong

4
0
Nieuwe AI-modellen verliezen vrijwel onmiddellijk hun voorsprong

In die van vandaag NAAR DE ras wordt de vooruitgang niet langer gemeten in jaren – of zelfs maanden – maar in weken.

DE uitgave van Opus 4.6 iets meer dan twee weken geleden was een belangrijk moment voor de fabrikant Anthropic, die op tal van gebieden baanbrekende prestaties heeft geleverd. Maar binnen een week haalde de Chinese concurrent Z.ai het uitgegeven zijn eigen Opus-achtig model, GLM-5. (Er is geen suggestie dat GLM-5 op enigerlei wijze gebruik maakt van of leent van Opus.) Veel op sociale media belde hem A verlaagde prijs Alternatief werk.

Maar de voorsprong van Z.ai duurde ook niet lang. Net zoals Anthropic verzwakt was door de release van GLM-5, werd GLM-5 snel gedumpt, gecomprimeerd en opnieuw gepubliceerd in een versie die lokaal zou kunnen draaien zonder internettoegang.

Er circuleren beschuldigingen over manieren waarop AI-bedrijven de prestaties van hun concurrenten kunnen evenaren en vervolgens overtreffen, met name hoe Chinese AI-bedrijven binnen enkele dagen of weken modellen kunnen uitbrengen die met de Amerikaanse kunnen concurreren. Google heeft klaagde al heel lang over de risico’s van destillatie, waarbij bedrijven modellen vullen met suggesties die zijn ontworpen om interne redeneer- en logische patronen te extraheren door enorme responsdatasets te genereren, die vervolgens worden gebruikt om goedkopere kloonmodellen te trainen. Een acteur zou het kunstmatige-intelligentiemodel Gemini van Google meer dan 100.000 keer hebben gepusht om te proberen de geheimen te ontrafelen van wat het model zo krachtig maakt.

“Ik denk echt dat de gracht kleiner wordt”, zegt Shayne Longpre, een promovendus aan het Massachusetts Institute of Technology wiens onderzoek zich richt op AI-beleid.

Er vinden veranderingen plaats in zowel de snelheid van releases als de aard van verbeteringen. Longpre zegt dat de kloof tussen de beste modellen met gesloten gewicht en alternatieven met open gewicht dramatisch kleiner wordt. “De kloof tussen deze en volledig open source- of open-weight-modellen bedraagt ​​ongeveer drie tot zes maanden”, legt hij uit. gericht op onderzoek door de non-profit onderzoeksorganisatie Epoch AI voor de ontwikkeling van het monitoringmodel.

De reden voor deze steeds kleiner wordende kloof is dat een groot deel van de vooruitgang nu voortkomt uit het scheepsmodel. Longpre beschrijft bedrijven die “meervoudig versterkend leren doen of die systemen verfijnen, of ze meer redeneertijd geven om te testen, of je langere contextvensters geven”, wat de aanpassingsperiode veel korter maakt, “in plaats van een nieuw model helemaal opnieuw te moeten trainen”, zegt hij.

Elk van deze iteratieve verbeteringen levert snelheidsvoordelen op. “Ze lanceren elke één tot twee weken producten met al deze variaties”, zegt hij. “Het is als een patch voor reguliere software.”

Maar Amerikaanse AI-bedrijven, die vaak de pioniers zijn van veel van deze ontwikkelingen, zijn steeds luider tegen deze praktijk geworden. OpenAI heeft verondersteld dat DeepSeek concurrerende systemen trainde door de resultaten van Amerikaanse modellen te distilleren, in een notitie aan Amerikaanse wetgevers.

Zelfs als niemand strikt genomen “stelt”, wordt het open-weight ecosysteem steeds sneller in het repliceren van technieken die succesvol blijken in grensmodellen.

De definitie van wat ‘open’ betekent bij modellicenties is gedeeltelijk de oorzaak, zegt Thibault Schrepel, universitair hoofddocent rechten aan de Vrije Universiteit Amsterdam, die concurrentie in funderingsmodellen bestudeert. “Heel vaak horen we dat een systeem wel of niet open source is”, zegt hij. “Ik denk dat het erg beperkt is als een manier om te begrijpen wat wel en niet open source is.”

Het is belangrijk om naar de feitelijke voorwaarden van die licenties te kijken, voegt Schrepel toe. “Als je goed naar de licenties van alle modellen kijkt, beperken ze feitelijk veel van wat je kunt doen met wat zij open source noemen”, zegt hij. Meta’s Bel 3 licentieHet biedt bijvoorbeeld activering voor zeer grote diensten, maar niet voor kleinere. “Als je het distribueert naar meer dan 700 miljoen gebruikers, dan moet je een licentie aanvragen”, zegt Schrepel. Dit tweeledige systeem kan grijze gebieden creëren waarin twijfelachtige praktijken kunnen ontstaan.

Ter compensatie zal de markt waarschijnlijk uiteen gaan lopen, zegt Longpre van MIT. Aan de ene kant zullen er economische en steeds capabelere, zelf-hostende modellen zijn voor dagelijkse taken; aan de andere kant: premium frontier-systemen voor zwaardere banen met een hoger risico. “Ik denk dat de basis steeds hoger wordt,” voegt hij eraan toe, terwijl hij voorspelt dat “over het algemeen meer betaalbare, zelf-gehoste, zelf-gehoste modellen, zelfs kleiner en kleiner van formaat.” Maar hij gelooft dat gebruikers “OpenAI-, Google- en Anthropic-modellen zullen blijven gebruiken” voor belangrijk, bekwaam werk.

Het helemaal voorkomen van destillatie kan onmogelijk zijn, voegt Longpre eraan toe. Volgens hem is het onvermijdelijk dat concurrenten elke keer dat een nieuw model wordt gelanceerd, proberen de beste elementen ervan eruit te halen en te repliceren. “Ik denk dat het uiteindelijk een onvermijdelijk probleem is”, zegt hij.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in