Home Nieuws OpenAI zou deze maand GPT-5.1 uitbrengen. Verwacht minder hallucinaties, beter en creatiever...

OpenAI zou deze maand GPT-5.1 uitbrengen. Verwacht minder hallucinaties, beter en creatiever schrijven en gemenere stukken

9
0

OpenAI waarnemers hebben de afgelopen week iets merkwaardigs opgemerkt.

Verwijzingen naar GPT-5.1 gaan door weergegeven in de OpenAI-codebaseen een ‘verborgen’ model, met de codenaam Polaris Alpha, waarvan algemeen wordt aangenomen dat het van OpenAI komt verscheen willekeurig in OpenRoutereen platform dat NAAR DE nerds gebruiken om nieuwe systemen te testen.

Er is nog niets officieel. Maar dit alles suggereert dat OpenAI zich stilletjes voorbereidt op het uitbrengen van een nieuwe versie van hun GPT-5-model. Bronnen uit de industrie ze wijzen op een mogelijke releasedatum al op 24 november.

Als GPT-5.1 echt bestaat, welke nieuwe functies zal het model dan hebben?

Als voormalig OpenAI-bètatester en iemand die elke maand miljoenen GPT-5-tokens verbrandt, is dit wat ik verwacht.

Een groter contextvenster (maar nog steeds niet groot genoeg)

Een model voor kunstmatige intelligentie contextvenster het is de hoeveelheid gegevens (gemeten in tokens, die in feite stukjes woord zijn) die het in één keer kan verwerken.

Zoals de naam al doet vermoeden, betekent een groter contextvenster dat een model meer context en externe informatie in overweging kan nemen bij het verwerken van een bepaald verzoek. Meestal resulteert dit in een beter resultaat.

Ik sprak onlangs bijvoorbeeld met een kunstenaar die Google Gemini elke keer dat hij met hem chat een document van 300 pagina’s overhandigt. Het document bevat fragmenten uit zijn persoonlijke dagboek, volledige kopieën van de scenario’s die hij schreef en nog veel meer.

Dankzij deze ongelooflijk grote hoeveelheid context kan het model hem veel betere en persoonlijkere antwoorden geven dan wanneer hij er eenvoudigweg mee zou communiceren zoals de gemiddelde gebruiker.

Dit werkt grotendeels omdat Gemini een Contextvenster van 1 miljoen tokens. GPT-5 is daarentegen relatief slecht slechts 196.000 tokens in ChatGPT (uitgebreid naar 400.000 tokens bij gebruik door ontwikkelaars via de API van het bedrijf).

Dat kleinere contextvenster brengt GPT-5 en ChatGPT in een ernstig nadeel. Als je de sjabloon bijvoorbeeld wilt gebruiken om een ​​boek te bewerken of een grote codebase te verbeteren, zul je snel zonder tokens komen te zitten.

Wanneer OpenAI GPT-5.1 uitbrengt, geef de bronnen aan die zal worden geleverd met een contextvenster van 256.000 tokens bij gebruik via de ChatGPT-interface, en misschien het dubbele in de API.

Het is zeker beter dan de GPT-5 van vandaag. Maar het is nog steeds veel inferieur aan Gemini, vooral zoals Google bereidt zich voor om zijn eigen updates uit te voeren.

OpenAI kan op het laatste moment een verrassende upgrade uitvoeren naar 1 miljoen tokens. Maar als het contextvenster van 256.000 tokens behouden blijft, kun je veel klachten verwachten van de ontwikkelaarsgemeenschap over waarom het venster nog steeds niet groot genoeg is.

Nog minder hallucinaties

OpenAI GPT-5-model het schiet in veel opzichten tekort. Maar één ding waar hij heel goed in is, is het geven van nauwkeurige, grotendeels hallucinatievrije antwoorden.

Ik gebruik vaak OpenAI-modellen om onderzoek uit te voeren. Bij oudere modellen, zoals de GPT-4o, ontdekte ik dat ik alles wat het model produceerde zorgvuldig moest controleren om er zeker van te zijn dat het geen nieuwe softwaretool in gedachten had die niet echt bestaat, of tegen me loog over een groot aantal andere cruciale kleine dingen.

Met GPT-5 merk ik dat ik dit veel minder hoef te doen. Het model is niet perfect. Maar OpenAI heeft het probleem van wilde hallucinaties grotendeels opgelost.

Volgens de bedrijfsgegevensGPT-5 hallucineert slechts 26% van de tijd bij het oplossen van een complex benchmarkprobleem, tegenover 75% van de tijd bij oudere modellen. Bij normaal gebruik vertaalt dit zich in een veel lager aantal hallucinaties bij eenvoudigere, alledaagse zoekopdrachten die niet zijn ontworpen om het model te laten struikelen.

Verwacht met GPT-5.1 dat OpenAI zonder hallucinaties zijn nieuwe richting zal verdubbelen. Het bijgewerkte model zal waarschijnlijk nog beter fouten vermijden.

Er zijn echter kosten verbonden. Modellen met minder hallucinaties hebben de neiging minder risico’s te nemen en kunnen daarom minder creatief overkomen dan ongedwongen, met hallucinaties beladen modellen.

OpenAI zal waarschijnlijk proberen de link tussen precisie en creativiteit zorgvuldig te onderzoeken met GPT-5.1. Maar er is geen garantie dat ze zullen slagen.

Beter en creatiever schrijven

Op dezelfde manier merkten gebruikers, toen OpenAI zijn GPT-5-model uitbracht, onmiddellijk dat het saai, levenloos proza ​​produceerde.

Destijds voorspelde ik dat OpenAI dat in wezen wel had gedaan gegeven het model een “emotionele lobotomie”, het doden van zijn emotionele intelligentie om de zorgwekkende neiging van het model om gebruikers af te wijzen te beteugelen psychotische spiralen.

Het bleek dat ik gelijk had. In een bericht over X vorige maandSam Altman gaf toe: “We hebben ChatGPT behoorlijk restrictief gemaakt om ervoor te zorgen dat we alert zijn op geestelijke gezondheidsproblemen.”

Maar Altman zei ook in de post: “nu we ernstige geestelijke gezondheidsproblemen hebben kunnen verzachten en over nieuwe hulpmiddelen beschikken, zullen we in de meeste gevallen de beperkingen veilig kunnen versoepelen.”

Dit proces begon met de introductie van nieuwe, emotioneel intelligentere persoonlijkheden in het bestaande GPT-5-model. Maar het zal waarschijnlijk doorgaan en intensiveren met GPT-5.1.

Ik verwacht dat het nieuwe model de algehele intelligentie en nauwkeurigheid van de GPT-5 zal hebben, maar met een persoonlijkheid die past bij de emotioneel diepe GPT-4o.

Dit zal waarschijnlijk gepaard gaan met veel sterkere waarborgen om ervoor te zorgen dat 5.1 gesprekken worden vermeden die iemand die in een geestelijke gezondheidscrisis verkeert, zouden kunnen kwetsen.

Hopelijk kan het bedrijf met GPT-5.1 kwetsbare gebruikers beschermen zonder de hersenen van de bot voor alle anderen te beschadigen.

Slechte stukken

Als je preuts bent over NSFW-dingen, bedek dan misschien je oren voor dit deel.

In hetzelfde X-bericht liet Altman op slimme wijze een zin vallen die het internet in rep en roer bracht: “Naarmate we leeftijdsbeperkingen vollediger implementeren en als onderdeel van ons principe om ‘volwassen gebruikers als volwassenen te behandelen’, zullen we nog meer toestaan, zoals geverifieerde erotica voor volwassenen.”

Het idee dat Amerika’s toonaangevende AI-bedrijf massa’s computergegenereerde erotische inhoud produceert, heeft al geleid tot koortsachtig commentaar van bronnen die zo uiteenlopend zijn als politici, Christelijke leiders, technologiejournalistenen (te oordelen naar het aantal stemmen), een groot deel van Reddit.

Van hun kant lijkt OpenAI echter behoorlijk toegewijd om deze belofte waar te maken. In een berekening die zeker zinvol is in de vreemde techno-libertaire kringen van de AI-wereld, is de vraag nauw verbonden met persoonlijke vrijheid en autonomie.

In een recent artikel Met betrekking tot de toekomst van kunstmatige intelligentie herhaalde OpenAI opnieuw: “Wij geloven dat volwassenen kunstmatige intelligentie op hun eigen voorwaarden moeten kunnen gebruiken, binnen brede grenzen die door de samenleving worden gedefinieerd”, waarbij volledige toegang tot kunstmatige intelligentie “op één lijn wordt gesteld met elektriciteit, schoon water of voedsel.”

Dit alles wil zeggen dat met de release van GPT-5.1 (of misschien kort na de release, zodat de onvermijdelijke media-razernij de minder interessante aspecten van het nieuwe model niet verdoezelt), de vangrails rond de slechte dingen van ChatGPT vrijwel zeker zullen verdwijnen.

Diepere gedachte

Naast het doden van de emotionele intelligentie van GPT-5, heeft OpenAI nog een misstap gemaakt door GPT-5 vrij te geven.

Het bedrijf probeerde alle zoekopdrachten binnen één enkel model te verenigen, waarbij ChatGPT zelf kon kiezen of het een eenvoudigere en minder veeleisende versie van GPT-5 wilde gebruiken of een langzamere en zwaardere versie.

Het idee was nobel: er is geen reden om een ​​ongelooflijk krachtige, langzame en arbeidsintensieve LLM te gebruiken om een ​​vraag te beantwoorden als: “Is tahini nog steeds goed na een maand in de koelkast?”

Maar in de praktijk de functie was een mislukking. ChatGPT was niet effectief in het bepalen hoeveel moeite het kostte om een ​​bepaalde vraag te beantwoorden, wat betekende dat mensen die complexe vragen stelden vaak werden doorverwezen naar een goedkoop, ondermaats model dat vreselijke resultaten opleverde.

OpenAI loste het probleem in ChatGPT op met een kludge-gebruikersinterface. Maar met GPT-5.1 zijn er vroege aanwijzingen dat OpenAI zijn model opnieuw zal verdelen in Instant- en Thinking-versies.

De eerste zal waarschijnlijk veel sneller reageren op eenvoudige vragen dan GPT-5, terwijl de laatste langer zal duren, meer tokens zal kauwen en betere resultaten zal opleveren bij complexe taken.

Het blijkt dat de gebruiker opnieuw expliciet kan kiezen tussen de twee modellen. Dit zou snellere resultaten moeten opleveren wanneer een zoekopdracht heel eenvoudig is en een beter vermogen om ingewikkelde problemen op te lossen.

OpenAI heeft genoemd dat zijn toekomstige modellen volgend jaar “zeer kleine ontdekkingen zullen kunnen doen” op gebieden als wetenschap en geneeskunde, terwijl “systemen die in staat zijn om meer significante ontdekkingen te doen” al in 2028 zullen arriveren. GPT-5.1 zal waarschijnlijk een eerste stap op dit pad zijn.

Een poging om de koers te corrigeren

Totdat OpenAI GPT-5.1 formeel vrijgeeft in een van zijn wankele livestreams, blijft dit allemaal speculatief. Maar gezien mijn geschiedenis met OpenAI, die teruggaat tot de hoogtijdagen van GPT-3, zijn dit enkele veranderingen die ik verwacht wanneer het 5.1-model live gaat.

Over het geheel genomen lijkt GPT-5.1 een poging om veel van de flagrante problemen van GPT-5 op te lossen en tegelijkertijd de meer vrijheidsgerichte, precisiegerichte benadering van OpenAI te verdubbelen.

Het nieuwe model zal waarschijnlijk beter kunnen denken, (ahem) “flirten”, schrijven en communiceren dan zijn voorgangers.

Als het deze dingen beter kan dan een groeiende stal van concurrerende modellen van Google, Anthropic en een groot aantal Chinese kunstmatige intelligentielaboratorianiemand weet het echter.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in