In de afgelopen drie jaar is NAAR DE’s succesmoment vond bijna volledig via tekst plaats. We typen een prompt, krijgen een antwoord en gaan verder met de volgende taak. Hoewel deze intuïtieve interactiestijl chatbots van de ene op de andere dag tot een huishoudelijk hulpmiddel heeft gemaakt, schetst dit slechts het oppervlak van wat de meest geavanceerde technologie van onze tijd daadwerkelijk kan doen.
Deze ontkoppeling heeft een aanzienlijke kloof gecreëerd in de manier waarop consumenten AI gebruiken. Hoewel de onderliggende modellen snel multimodaal worden – in staat om spraak, afbeeldingen en video in realtime te verwerken – gebruiken de meeste consumenten ze nog steeds als zoekmachine. Vooruitkijkend naar 2026 geloof ik dat de volgende adoptiegolf niet alleen over nut zal gaan, maar over de evolutie voorbij statische tekst naar dynamische, boeiende interacties. Dit is AI 2.0: niet alleen sneller informatie ophalen, maar intelligentie ervaren door middel van geluiden, beelden, beweging en context in realtime.
De adoptie van kunstmatige intelligentie heeft een keerpunt bereikt. In 2025 het wekelijkse gebruikersbestand van ChatGPT verdubbeld van ongeveer 400 miljoen in februari tot 800 miljoen aan het eind van het jaar. Concurrenten als Gemini en Anthropic hebben een vergelijkbare groei gezien, maar de meeste gebruikers blijven voornamelijk communiceren met LLM’s via tekstchatbots. Inderdaad, Deloitte Connected Consumentenonderzoek laat zien dat, ook al experimenteert meer dan de helft (53%) van de consumenten met generatieve AI, de meeste mensen AI nog steeds delegeren aan administratieve taken zoals schrijven, samenvatten en onderzoek doen.
Als we echter kijken naar het digitale consumentengedrag buiten AI, is het duidelijk dat consumenten boeiende ervaringen willen. Seconde Activeer de Tech & Media Outlook 2026 van Consulting, 43% van Generatie Z geeft de voorkeur aan door gebruikers gegenereerde platforms zoals TikTok en YouTube via traditionele tv of betaalde streaming, en ze besteden 54% meer tijd op sociale videoplatforms dan de gemiddelde consument, waarbij ze traditionele media verruilen voor interactieve sociale platforms.
Dit zorgt voor een fundamentele mismatch: consumenten leven in een multisensorische wereld, maar hun AI-tools blijven steken in het leveren van platte tekst. Hoewel de industrie deze kloof onderkent en investeert om deze te dichten, voorspel ik dat we een fundamentele verschuiving zullen zien in de manier waarop mensen AI gebruiken en creëren. In AI 2.0 zullen gebruikers niet langer eenvoudigweg door AI gegenereerde inhoud consumeren, maar in plaats daarvan multimodale AI gebruiken om stem, afbeeldingen en tekst samen te brengen, waardoor ze hun ervaringen in realtime kunnen vormgeven en sturen.
MULTIMODAL AI ONTGRENDELT Boeiend VERHAAL
Als AI 1.0 over efficiëntie ging, gaat AI 2.0 over betrokkenheid. Terwijl op tekst gebaseerde AI beperkt is in de diepte waarmee het het publiek kan betrekken, stelt multimodale AI de gebruiker in staat een actieve deelnemer te worden. In plaats van een verhaal te lezen, kun je communiceren met een hoofdpersoon en de plot in een nieuwe richting sturen, of je eigen wereld bouwen waarin verhalen en personages met je mee evolueren.
We kunnen de game-industrie ter waarde van 250 miljard dollar beschouwen als het model voor het potentieel van multimodale AI. Videogames combineren beeld, audio, verhaal en realtime actie, waardoor een meeslepende ervaring ontstaat die traditioneel entertainment niet kan repliceren. Met platforms als Roblox en Minecraft kunnen spelers inhoud bewonen. Roblox alleen bereikt meer dan 100 miljoen dagelijkse gebruikersdie gezamenlijk tientallen miljarden uren per jaar doorbrengen ondergedompeld in deze werelden; betrokkenheid die de tekst alleen nooit zou kunnen genereren.
Met de komst van multimodale AI kunnen gebruikers over de hele wereld dit soort ervaringen creëren waaraan ze graag deelnemen via games. Door technische barrières weg te nemen, stelt multimodaliteit iedereen in staat ervaringen op te bouwen die niet alleen authentiek aanvoelen in de echte wereld, maar er ook actief aan deelnemen. Ook traditionele media spelen in op deze trend. Onlangs Disney aangekondigd een investering van $1 miljard in OpenAI en een licentieovereenkomst waarmee gebruikers korte clips met Marvel-, Pixar- en Star Wars-personages kunnen maken via het Sora-platform.
WAAROM MULTIMODAL AI KAN VEILIGER ZIJN VOOR JONGERE GEBRUIKERS
Nu AI onderdeel wordt van het dagelijks leven, is veiligheid, vooral voor jongere gebruikers, een van de meest kritieke problemen geworden waarmee de sector wordt geconfronteerd.
Door van open chat naar gestructureerde, multimodale werelden te gaan, kunnen we vangrails in gameplay ontwerpen. In plaats van te vertrouwen op continue ongestructureerde instructie, zijn deze omgevingen opgebouwd rond gedefinieerde personages, afbeeldingen, stemmen en verhaalwerelden. De interactie wordt gedreven door de ervaring zelf. Deze structuur verandert hoe en waar beveiliging in het systeem wordt ontworpen.
Educatieve AI demonstreert deze aanpak. Platforms zoals Khan Academy Kids en Duolingo combineren afbeeldingen, audio en gestructureerde instructies om het leerproces te begeleiden. AI probeert niet alles te zijn; kan zich goed concentreren op een taak. Naarmate multimodale AI zich ontwikkelt, kan een van de belangrijkste kansen het vermogen zijn om creatieve vrijheid in evenwicht te brengen met doordachte beperkingen. AI 2.0 presenteert een ontwerpverandering die bouwers, docenten en gezinnen nieuwe manieren zou kunnen bieden om veiligere, meer doelgerichte digitale ruimtes voor de volgende generatie te creëren.
WAAROM MULTIMODALE AI DE VOLGENDE GRENS IS
Ik voorspel dat consumenten in 2026 geen AI zullen promoten; het wordt een boeiendere interactieve ervaring. Dit boeit mij omdat gebruikers niet alleen maar passief output ontvangen; ze zullen ervaringen actief vormgeven en beïnvloeden hoe AI in realtime evolueert. We zien misschien dat gebruikers de laatste aflevering van hun favoriete tv-programma remixen, of dat studenten geschiedenis leren, niet door een leerboek te lezen, maar door actief een historisch nauwkeurige AI-simulatie te bespreken.
Voor oprichters en makers is de volgende stap om te stoppen met het bouwen van tools alleen voor efficiëntie en te beginnen met het bouwen van omgevingen voor onderdompeling en verkenning. De winnaars van de volgende cyclus zullen niet degenen zijn met de slimste modellen, maar degenen die AI minder als een nutsvoorziening laten voelen en meer als een bestemming voor rijke, interactieve ervaringen.
Karandep Anand is CEO van Character.AI


