Ik ben geboren als enig kind, maar nu Ik heb een tweeling. Het is een exacte kopie van mij– tot aan mijn kleding, mijn huis, mijn gezichtsuitdrukkingen en zelfs mijn stem.
Ik heb het mee gebouwd NAAR DEen ik kan hem laten zeggen wat ik wil. Het is zo overtuigend dat het mijn moeder voor de gek zou kunnen houden.
Hier ben je hoe ik het heb gebouwd– en wat Digitale tweelingen op het gebied van kunstmatige intelligentie betekenen voor de toekomst van mensen.
Deepfake jezelf
Vanaf het moment dat generatieve AI werd geboren, begonnen criminelen het te gebruiken om mensen te misleiden.
Deepfakes waren een van de eerste wijdverbreide toepassingen van de technologie. Tegenwoordig zijn ze een plaag voor beroemdheden en zelfs alledaagse tienersen een groot probleem voor iedereen die geïnteresseerd is in de waarheid.
Maar toen criminelen deepfakes uitbuitten om mensen op te lichten en te chanteren, begon een groep white-hat-bedrijven stilletjes soortgelijke digitale kloontechnologieën voorgoed te gebruiken.
Wilt u een trainingsvideo opnemen voor uw team en vervolgens een paar woorden veranderen zonder dat u het hele verhaal hoeft te herhalen? U wilt uw 400 pagina’s transformeren Vreemdere dingen fanfic in een audioboek zonder 10 uur van je leven te besteden aan het voorlezen ervan?
Digitale kloontechnologie heeft u gedekt. Je maakt in feite een deepfake van jezelf, door je beeltenis, je stem of beide te klonen, en vervolgens je resulterende “digitale tweeling” te mobiliseren om net zo gemakkelijk bergen inhoud te creëren als je ChatGPT of Claude zou voorstellen.
Ik wilde de technologie zelf uitproberen. Dus gebruikte ik de beste AI-kloontools van dit moment en creëerde Digital Tom, een perfecte digitale kopie van mezelf.
Luister naar mij
Ik besloot te beginnen met het klonen van mijn stem. De stem van een persoon lijkt iets bijzonder intiem en persoonlijks.
Denk eens terug aan een dierbare die je verloren hebt. Ik wed dat je je nog precies herinnert hoe ze klonken. U kunt zich waarschijnlijk zelfs een specifiek, impactvol gesprek herinneren dat u met hen had.
Zelfs het klonen van een stem, met alle nuances van accent, spreekstijl, toon en ademhaling, is dat wel een zware technische uitdaging. Mensen vergeven slechte video’s snel en schrijven fouten of gebreken in deepfakes toe aan een onstabiele internetverbinding of een oude webcam. Contentmakers over de hele wereld produceren elke dag vreselijke video’s zonder de hulp van kunstmatige intelligentie!
Een slechte AI-stem klinkt echter veel verontrustender. Het is gemakkelijker om in de Uncanny Valley te belanden, tenzij elk aspect van een vocale kloon perfect is.
Om dat lot te vermijden, wendde ik me tot UndiciLabs. Het bedrijf bestaat sinds 2022, maar is het afgelopen jaar enorm in populariteit gestegen de waardering verdubbelde tot ruim $6,6 miljard.
ElevenLabs blinkt uit in audiobeheer: als je naar een door AI verteld audioboek hebt geluisterd, interactie hebt gehad met een sprekend personage in een videogame of naar geluidseffecten hebt geluisterd in een tv-programma of film, is de kans groot dat je per ongeluk de technologie van ElevenLabs hebt ervaren.
Om mijn stem te klonen, heb ik $ 22 uitgegeven voor een Creator-account. Vervolgens heb ik ongeveer 90 minuten aan opnames van mijn YouTube-kanaal geüpload naar de ElevenLabs-interface.
Het bedrijf beweert dat je met slechts 30 minuten audio een professionele stemkloon kunt maken. U kunt zelfs een basiskloon maken met slechts 10 seconden spraak. ElevenLabs laat u een toestemmingsclip opnemen om ervoor te zorgen dat u niet probeert een derde partij te deepfaken.
Binnen een paar uur was mijn professionele stemkloon klaar. Het gebruik ervan is ongelooflijk eenvoudig. ElevenLabs biedt een interface die veel op ChatGPT lijkt. Voer in wat je wilt dat je kloon zegt, druk op een knop en binnen enkele seconden spreekt je digitale tweelingstem precies de woorden uit die je hebt getypt.
Ik heb voor mijn digitale tweeling een audio-update over dit item laten opnemen Snel bedrijf uitgever. Hij omschreef het als ‘verschrikkelijk realistisch’. Toen stuurde ik een clip naar mijn moeder. Ze antwoordde: “Hij zou mij hebben bedrogen.”
In mijn natuurlijke habitat
Ik was enorm onder de indruk van de stemkloon. Ik zou het meteen kunnen gebruiken om een hele door AI gegenereerde podcast te maken, mijn vrienden voor de gek te houden, of misschien zelfs hack mijn bank.
Maar ik wilde niet slechts één stem. Ik wilde een compleet digitale Tom die ik naar mijn hand kon zetten.
Voor de volgende fase van mijn kloonexperiment wendde ik me tot Synthese. Ik ontmoette Victor Riparbelli, CEO van Synthesia, voor het eerst in 2019 tijdens een evenement in de fotografie-industrie, toen zijn bedrijf nog een slordige startup was. Vandaag is het zo ter waarde van 4 miljard dollar.
Synthesia is gespecialiseerd in het maken van digitale ‘Avatars’, in wezen videoklonen van een echte persoon. Net als bij ElevenLabs kun je tekst in een interface typen en een video krijgen waarin je avatar deze voorleest, compleet met realistische gezichtsuitdrukkingen en lipbewegingen.
Ik opende een proefaccount voor Synthesia en begon mijn persoonlijke avatar te maken. Synthesia vroeg om toegang tot mijn webcam en nam vervolgens op dat ik ongeveer 10 minuten buiten het scherm een vooraf ingesteld script aan het lezen was.
De volgende dag was mijn avatar klaar. Het was een perfecte digitale kloon van mijn beeltenis, inclusief het t-shirt dat ik droeg op de dag dat ik het maakte en mijn (te lange) winterkapsel. Het plaatste me zelfs in mijn natuurlijke habitat: mijn comfortabele, rommelige thuiskantoor.
Net als bij mijn stemkloon kon ik elke tekst typen die ik maar kon bedenken en binnen ongeveer 10 minuten kreeg ik een video waarin Digital Tom deze voorlas.
Synthesia kopieerde zelfs de details van mijn presentatiestijl, tot aan mijn glimlach en de neiging om elke paar seconden naar de camera te kijken terwijl ik een script van het scherm las.
Als ik met Digital Tom een video zou opnemen voor mijn YouTube-kanaal, weet ik zeker dat de meeste gebruikers geen idee zouden hebben dat het nep was.
De waarde van mensen
Mijn experiment laat zien dat de huidige AI-kloontechnologie buitengewoon indrukwekkend is. Ik zou gemakkelijk bergen audiocontent kunnen creëren met mijn ElevenLabs-kloon of een heel socialemediakanaal kunnen creëren met mijn Digital Tom als ster.
De grotere vraag is echter waarom ik het zou willen doen.
Natuurlijk zijn er talloze gebruiksscenario’s om mee te werken A digitale tweeling.
Ook hier is Synthesia gespecialiseerd in het maken van bedrijfstrainingsvideo’s. Bedrijven kunnen snel gespecialiseerd trainingsmateriaal maken zonder een studio te huren, aannemen een videograaf en maak talloze foto’s van een pratend hoofd voor een groen scherm.
Ze kunnen deze ook aanpassen door enkele geschreven woorden te wijzigen, bijvoorbeeld als een productkenmerk enigszins verandert.
Op hun beurt doet ElevenLabs geweldige zaken met audioboeken en klantenservicemedewerkers. Maar ze leveren ook nuttige diensten, zoals knutselen toegankelijke, voorgelezen versies van webpagina’s voor blinde gebruikers.
Maar mijn experiment overtuigde mij ervan dat er minder goede redenen zijn om mee te werken jouw digitale tweeling.
In een internetlandschap waar iedereen binnen enkele minuten een website van duizenden pagina’s kan maken met behulp van Gemini, en meeslepende video’s zijn dankzij Sora dertien in een dozijnde inhoud is goedkoop. Er zijn niet veel goede manieren meer waarop gebruikers het kaf van het koren kunnen scheiden.
De persoonlijkheid is een van de weinige die nog over is. Mensen volgen graag mensen. Voor makers is het ontwikkelen van een persoonlijke relatie met je publiek de beste manier om ze je inhoud te laten consumeren, in plaats van goedkopere (en vaak betere) AI-alternatieven.
Hem compromitteren door een niet-geopenbaarde digitale tweeling in zijn gezicht te duwen, hoe overtuigend het ook mag zijn, lijkt de snelst mogelijke manier om die relatie te verpesten.
Mensen willen de vlezige Thomas Smith horen, ook al vergeet de AI-versie nooit een woord of hij wordt midden in de video onderbroken door zijn kippen.
Ik zou een van de ingebouwde karakters van ElevenLab of Synthesia kunnen gebruiken om inhoud te creëren (volledige openbaarmaking). Maar ik kan mijn digitale tweeling niet in de echte wereld gebruiken.
Ik zie echter een nut voor de technologie. Tijdens mijn experiment viel het mij op dat de beste reden om een AI digital twin te bouwen niet is om je stem of gelijkenis te vervangen, maar om deze te behouden.
Soms verlies ik mijn stem en dit is ongelooflijk destructief voor de productie van mijn inhoud. Als u ooit last heeft van een stemstoornis en deze definitief kwijtraakt, is het fijn om te weten dat er een zeer realistische back-up op de servers van ElevenLabs staat.
Het is ook leuk om te bedenken dat ik over tien jaar, als ik onvermijdelijk ouder en gerimpelder ben dan vandaag, mijn Digitale Tom van 2026 weer tot leven zou kunnen brengen. Het zou bevroren zijn in de tijd, een perfecte replica van mijn uiterlijk, mijn maniertjes en mijn omgeving op dit specifieke moment, voor altijd herinnerbaar.
Ik zal Digital Tom niet snel gebruiken om mijn YouTube-kanaal te laten groeien, te beginnen met podcasten of mijn kinderen een verhaaltje voor te lezen voor het slapengaan. Maar er is een vreemd deel van mij dat blij is dat hij er is, voor het geval dat.



