Home Nieuws Deze AI-aangedreven machine verandert foto’s in geuren

Deze AI-aangedreven machine verandert foto’s in geuren

4
0
Deze AI-aangedreven machine verandert foto’s in geuren

Stel je een herinnering uit je kindertijd voor, een herinnering die echt en nostalgisch aanvoelt, maar op de een of andere manier net buiten bereik ligt: ​​misschien een familie-uitstapje naar het strand, of een moment midden in de speelset, of een middagje op jacht naar klavertje vier. Stel je nu eens voor dat je dat gouden moment in een geur kunt verpakken.

Een wetenschapper A METCyrus Clarke werkt eraan om precies dat te doen. Samen met een team van collega-onderzoekers ontwikkelde Clarke een fysieke machine genaamd het Anemoia-apparaatdie gebruik maakt van een generatief kunstmatige intelligentiemodel analyseer een stockfoto, beschrijf deze in een korte zin en zet die beschrijving, na input van de gebruiker, om in een unieke geur.

Het woord “anemoia” was bedacht door auteur John Koenig en opgenomen in zijn boek uit 2021, Het woordenboek van duistere smarten. Het verwijst naar een specifiek gevoel van nostalgie naar een tijd of plaats die je nog nooit persoonlijk hebt ervaren, en dat is precies wat het team van Clarke hoopt vast te leggen met het Anemoia-apparaat.

Seconde een kaart Het apparaat, uitgegeven door het team, onderzoekt het concept van ‘uitgebreid geheugen’, het idee dat geheugen in het digitale tijdperk steeds vaker wordt opgeslagen en toegankelijk wordt gemaakt via externe media, zoals digitale archieven.

Studies hebben dit al aangetoond Die herinnering kan indirect ontstaan, zoals wanneer een verhaal uit de tweede hand, misschien van een ouder, iemands herinneringen vormgeeft, maar het Anemoia-apparaat is een heerlijk fysiek en interactief experiment in hoe NAAR DE het zou gebruikers in staat kunnen stellen de herinnering aan een verleden opnieuw te beleven dat ze nooit echt hebben meegemaakt.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Het Anemoia-apparaat

Het Anemoia-apparaat lijkt op iets dat je zou kunnen vinden in de ziekenboeg van een retro sci-fi ruimteschip. Het is een slank apparaat van metaal en plastic, geaccentueerd door een uniek neongroen scherm en een eenvoudige set van drie fysieke wijzerplaten. Onderaan wacht een glazen beker om de uiteindelijke geur op te vangen.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Om te beginnen plaatst een gebruiker een foto in het apparaat. Een ingebouwd visueel taalmodel (VLM) analyseert de afbeelding en genereert een eerste bijschrift op basis van wat het vindt. Voor een foto van toeristen in China, een voorbeeld dat in de krant wordt gebruikt, zou het apparaat kunnen schrijven: “Een toerist in zwarte korte broek en een kind dat poseert in de deuropening langs de Chinese Muur, met de iconische stenen trappen en het bergachtige landschap dat zich uitstrekt tot in de lucht.”

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Gebruikers kunnen vervolgens de ondertitelingsparameters aanpassen met de drie draaiknoppen: één om te beslissen welke persoon of object in de afbeelding het onderwerp moet zijn; een tweede om de leeftijd van het onderwerp te beschrijven; en een derde om de sfeer van de scène te beschrijven.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

“Persoonlijk ben ik erg geïnteresseerd in het bedenken van nieuwe fysieke interfaces voor generatieve AI”, zegt Clarke. “Generatieve AI begint meestal met een lege prompt. Wijzerplaten vervangen dat door een fysieke, gemakkelijk te begrijpen grammatica. Je probeert niet ‘het juiste te zeggen’ tegen een algoritme, het lijkt meer op het stemmen van een instrument.”

Een taalleermodel, gemaakt door ChatGPT-4o, combineert het originele bijschrift en de gebruikersinvoer tot een kort poëtisch verhaal. Als je de Grote Muur van China zelf als onderwerp van de bovenstaande suggestie zou kiezen, zou het resultaat zoiets zijn als: ‘Eeuwenlang, van de Strijdende Staten tot de Ming, heb ik met vreugde de loop van de tijd en talloze reizigers op mijn pad van steen, baksteen en hout gadegeslagen.’

Dan komt de meest indrukwekkende taak van de LLM: deze geschreven poëzie omzetten in een tastbaar parfum.

(Foto: Cyrus Clarke/met dank aan MIT Media Lab)

Geur als een poort van herinnering

Het parfumontwikkelingsproces is niet alleen gebaseerd op het identificeren van de juiste geurnoten, maar ook op het oproepen van de juiste emoties.

Het team van Clarke trainde het model om te kiezen uit een geurbibliotheek van 39 verschillende geuren (later uitgebreid naar een groter portfolio van 50 geuren), variërend van oude boeken tot leer en aarde. Elke geur werd gecodeerd met een reeks descriptoren, waarbij ze werden voorzien van details zoals basisnoten, bijbehorende concepten en sterkste emoties. Het Large Language Model (LLM) gebruikt zijn training om de juiste geuren te selecteren en te bepalen hoeveel van elk ervan in de uiteindelijke blend moet worden gebruikt.

Al deze informatie wordt gekanaliseerd in een op maat gemaakt reukdisplay, dat vier pompen gebruikt om de benodigde vloeistof uit de flesjes en in het glas te zuigen (de uiteindelijke formule voor de geur van de Grote Muur van China omvat vreugdevuur, aarde, cederhout en bamboe). Het Anemoia-apparaat is in staat een vrijwel oneindig aantal geuren op te vangen de geur van een zandstrand op een warme zomerdag in de jaren 80 met de geur van een stel dat geniet van een peer in een schilderachtige tuin.

Uiteindelijk, zo concludeert de studie, is het apparaat een provocatie die de vraag stelt ‘wat het betekent om te onthouden wanneer de herinnering zelf kan worden gegenereerd, wat het betekent om te voelen wanneer dat gevoel wordt gecreëerd in samenwerking met een machine, en wat het betekent om mens te zijn als we mooie, geurige ficties kunnen creëren over een verleden dat we nog nooit hebben meegemaakt.’

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in