Gavin McNamara heeft het toetsenbord verlaten en brengt de hele dag door met praten in plaats van schrijven.
Praat urenlang op uw computer en telefoon, verzend e-mails, schrijf presentaties, post op LinkedIn en plan zelfs gesprekken met behulp van een AI-dicteerapp van de San Francisco-startup Wispr Flow.
De AI interpuncteert, formatteert en past zijn omzwervingen aan tot een samenhangende kopie. McNamara haalt gemiddeld 125 woorden per minuut, wat het dubbele is van de gemiddelde typsnelheid.
“Op dit moment doe ik alles wat je kunt doen door te typen, door te praten”, zegt de 32-jarige oprichter van softwarebureau Why Not Us. “Ik praat alleen maar.”
In 77 apps heeft hij de afgelopen vijf maanden bijna 300.000 woorden gedicteerd, het equivalent van het schrijven van drie romans.
De tech-titanen en startups uit Californië lopen voorop in een beweging die gebruik maakt van kunstmatige intelligentie en de grote taalmodellen waarop zij vertrouwt om mensen ertoe aan te zetten met technologie te communiceren met behulp van hun stem in plaats van hun vingers.
“AI en LLM’s hebben de dynamiek veranderd”, zegt CJ Pais, de in San Diego gevestigde maker van de gratis spraak-naar-tekst-dicteerapp Handy. “Je stem gebruiken is veel sneller dan typen.”
Er is een mix van onafhankelijke ontwikkelaars en startups ontstaan, waaronder San Fransico’s Handy, Wispr Flow en Willow en anderen, om nauwkeurige steminteractie met AI te bieden.
De grootste namen in de technologiewereld creëren ook nieuwe manieren waarop mensen kunnen samenwerken met kunstmatige intelligentie. De nieuwste slimme brillen van Meta zijn stemgebaseerd. OpenAI en Meta hebben verschillende persoonlijkheden ontworpen voor de voicechats van hun bots. Amazon’s Alexa en Apple’s Siri krijgen ook AI-upgrades, waarvan de bedrijven zeggen dat ze iedereen veel meer met hun technologie zullen laten praten.
Deze gratis en betaalde methoden voor het gebruik van gesproken woorden met computers hebben miljoenen gebruikers aangetrokken, waaronder programmeurs, directieassistenten, advocaten, makers van inhoud en artsen. Sommige optimisten denken dat het toetsenbord verouderd kan raken.
“Ik ben blij om aan te kondigen dat we toetsenborden hebben verwijderd uit ’s werelds meest prestigieuze televisieshows”, zegt Allan Guo, de oprichter van Willow, in een bericht op LinkedInerop wijzend dat het Emmy Awards-team Willow’s stemdictatie gebruikte om Slack-berichten en lege inboxen sneller te verzenden ter voorbereiding op de prijzen van 2026.
Door de jaren heen hebben grote technologiebedrijven dit gedaan aangepast Veel van hun producten worden voor het gemak geleverd met voice-first-functionaliteit. De huidige verschuiving van stem als toegankelijkheidsfunctie naar een productiviteitstool.
Eind 2022 kwam de maker van ChatGPT begon onbeperkte toegang weg te geven naar zijn automatische spraakherkenningsmodel genaamd Whisper, getraind op 680.000 uur aan meertalige gegevens. OpenAI heeft de technologie voor nauwkeurige audiotranscriptie gedeeld, ooit een groot, goed bewaard technologisch geheim. Iedereen kan nu gratis AI-transcripties van hoge kwaliteit downloaden en uitvoeren op hun laptop.
De nieuwe golf AI-dicteerapps gebruikt Whisper als basis en bouwt daarop voort om live dicteren aan te bieden. Hoewel er gratis alternatieven bestaan, kost een betaald abonnement tussen de $ 8 en $ 12 per maand.
Door AI aangedreven dicteren wint nu aan populariteit onder programmeurs en gewone gebruikers, en zorgt ervoor dat mensen tegen hun laptops praten. Of het nu gaat om het schrijven van e-mails, sms’en, het ontwerpen van een website of het toewijzen van taken aan AI, early adopters zeggen dat dicteren hen in staat stelt sneller te werken, helderder te denken en productiever te zijn.
“Mensen die de stem sterk hebben geadopteerd, gaan niet meer terug. Als je eenmaal twintig uur per week achter je laptop praat, wordt typen een sleur”, zegt Naveen Naidu, algemeen directeur van de in New York gevestigde spraakdictatie-app Monologue. “Waar dit volgens mij naartoe gaat: stem wordt het niveau van delegatie. Je zegt dat je bedoelingen zijn en dat er dingen gebeuren.”
Deze nieuwe AI-dicteer-apps profiteren van die van Apple geavanceerde chips op iPhone en Mac om privédictaten uit te voeren op uw apparaat.
Geoffrey Huntley, een onafhankelijke softwareontwikkelaar, is in juni vrijwel volledig overgestapt op voice for work.
Hij start projecten vaak door een spraakopdracht te openen en de AI te vragen hem te interviewen over zijn zorgen en projectvereisten voordat er code wordt gegenereerd.
“Ik praat ermee, alsof ik in een jazzband aan het riffs ben, achteruit, vooruit, achteruit, vooruit”, zei Huntley. Deze vocale dans helpt de specificaties te verfijnen, waarna de AI het overneemt, en bouwt software.
Naast het coderen gebruikt Huntley zijn stem om ‘het te laten scheuren’ bij het vastleggen van ideeën of blogpostberichten, met behulp van apps zoals Super gefluister of Whisper Flow om een “eerste dump” van gedachten te krijgen voordat u naar het toetsenbord gaat voor de definitieve bewerking.
Een groeiend aantal softwareontwikkelaars in Silicon Valley dicteert urenlang codeerinstructies in plaats van ze te typen. De combinatie van snel oprukkende AI-agenten die kunnen coderen uurDankzij spraakinvoer die gedachten sneller vastlegt dan typen, is hun productiviteit toegenomen.
McNamara, een zelfbenoemde ‘vibratiecodeerder’, creëerde in slechts een paar maanden tijd meer dan 25 webapps, een ontwikkelingssnelheid die onmogelijk zou zijn zonder gesproken aanwijzingen.
“Ik denk niet dat typen op wat voor manier dan ook efficiënt of effectief zou zijn om mij zo snel daar te krijgen als met een gesprek”, zei McNamara.
Het kostte een kronkelend gesprek en een paar uur om de AI gebouwd te krijgen Spruiten geschenkeneen cadeaulijst voor kinderen en een app voor evalueer alle objecten via foto’s.
De eerlijkheid gebiedt te zeggen dat AI fouten kan maken en dat haar werk moet worden gemonitord.
Ondertussen heeft de wijdverbreide adoptie nieuwe ongemakken met zich meegebracht, omdat zelfs ervaren gebruikers zich ongemakkelijk voelen bij het praten tegen hun laptops. Open, drukke kantoren zijn niet ontworpen om veel mensen tegelijkertijd op hun computer te laten praten.
“Ik hou van de stem, maar niet op kantoor”, zei iemand gebruiker over X. “Ik praat niet graag met andere mensen. Ik zou het op een kantoor achter gesloten deuren doen of in mijn auto naar mijn werk gaan.”
McNamara gebruikt een koptelefoon, zodat mensen denken dat hij in gesprek is.
“Het lijkt op de sociale hack die ik heb”, zei hij.
Hoewel het nog te vroeg is om te zeggen of en wanneer het Qwerty-toetsenbord achter de tickertape en faxapparaten zal aanlopen, versnelt het tempo richting spraak steeds sneller, zegt Dylan Fox, oprichter van het in San Francisco gevestigde Assembly AI, dat audiosjablonen aan bedrijven aanbiedt.
“We staan zeker aan het begin van wat wij zien als een tien- tot honderdvoudige toename van de vraag naar spraak, applicaties en AI-interfaces”, zei hij.
Voor programmeur McNamara heeft het meer praten met chatbots hem tot een betere vriend gemaakt.
Hij was verschrikkelijk in het reageren op berichten. Ga nu meteen terug naar je vrienden.
“Ik reageer zo snel dat ze zeggen: ‘Wie is deze man?'”, zei hij.



