Home Nieuws Leren door visuele imitatie: Guidede traint AI-agenten op menselijke ‘expertvideo’s’ in plaats...

Leren door visuele imitatie: Guidede traint AI-agenten op menselijke ‘expertvideo’s’ in plaats van op documentatie

4
0
Leren door visuele imitatie: Guidede traint AI-agenten op menselijke ‘expertvideo’s’ in plaats van op documentatie

Jarenlang is de ‘laatste kilometer’ van digitale transformatie bezaaid met vergeten pdf’s en genegeerde trainingshandleidingen.

Organisaties geven miljoenen uit aan geavanceerde software zoals SAP of Salesforce, alleen maar omdat werknemers moeite hebben met de basisnavigatie. Nu het tijdperk van agent AI aanbreekt, worden bedrijven geconfronteerd met een tweesnijdend zwaard: ze moeten menselijke werknemers leren samenwerken met kunstmatige intelligentie, terwijl ze tegelijkertijd AI-agenten leren navigeren door de labyrintische interfaces van de moderne onderneming.

Eén idee dat steeds populairder lijkt te worden onder op AI gerichte bedrijven: gebruik schermopnamen en tutorials/walkthroughs van iemand die een zakelijke taak uitvoert (of het nu gaat om het aanmaken van een nieuw ticket of het verwerken van een factuur) en train de AI om de stroom te repliceren op basis van de schermopname. Deze week belde een startup Standard Intelligence ging viraal op X met een eerste demo van de open versie hiervan voor de fysieke en digitale wereld.

Maar de waarheid is dat er al actoren zijn die dit probleem rechtstreeks voor het bedrijf zelf aanpakken: om een ​​voorbeeld te geven: Gedreveneen Israëlische startup geboren tijdens de videocentrische jaren van de COVID-19-pandemie, heeft vandaag een Series B-overinschrijving van $ 50 miljoen aangekondigd financieringsronde onder leiding van PSG Equity om juist deze kennisinfrastructuurcrisis aan te pakken.

In plaats van een agent een statische pdf-handleiding te bieden, biedt Guidede hifi ‘Ground Truth Video’, een rijke stroom gegevens die door echte menselijke experts worden vastgelegd terwijl ze door complexe software navigeren.

De investering signaleert een verschuiving in de manier waarop de technologie-industrie documentatie beschouwt, niet als een statisch bijproduct van werk, maar als de kritische telemetrie die nodig is om de volgende generatie autonome digitale agenten te trainen.

De technologie: van video-opname tot wereldmodellen

In de kern is Guidede een AI Digital Adoption Platform (ADAP). De technologische doorbraak ligt echter in wat er achter de schermen gebeurt tijdens een opname.

Guidede neemt niet alleen pixels op; legt elke klik, scroll en latente interactie met de HTML-pagina vast– de subtiele pauzes, specifieke scrolldieptes en correcties die door een mens worden aangebracht wanneer een systeem achterblijft. Deze telemetrie transformeert de onbewerkte video in een Vision-Language-Action (VLA) trainingsset.

Ondertussen verbergt de Magic Redaction van het platform automatisch gevoelige gegevens zoals wachtwoorden of creditcardnummers tijdens het vastleggen, waardoor materialen veilig en op HIPAA-uitgelijnd blijven.

“Elke keer dat je op een knop klikt, sleept en neerzet, scrollt, schrijft, verzamelen we de interactie… alles, we ruimen het op: er is geen privé-informatie”, legt Yoav Einav, medeoprichter en CEO van Guidde, uit in een exclusief interview met VentureBeat.

Onder de motorkap legt het platform onderliggende metadata en DOM-wijzigingen (Document Object Model) vast, gesynchroniseerd met videoframes. De differentiator is de telemetrie die onder het oppervlak verborgen is.

Deze rijke metadata creëren een ‘digitaal wereldmodel’ van bedrijfssoftware. En omdat elk bedrijf zijn eigen unieke mix van apps en processen hanteert, Guidede creëert een datagracht waarmee zakenagenten door verouderde gebruikersinterfaces kunnen redeneren met hetzelfde ruimtelijke inzicht als een mens, zodat automatisering daadwerkelijk werkt in een productieomgeving in plaats van in een eenvoudige laboratoriumdemo.

Voor een mens is het een tutorial. Voor een AI-agent is het een hifi-kaart van de interface. Hierdoor kunnen agenten complexe gebruikersinterfaces ‘zien’ en redeneren zoals mensen dat doen, waardoor de ‘laatste kilometer’ van automatisering wordt opgelost waar agenten eerder faalden vanwege een gebrek aan specifieke zakelijke context en in-situ gebruik.

In zekere zin bouwt Guidde een ‘zelfrijdende auto’ zoals een Waymo voor computergebruik.

Product: drie pijlers van begeleiding

Het platform is geëvolueerd naar drie verschillende producten die zijn ontworpen om zich aan te passen aan de volwassenheid van een organisatie:

  1. Gids maken: De engine waarmee vakexperts binnen enkele minuten workflows in documentatie kunnen omzetten.

  2. Uitzendgidsen: een gepersonaliseerde aanbevelingsengine, vaak vergeleken met Netflix, die antwoorden levert binnen de tools die mensen daadwerkelijk gebruiken. Het weet wie de gebruiker is en op welke afdeling deze zich bevindt, zodat relevante inhoud precies zichtbaar wordt wanneer dat nodig is.

  3. Gids Ontdek: De onlangs gelanceerde “agentic” pijler. Net zoals Waze wegen in kaart brengt door chauffeurs te observeren, brengt Discover routes via software in kaart door te monitoren hoe werknemers werken. Het begrijpt de workflow, creëert de inhoud en werkt deze automatisch bij wanneer de gebruikersinterface verandert.

Mensen trainen in het gebruik van AI en AI met behulp van mensen

Het minder voor de hand liggende aspect van de groei van Guidede is de dubbele missie. “Wij zijn het enige platform dat zowel mensen als agenten traint”, zei Einav.

Terwijl bedrijven AI-tools zoals Microsoft 365 Copilot of ServiceNow-agents implementeren, stuiten ze op een vaardigheidskloof. Een van Guidede’s grootste klanten onthulde dat hij meer dan $ 1 miljoen per jaar betaalde voor een geavanceerde AI-tool, maar “niemand weet hoe hij ze moet gebruiken omdat ze een trainingssessie van 30 minuten leuk vonden, en dat was het dan.” Guidede vult deze leemte op door miniatuurvideo-tutorials aan te bieden in uw workflow.

Tegelijkertijd trainen deze video’s de AI-agenten zelf. Instapmodellen zoals Gemini of GPT-4 hallucineren vaak wanneer ze worden belast met specifieke bedrijfsworkflows, omdat ze niet zijn getraind in de zeer specifieke interne ‘vanilla-workflows’ die te vinden zijn in particuliere bedrijfssystemen. Guidede biedt het “startpunt”, “metadata” en “knop x,y-coördinaten” die een agent nodig heeft om een ​​actie te voltooien zonder vast te lopen.

Het multimodale voordeel

Om dit nauwkeurigheidsniveau te behouden, maakt Guidede gebruik van een multimodale infrastructuur. Het systeem is niet gebaseerd op één model; in plaats daarvan gebruikt het een “vloot” van modellen die elkaar evalueren.

  • Google Tweelingen: Over het algemeen gebruikt voor visuele taken zoals het parseren van PDF’s of PowerPoints.

  • Antropische Claude: Gebruikt om plot- en verhalende scripts te schrijven.

  • Feedbacklussen: wanneer een gebruiker een video bewerkt, worden de gegevens weer in de sjabloon ingevoegd om te voorkomen dat dezelfde fouten optreden bij toekomstige opnames.

Met deze aanpak kan Guidede een bestaande set van zes of zeven onsamenhangende tools (Loom voor vastleggen, Adobe Premiere voor bewerken, 11Labs voor tekst-naar-spraak en Synthesia voor avatars) vervangen door één enkel native AI-platform. “Wij verpakken in principe alles voor u”, zegt Einav, “en automatiseren het hele proces volgens uw merkrichtlijnen.”

Oorsprongsverhaal van de eerste video

De oorsprong van Guidde ligt in een frustratie die iedere productleider kent. Voordat Einav en mede-oprichter Dan Sahar het bedrijf oprichtten, waren ze jarenlang bezig met het beheersen van het videoverkeer bij Qwilt, een bedrijf dat in 2010 werd opgericht om te analyseren hoe mensen naar Netflix en Disney+ keken.

Toen COVID-19 toesloeg, zagen ze een enorme kans om hun video-expertise op de werkvloer toe te passen. Ze merkten op dat korte uitlegvideo’s de conversies van gratis naar betaalde accounts met 30% konden verhogen, maar dat de wrijving bij het maken ervan onhoudbaar was.

In een interview herinnerde Einav zich ouderwets ‘saai werk’: ‘Mijn team in Israël creëerde de inhoud, iemand in de VS met een Amerikaans accent deed de vertelling, iemand van het marketingteam schreef het script … en iemand van het enablement-team deed de montage.’ Door deze gefragmenteerde workflow duurde het maken van één video twee tot drie weken. “En twee weken later verandert het product en moet je het helemaal opnieuw doen”, voegde Einav eraan toe.

Guidede is gebouwd om deze cyclus tot seconden terug te brengen. Door de “Magic Capture” van een workflow te automatiseren, genereert het platform onmiddellijk een gestructureerd verhalend script en een professionele AI-voice-over. Hierdoor wordt het redactionele knelpunt weggenomen, waardoor vakexperts ‘trainingskrachtpatsers’ worden.

Licenties en marktimpact

De prijsstructuur van Guidede weerspiegelt de overgang van een openbaar nutsbedrijf naar een centraal onderdeel van de bedrijfsinfrastructuur:

  • Vrij: $0 (maximaal 25 video’s, ondersteuning voor webapps).

  • Pro: $ 18/maker/maand (onbeperkt aantal video’s, merkkit).

  • Commerciële activiteit: $39/auteur/maand (onbeperkt tekst-naar-spraak, analyse).

  • Bedrijf: Aangepaste prijzen (meertalige vertaling, SSO, magische redactie).

De impact van het platform is al zichtbaar in de cijfers: 41% reductie in de tijd voor het maken van video’s EN 34% minder inkomende supporttickets.

Voor klanten als Emerson vertaalt dit zich in een 40-60% snellere creatie van gidsen. Vooral ondersteuningsteams merken dat ze 80% van hun ticketvolume aan agenten kunnen overdragen, maar alleen als die agenten over de nuttige inhoud beschikken.

“De agent zonder de inhoud is nutteloos”, waarschuwt Einav, erop wijzend dat de meeste bedrijfsdocumentatie jarenlang verouderd is of helemaal zonder documentatie.

Vroege ontvangst door de gemeenschap en de industrie

Guidede heeft al 4.500 zakelijke klanten en wil dit aantal met de nieuwe financieringsronde uitbreiden. Ondersteunings- en operationele leiders hebben zich uitgesproken over het gebruiksgemak van het platform. Christopher Cummings, VP Client Experience bij DocNetwork, benadrukte het vermogen om “snelle, gepersonaliseerde videoreacties op vragen van klanten” te bieden.

Ondertussen merkte Wren Cotrone, directeur klantenondersteuning, op dat “als je de branding eenmaal hebt opgezet zoals jij dat wilt, je echt op deze dingen kunt inzoomen.”

Ronen Nir, CEO van PSG, vatte de investeringsthese samen: “Guidde lost een van de grootste obstakels op voor een succesvolle adoptie van AI: kennisinfrastructuur.”

Waarom dit nu belangrijk is

De paradigmaverschuiving van LLM’s met alleen tekst naar intelligentie van video-agenten is de bepalende trend van 2026. Guidede’s Series B geeft aan dat de ‘grondwaarheid’ voor zakenagenten zal voortkomen uit ruwe video-observatie, en niet uit statische documentatie.

Door vast te leggen hoe werk wordt gedaan in tientallen miljoenen workflows, bouwt Guidde een dataset op die maar weinig anderen hebben.

Zoals Einav zei: “Het begint met mensen die op de hoogte zijn en na verloop van tijd evolueert het naar volledige autonomie.” Voor de moderne onderneming is de kaart niet langer een statisch document: het is een levende, ademende laag van video-intelligentie die zowel het personeel als de agenten die deze ondersteunen begeleidt.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in