Googlen uitgegeven donderdag een “opnieuw uitgevonden” versie van zijn Gemini Deep Research-onderzoeksagent op basis van zijn veelgeprezen baanbrekend funderingsmodelTweeling 3 Pro.
Deze nieuwe agent is niet alleen bedoeld om onderzoeksrapporten te produceren, maar kan dat nog steeds doen. Het stelt ontwikkelaars nu in staat de zoekmogelijkheden van het SATA-model van Google in hun apps te integreren. Deze mogelijkheid wordt mogelijk gemaakt door de nieuwe functie van Google Interactie-APIontworpen om ontwikkelaars meer controle te geven in het volgende tijdperk van agent AI.
De nieuwe tool Gemini Deep Research is een agent die is uitgerust om bergen informatie te synthetiseren en een grote contextdump in de prompt af te handelen. Google zegt dat het door klanten wordt gebruikt voor taken variërend van due diligence tot onderzoek naar de veiligheid van geneesmiddelen.
Google zegt ook dat het deze nieuwe deep search-agent binnenkort zal integreren in diensten, waaronder Google Search, Google Finance, zijn Gemini-app en zijn populaire NotebookLM. Dit is weer een stap in de richting van de voorbereiding op een wereld waarin mensen niets meer googlen – hun AI-agenten wel.
De technologiegigant zegt dat Deep Research profiteert van de status van de Gemini 3 Pro als het ‘meest praktische’ model, getraind om hallucinaties tijdens complexe taken te minimaliseren.
AI-hallucinaties – waarbij de LLM dingen gewoon verzint – zijn een bijzonder cruciaal probleem voor de taken van agenten op het gebied van diep, langdurig redeneren, waarbij veel autonome beslissingen in minuten, uren of langer worden genomen. Hoe meer keuzes een LLM moet maken, hoe groter de kans dat zelfs één hallucinerende keuze de hele output ongeldig maakt.
Om zijn claims van vooruitgang te bewijzen, heeft Google ook nog een benchmark gecreëerd (alsof de wereld van AI er een nodig had). De nieuwe benchmark heet fantasieloos DeepSearchQA en is bedoeld om agenten te testen bij complexe meerfasige informatiezoektaken. Google heeft deze benchmark open source gemaakt.
Techcrunch-evenement
San Francisco
|
13-15 oktober 2026
Het testte ook Deep Research on Humanity’s Last Exam, een veel interessanter genaamde onafhankelijke, algemene kennisbenchmark vol ongelooflijk nichetaken; en BrowserComp, een one-stop-shop voor browsergebaseerde agenttaken.
Zoals je zou verwachten, versloeg de nieuwe Agent van Google de concurrentie op zijn eigen benchmark en die van de mensheid. ChatGPT 5 Pro van OpenAI eindigde echter verrassend op de tweede plaats en versloeg Google enigszins op BrowserComp.
Maar deze benchmarkvergelijkingen waren al achterhaald op het moment dat Google ze publiceerde. Want op dezelfde dag lanceerde OpenAI zijn langverwachte GPT 5.2, met de codenaam Garlic. OpenAI zegt dat zijn nieuwste model beter presteert dan zijn rivalen, met name Google, in een aantal typische benchmarks, waaronder OpenAI’s eigen interne benchmark.
Misschien wel een van de meest interessante onderdelen van deze aankondiging was de timing. Wetende dat de wereld wachtte op de vrijlating van Garlic, bracht Google wat AI-nieuws uit.


