Home Nieuws Van glanzend object tot nuchtere realiteit: het verhaal van de vectordatabase, twee...

Van glanzend object tot nuchtere realiteit: het verhaal van de vectordatabase, twee jaar later

6
0
Van glanzend object tot nuchtere realiteit: het verhaal van de vectordatabase, twee jaar later

Toen ik voor het eerst schreef Vectordatabases: glimmend objectsyndroom en het geval van een vermiste eenhoorn in maart 2024 werd de industrie overspoeld met advertenties. Vectordatabases werden geplaatst als het volgende grote ding – een onmisbaar infrastructureel niveau voor het tijdperk van kunstmatige intelligentie. Miljarden dollars aan durfkapitaal stroomden binnen, ontwikkelaars haastten zich om bedrijfsinvesteringen in hun pijplijnen te integreren, en analisten volgden ademloos de financieringsrondes voor Dennenappel, Weven, Trilling, De vlieger en nog een tiental anderen.

De belofte was bedwelmend: eindelijk een manier om te zoeken op betekenis in plaats van op dunne trefwoorden. Dump eenvoudigweg uw bedrijfskennis in een vectorwinkel, sluit een LLM aan en zie hoe de magie gebeurt.

Alleen is de magie nooit helemaal werkelijkheid geworden.

Twee jaar later werd de realiteitscheck is gearriveerd: 95% van de organisaties die hebben geïnvesteerd in gen-AI-initiatieven behalen nul meetbaar rendement. En veel van de waarschuwingen die ik toen gaf – over vectorbeperkingen, het drukke leverancierslandschap en de risico’s van het behandelen van vectordatabases als wondermiddeltjes – bleken bijna precies zoals verwacht.

Voorspelling 1: De vermiste eenhoorn

Dus ik vroeg me af of Pinecone, het vlaggenschip van de categorie, de eenhoornstatus zou bereiken of dat het de ‘ontbrekende eenhoorn’ van de databasewereld zou worden. Vandaag kreeg deze vraag het meest welsprekende antwoord: het is dennenappel naar verluidt het onderzoeken van een verkoopdie moeite heeft om op te komen te midden van sterke concurrentie en klantenverloop.

Ja, Pinecone heeft grote rondellen gemaakt en de logo’s van de feesttenten ondertekend. Maar in de praktijk was het onderscheid subtiel. Open source-spelers als Milvus, Qdrant en Chroma onderbieden ze qua kosten. Gevestigde operators zoals Postgres (met pgVector) en Elasticsearch heeft eenvoudigweg vectorondersteuning als functie toegevoegd. En klanten vroegen steeds vaker: “Waarom een ​​compleet nieuwe database introduceren als mijn bestaande stack al redelijk goed met vectoren omgaat?”

Het resultaat: Pinecone, ooit gewaardeerd op bijna een miljard dollar, is nu op zoek naar een huis. De eenhoorn is echt verdwenen. In september 2025, Pinecone genomineerde Ash Ashutosh als CEO, waarbij oprichter Edo Liberty de rol van hoofdwetenschapper op zich neemt. De timing is veelzeggend: de verandering in leiderschap komt te midden van toenemende druk en vragen over de onafhankelijkheid op de lange termijn.

Voorspelling 2: Vectoren alleen zijn niet voldoende

Ik betoogde ook dat vectordatabases alleen geen definitieve oplossing waren. Als uw gebruikssituatie precisie vereist, zoals het zoeken naar “Error 221” in een handleiding, zou een pure vectorzoekopdracht “Error 222” vrolijk als “dichtbij genoeg” opleveren. Leuk in de demo, catastrofaal in de productie.

Die spanning tussen gelijkenis en relevantie is fataal gebleken voor de mythe van vectordatabases als universele machines.

“Bedrijven hebben op de harde manier ontdekt dat semantiek correct is.”

De ontwikkelaars die het lexicale zoeken graag vervingen door vectoren, introduceerden snel het lexicale zoeken samen met vectoren opnieuw. Teams die verwachtten dat vectoren zouden ‘werken’ namen uiteindelijk hun toevlucht tot het filteren van metagegevens. herclassificatoren en handmatig afgestemde regels. Tegen 2025 is de consensus duidelijk: vervoerders zijn krachtig, maar alleen als onderdeel van een hybride stapel.

Voorspelling 3: Een overvolle industrie wordt gecommoditiseerd

De explosie van het starten van vectordatabases is nooit duurzaam geweest. Weaviate, Milvus (via Zilliz), Chroma, Vespa, Qdrant: elk claimde subtiele differentiaties, maar voor de meeste kopers deden ze allemaal hetzelfde: vervoerders archiveren en dichtstbijzijnde buren terugvinden.

Tegenwoordig zijn er nog maar heel weinig van deze spelers in opkomst. De markt is gefragmenteerd, gecommoditiseerd en in veel opzichten opgeslokt door gevestigde exploitanten. Zoeken naar vectoren is nu een checkbox-functie op clouddataplatforms, en niet een op zichzelf staande gracht.

Precies zoals ik toen schreef: het onderscheiden van de ene vector-DB van de andere zal een steeds grotere uitdaging vormen. Deze uitdaging is nog moeilijker geworden. Gewoon, Margo, LanceDB, PostgreSQL, MySQL HeatWave, Orakel 23c, Azure SQL, Cassandra, Opnieuw, Neo4j, Enkele winkel, Elastisch zoeken, OpenZoeken, Apahce Solr…de lijst gaat maar door.

De nieuwe realiteit: Hybride en GraphRAG

Maar dit is niet alleen een verhaal van verval: het is een verhaal van evolutie. Uit de as van de vectorhype ontstaan ​​nieuwe paradigma’s die het beste van meerdere benaderingen combineren.

Hybride zoeken: trefwoord + vector is nu de standaard voor serieuze toepassingen. Bedrijven hebben geleerd dat zowel precisie als verwarring, exactheid en semantiek nodig zijn. Tools als Apache Solr, Elasticsearch, pgVector en Pinecone’s “cascade fetch” omarmen dit.

GrafiekRAG: Het populairste modewoord van eind 2024/2025 is GraphRAG: Graph-Enhanced Retrieval Augmented Generation. Door vectoren samen te voegen met kennisgrafieken codeert GraphRAG relaties tussen entiteiten die alleen al de inbedding afvlakken. Het resultaat is dramatisch.

Benchmarks en tests

  • Amazons AI-blog noemt benchmarks van Lettriawaarbij hybride GraphRAG de antwoordnauwkeurigheid verhoogde van ongeveer 50% naar meer dan 80% voor financiële, gezondheidszorg-, industriële en juridische testdatasets.

  • DE GraphRAG-bank benchmark (uitgebracht in mei 2025) biedt een rigoureuze evaluatie van GraphRAG ten opzichte van Vanilla RAG voor redeneringstaken, multi-hop-query’s en domeinuitdagingen.

  • A OpenReview-evaluatie van RAG versus GraphRAG ze ontdekten dat elke aanpak sterke punten heeft, afhankelijk van de taak, maar dat hybride combinaties vaak de beste resultaten opleveren.

  • De FalkorDB-blog meldt dat wanneer schemanauwkeurigheid belangrijk is (gestructureerde domeinen), GraphRAG op bepaalde benchmarks een factor ~3,4x beter kan presteren dan het ophalen van vectoren.

De opkomst van GraphRAG onderstreept het grotere punt: herstel gaat niet over een enkel glanzend object. Het gaat over bouwen herstelsystemen – gelaagde, hybride, contextbewuste pijplijnen die LLM’s voorzien van de juiste informatie, met de juiste precisie, op het juiste moment.

Wat betekent het om vooruit te gaan

Het oordeel is dit: vectordatabases zijn nooit een wonder geweest. Ze vormden een – belangrijke – stap in de evolutie van onderzoek en herstel. Maar ze zijn niet het eindspel, en dat zijn ze ook nooit geweest.

De winnaars op dit gebied zullen niet degenen zijn die vectoren als een op zichzelf staande database verkopen. Zij zullen degenen zijn die het zoeken naar vectoren in grotere ecosystemen zullen inbedden, waarbij grafieken, metadata, regels en context-engineering in samenhangende platforms worden geïntegreerd.

Met andere woorden: de eenhoorn is niet de vectordatabase. De eenhoorn is de herstelstapel.

Kijkend naar de toekomst: wat nu?

  • Uniforme dataplatforms omvatten vector + grafiek: Verwacht van grote database- en cloudleveranciers dat ze ingebouwde herstelstacks (vector + grafiek + volledige tekst) als ingebouwde functies aanbieden.

  • “Recovery engineering” zal naar voren komen als een aparte discipline: Net nu MLOps volwassener is geworden, zijn ook de praktijken rond integratie-optimalisatie, hybride positionering en grafiekconstructie volwassener geworden.

  • Metamodellen die beter leren bevragen: Toekomstige LLM’s misschien wel Leren om te bepalen welke ophaalmethode per zoekopdracht moet worden gebruikt, waarbij de weging dynamisch wordt aangepast.

  • Tijdelijke en multimodale GraphRAG: Onderzoekers breiden GraphRAG al uit om tijdbewust te zijn (T-GRAG) en multimodaal verenigd (bijvoorbeeld het koppelen van afbeeldingen, tekst, video).

  • Open benchmarks en abstractieniveaus: Gereedschappen zoals BenchmarkQED (voor RAG-benchmarking) en GraphRAG-Bench zullen de gemeenschap in de richting van eerlijkere en vergelijkbare systemen duwen.

Van glimmende objecten tot essentiële infrastructuur

De geschiedenis van vectordatabases heeft een klassiek pad gevolgd: een doordringende hype-cyclus, gevolgd door introspectie, correctie en rijping. In 2025 is het zoeken naar vectoren niet langer het glimmende object waar iedereen blindelings naar streeft – het is nu een fundamenteel element binnen een meer geavanceerde, veelzijdige herstelarchitectuur.

De oorspronkelijke waarschuwingen hadden gelijk. Hoop die uitsluitend op vectoren is gebaseerd, strandt vaak op de grenzen van precisie, relationele complexiteit en zakelijke beperkingen. Toch is technologie nooit verspild: het heeft de industrie gedwongen om herstel te heroverwegen, waarbij semantische, lexicale en relationele strategieën met elkaar worden gecombineerd.

Als ik in 2027 een vervolg zou schrijven, vermoed ik dat het vectordatabases niet als eenhoorns zou beschouwen, maar als een verouderde infrastructuur: fundamenteel, maar overschaduwd door slimmere orkestratielagen, adaptieve herstelcontrollers en dynamisch kiezen van AI-systemen Welke de hersteltool past zich aan de vraag aan.

Vanaf nu gaat de echte strijd niet meer tussen vector en trefwoord: het gaat om het adresseren, samenvoegen en disciplineren van het bouwen van ophaalpijplijnen die generatie-AI op betrouwbare wijze wortelen in feiten en domeinkennis. Dit is de eenhoorn waar we nu op moeten jagen.

Amit Verma is hoofd engineering en AI Labs bij Neuron7.

Lees meer van onze gastschrijvers. Of overweeg om uw eigen bericht in te dienen! Zie de onze richtlijnen hier.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in