Home Nieuws Omdat MongoDB gelooft dat een betere vindbaarheid, en niet grotere modellen, de...

Omdat MongoDB gelooft dat een betere vindbaarheid, en niet grotere modellen, de sleutel is tot betrouwbare zakelijke AI

3
0
Omdat MongoDB gelooft dat een betere vindbaarheid, en niet grotere modellen, de sleutel is tot betrouwbare zakelijke AI

Agentsystemen en enterprise search zijn afhankelijk van het effectief ophalen van gegevens, dat efficiënt en nauwkeurig werkt. Databaseleverancier MongoDB denkt dat dit het nieuwste is incorporatie modellen helpen bij het aanpakken van de afnemende herstelkwaliteit naarmate steeds meer AI-systemen in productie gaan.

Nu agent- en RAG-systemen in productie gaan, wordt de herstelkwaliteit steeds meer een stil punt van mislukking, wat de nauwkeurigheid, de kosten en het gebruikersvertrouwen kan ondermijnen, zelfs als de modellen zelf goed werken.

Het bedrijf heeft vier nieuwe versies van zijn product gelanceerd inbeddings- en herclassificatiemodellen. Voyage 4 zal beschikbaar zijn in vier modi: Voyage-4 Embedding, Voyage-4-large, Voyage-4-lite en Voyage-4-nano.

MongoDB zei dat de Voyage-4-inbedding als algemeen model dient; MongoDB beschouwt Voyage-4-large als zijn vlaggenschipmodel. Voyage-4-lite richt zich op taken die een lage latentie en lagere kosten vereisen, terwijl Voyage-4-nano bedoeld is voor meer lokale ontwikkel- en testomgevingen of het ophalen van gegevens op het apparaat.

Voyage-4-nano is ook het eerste model met open gewicht van MongoDB. Alle modellen zijn beschikbaar via API en op het Atlas-platform van MongoDB.

Het bedrijf zei dat de modellen beter presteren dan vergelijkbare modellen van Google en Cohere op de RTEB-benchmark. Knuffel je gezicht RTEB-referentiepunt plaatst Voyage 4 als het primaire inbeddingsmodel.

“Het insluiten van sjablonen is een van die onzichtbare keuzes die AI-ervaringen echt kunnen maken of breken”, zegt Frank Liu, productmanager bij MongoDB, in een briefing. “Als je het fout hebt, lijken je zoekresultaten behoorlijk willekeurig en oppervlakkig, maar als je het fout hebt, zal je applicatie plotseling het gevoel krijgen dat het je gebruikers en je gegevens begrijpt.”

Hij voegde eraan toe dat het doel van de Voyage 4-modellen is om het ophalen van gegevens in de echte wereld te verbeteren, wat vaak instort zodra de Agentic- en RAG-pijpleidingen in productie gaan.

MongoDB heeft ook een nieuw multimodaal inbeddingsmodel uitgebracht, Voyage-multimodal-3.5, dat documenten kan verwerken die tekst, afbeeldingen en video bevatten. Dit model vectoriseert gegevens en extraheert de semantische betekenis uit tabellen, grafieken, figuren en dia’s die doorgaans in zakelijke documenten voorkomen.

Problemen met bedrijfsoprichting

Voor bedrijven is een agentsysteem slechts zo effectief als zijn vermogen om op betrouwbare wijze de juiste informatie op het juiste moment op te halen. Deze vereiste wordt moeilijker naarmate de workloads groter worden en de contextvensters gefragmenteerd raken.

Verschillende modelleveranciers richten zich op dit niveau van agent-AI. Die van Google Gemini inbouwmodel met bovenblad de inbeddingsgrafieken en Cohere lanceerde de zijne Bevat 4 multimodale modellendie documenten van meer dan 200 pagina’s verwerkt. Mistral zei dat zijn code-inbeddingsmodel, Codestrale inbeddinghet presteert beter dan Cohere, Google en zelfs MongoDB’s Voyage Code 3. MongoDB stelt dat prestatiebenchmarks alleen de operationele complexiteit waarmee bedrijven in de productie worden geconfronteerd niet oplossen.

MongoDB zegt dat veel klanten hebben ontdekt dat hun datastacks de contextgevoelige, ophaalintensieve werklasten in de productie niet aankunnen. Het bedrijf zei dat het meer fragmentatie ziet, waarbij bedrijven gedwongen worden verschillende oplossingen samen te voegen om databases te verbinden met een herstel- of herclassificatiemodel. Om klanten te helpen die geen gefragmenteerde oplossingen willen, biedt het bedrijf zijn modellen aan via één enkel dataplatform, Atlas.

De weddenschap van MongoDB is dat herstel niet langer kan worden behandeld als een losse verzameling eersteklas componenten. Om bedrijfsagenten betrouwbaar op schaal te kunnen laten functioneren, moeten de inbedding, de herclassificatie en de gegevenslaag functioneren als een nauw geïntegreerd systeem in plaats van als een aan elkaar geflanste stapel.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in