Home Nieuws Cohere’s Rerank 4 verviervoudigt het contextvenster vergeleken met 3.5 om agentfouten te...

Cohere’s Rerank 4 verviervoudigt het contextvenster vergeleken met 3.5 om agentfouten te verminderen en de nauwkeurigheid van enterprise search te vergroten

5
0
Cohere’s Rerank 4 verviervoudigt het contextvenster vergeleken met 3.5 om agentfouten te verminderen en de nauwkeurigheid van enterprise search te vergroten

Bijna een jaar na de release Herclassificatie 3.5Cohere heeft de nieuwste versie van zijn zoekmodel gelanceerd, nu met een groter contextvenster om agenten te helpen de informatie te vinden die ze nodig hebben om hun taken te voltooien.

Consistent zei hij een blogpost dat Rerank 4 een contextvenster heeft van 32K, wat een viervoudige toename is ten opzichte van 3,5.

“Hierdoor kan het model langere documenten verwerken, meerdere stappen tegelijk evalueren en relaties tussen secties vastleggen die kortere vensters misschien niet missen”, aldus de blogpost. “Deze uitgebreide mogelijkheid verbetert daarom de nauwkeurigheid van de classificatie voor realistische documenttypen en vergroot het vertrouwen in de relevantie van de opgehaalde resultaten.”

Rerank 4 is beschikbaar in twee versies: Fast en Pro. Omdat het een kleiner model is, is Fast beter geschikt voor toepassingen die snelheid en nauwkeurigheid vereisen, zoals e-commerce, programmeren en klantenservice. Pro is geoptimaliseerd voor taken die een diepere redenering, precisie en analyse vereisen, zoals het genereren van risicomodellen en het uitvoeren van data-analyses.

Bedrijfsonderzoek groter belang gekregen dit jaar, vooral omdat AI-agenten toegang nodig hebben tot meer informatie en context over de organisatie waarvoor ze werken. Cohere zei dat rerankers “de nauwkeurigheid van zakelijke AI-zoekopdrachten aanzienlijk verbeteren door de initiële ophaalresultaten te verfijnen.” Rerank 4 pakt de nuancekloof aan die is ontstaan ​​door sommige bi-encoder-inbeddingsmodellen – modellen die het ophalen van augmented generation (RAG) eenvoudiger maken – met behulp van een cross-encoder-architectuur “die zoekopdrachten en kandidaten gezamenlijk verwerkt, subtiele semantische relaties vastlegt en de resultaten herschikt om de meest relevante elementen naar boven te halen”, aldus Cohere.

Prestaties en benchmarks

Cohere vergeleek de modellen met andere herrangschikkingsmodellen, zoals Qwen Reranker 8B, Elasticsearch’s Jina Rerank v3 en MongoDB’s Voyage Rerank 2.5, in het bedrijfsleven in de financiële, gezondheidszorg- en productiesector. Rerank 4 presteerde zeer goed, zo niet beter dan zijn concurrenten.

Rerank 3.5 viel op door zijn vermogen om meerdere talen te ondersteunen, en Cohere zei dat Rerank 4 die trend voortzet. Het bevat meer dan 100 talen, inclusief state-of-the-art herstel in de top 10 commerciële talen.

Herclassificatiemiddelen en modellen

Herclassificatie 4 heeft tot doel de taken van agenten te laten begrijpen welke gegevens het meest geschikt zijn voor hun taken en om meer context te bieden.

Cohere merkte op dat het model een belangrijk onderdeel is van zijn agent AI-platform, Noordomdat het “naadloos integreert in bestaande AI-zoekoplossingen, inclusief hybride, vector- en trefwoordgebaseerde systemen, met minimale codewijzigingen.”

Nu steeds meer bedrijven middelen willen gebruiken voor onderzoek en inzichten, zoals blijkt uit de opkomst van Diepgaande zoekfunctionaliteitmodellen die irrelevante inhoud helpen filteren, zoals rerankers, worden steeds belangrijker.

“Dit heeft een bijzonder grote impact op de AI van agenten, waar complexe, uit meerdere stappen bestaande interacties snel het aantal modelaanroepen kunnen vergroten en contextvensters kunnen verzadigen”, aldus Cohere.

Het bedrijf beweert dat Rerank 4 helpt het tokengebruik te verminderen en het aantal pogingen dat een agent nodig heeft om de zaken goed te krijgen, te verminderen door te voorkomen dat informatie van lage kwaliteit de LLM bereikt.

Zelflerend

Cohere zei dat Rerank 4 niet alleen opvalt vanwege zijn sterke herrangschikkingsmogelijkheden, maar ook omdat het het eerste herrangschikkingsmodel is dat op zichzelf leert.

Gebruikers kunnen Rerank 4 aanpassen aan de gebruiksscenario’s die ze het vaakst tegenkomen, zonder aanvullende geannoteerde gegevens. Net als de funderingsmodellen GPT-5.2waar mensen voorkeuren kunnen aangeven en het model deze onthoudt, kunnen Rerank 4-gebruikers het model hun favoriete inhoudstypen en documentcorpora vertellen.

Wanneer het model bijvoorbeeld wordt gebruikt met Rerank 4 Fast, wordt het competitiever vergeleken met grotere modellen, omdat het nauwkeuriger is en profiteert van de specifieke gegevens die gebruikers willen.

“Als we verder keken, hebben we ook onderzocht hoe het zelflerende vermogen van Rerank 4 werkt op geheel nieuwe onderzoeksdomeinen”, aldus Cohere. “Door gebruik te maken van op de gezondheidszorg gerichte datasets die de behoefte van een arts nabootsen om patiëntspecifieke informatie op te halen – en niet alleen maar expertise uit een bepaalde medische discipline – ontdekten we dat het mogelijk maken van zelfleren consistente en substantiële winsten opleverde. Het resultaat: een duidelijke en significante toename van de ophaalkwaliteit voor Rerank 4 Fast, over de hele linie.”

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in