Home Nieuws De nieuwe open M2.5 en M2.5 Lightning van MiniMax zijn bijna geavanceerd,...

De nieuwe open M2.5 en M2.5 Lightning van MiniMax zijn bijna geavanceerd, maar kosten 1/20e van de prijs van de Claude Opus 4.6

5
0
De nieuwe open M2.5 en M2.5 Lightning van MiniMax zijn bijna geavanceerd, maar kosten 1/20e van de prijs van de Claude Opus 4.6

Chinese startup gewijd aan kunstmatige intelligentie MiniMaxgevestigd in Shanghai, heeft vandaag schokgolven door de AI-industrie gestuurd met de release van zijn nieuwe Taalmodel M2.5 in twee varianten, die beloven hoogwaardige AI zo goedkoop te maken dat u zich geen zorgen meer hoeft te maken over de rekening.

Er wordt ook gezegd dat “open bron“, hoewel de gewichten (instellingen) en code nog niet zijn vrijgegeven, noch het exacte licentietype of de exacte licentievoorwaarden. Maar dat is bijna uitgesloten gezien hoe goedkoop MiniMax het aanbiedt via zijn API en die van partners.

De afgelopen jaren was het gebruik van de krachtigste AI ter wereld hetzelfde als het inhuren van een dure consultant: het was briljant, maar je keek voortdurend op de klok (en het aantal tokens). M2.5 wijzigt de rekeningen, het verminderen van de kosten van de grens met maximaal 95%.

Het leveren van prestaties die kunnen wedijveren met de topmodellen van Google en Anthropic, tegen een fractie van de kosten, vooral bij het gebruik van agenttools voor zakelijke taken, waaronder creatie van Microsoft Word-, Excel- en PowerPoint-bestandenMiniMax gokt erop dat de toekomst niet alleen afhangt van hoe slim een ​​model is, maar ook van hoe vaak je het je kunt veroorloven om het te gebruiken.

Om dit doel te bereiken zegt MiniMax dat het “samen met senior professionals op terreinen als financiën, recht en sociale wetenschappen” heeft samengewerkt om ervoor te zorgen dat het model echt werk kon doen volgens hun specificaties en normen.

Deze release is belangrijk omdat het de verschuiving signaleert van AI als ‘chatbot’ naar AI als ‘werker’. Wanneer intelligentie ‘te goedkoop wordt om te meten’, stoppen ontwikkelaars met het maken van eenvoudige vraag-en-antwoordtools en beginnen ze met het creëren van ‘agents’: software die urenlang autonoom complexe projecten kan coderen, onderzoeken en organiseren zonder veel geld uit te geven.

MiniMax heeft dit model zelfs al in zijn activiteiten geïmplementeerd. Momenteel, 30% van alle taken op het hoofdkantoor van MiniMax wordt voltooid door M2.5en een verontrustende 80% van de nieuw vastgelegde code wordt gegenereerd door M2.5!

Zoals het MiniMax-team in de releaseblogpost schrijft: “wij geloven dat M2.5 vrijwel onbeperkte mogelijkheden biedt voor de ontwikkeling en werking van agenten in de economie.”

Technologie: laag vermogen en de CISPO-doorbraak

Het geheim van de efficiëntie van M2.5 ligt in de Mixture of Experts (MoE)-architectuur. In plaats van alle 230 miljard parameters uit te voeren voor elk afzonderlijk woord dat het genereert, ‘activeert’ het model er slechts 10 miljard. Hierdoor kan het de diepgang van een enorm model behouden, terwijl het beweegt met de behendigheid van een veel kleiner model.

Om dit complexe systeem te trainen heeft MiniMax een eigen Reinforcement Learning (RL)-framework ontwikkeld, genaamd Forge. MiniMax-ingenieur Lied van de olijfboom verklaard op ThursdAI-podcast op YouTube dat deze techniek een belangrijke rol speelde bij het opschalen van de prestaties, zelfs met behulp van een relatief klein aantal parameters, en dat het model gedurende een periode van twee maanden werd getraind.

Forge is ontworpen om het model te helpen leren van ‘echte omgevingen’, waardoor de AI in wezen kan oefenen met coderen en het gebruik van tools in duizenden gesimuleerde werkruimten.

“Wat we ons realiseerden is dat er veel potentieel is met een klein model als dit als we er versterkend leren op trainen met een groot aantal omgevingen en agenten”, zei Song. ‘Maar het is niet zo eenvoudig om te doen’, eraan toevoegend dat ze er ‘veel tijd aan hebben besteed’.

Om het model tijdens deze intensieve training stabiel te houden, gebruikten ze een wiskundige aanpak genaamd CISPO (Clipping Importance Sampling Policy Optimization) en deelden ze de formule op hun blog.

Deze formule zorgt ervoor dat het model tijdens de training niet overgecorrigeerd wordt, waardoor het een ‘architectenmentaliteit’ kan ontwikkelen, wat MiniMax noemt. In plaats van meteen code te gaan schrijven, leerde M2.5 eerst proactief de structuur, functionaliteit en interface van een project te plannen.

State-of-the-art (en nauwe) benchmarks.

De resultaten van deze architectuur worden weerspiegeld in de nieuwste brancheranglijsten. M2.5 is niet alleen verbeterd; verplaatst naar het hoogste niveau van codeerpatronen en benadert het nieuwste patroon van Anthropic, Claude Opus 4.6, slechts een week geleden uitgebrachten laat zien dat Chinese bedrijven nu dagen verwijderd zijn van het bereiken van Amerikaanse laboratoria met veel betere middelen (in termen van GPU’s).

MiniMax M2.5-lijngrafiek waarin de prestaties van verschillende modellen in de loop van de tijd worden vergeleken op de SWE-benchmark. Krediet: MiniMax

Hier zijn enkele nieuwe hoogtepunten uit de MiniMax M2.5-benchmark:

  • Geverifieerd door SWE-bureau: 80,2% – Komt overeen met Claude Opus 4.6-snelheden

  • BladerenComp: 76,3%: Onderzoek en gebruik toonaangevende tools.

  • Multi-SWE bank: 51,3% — SOTA bij meertalige codering

  • BFCL (gereedschapsoproep): 76,8%: Zeer nauwkeurige workflows voor agenten.

MiniMax M2.5 verschillende benchmarkvergelijkingsstaafdiagrammen

MiniMax M2.5 verschillende benchmarkvergelijkingsstaafdiagrammen. Krediet: MiniMax

Op de ThursdAI-podcast wees gastheer Alex Volkov erop dat de MiniMax M2.5 extreem snel werkt en daarom minder tokens gebruikt om taken te voltooien, in de orde van $ 0,15 per taak vergeleken met $ 3,00 voor de Claude Opus 4.6.

Het doorbreken van de kostenbarrière

MiniMax biedt twee versies van het model via zijn API, beide gericht op productiegebruik in grote volumes:

  • M2.5-Bliksem: Geoptimaliseerd voor snelheid en biedt 100 tokens per seconde. De kosten bedragen $0,30 per 1 miljoen inputtokens en $2,40 per 1 miljoen outputtokens.

  • M2.5 standaard: Kostengeoptimaliseerd, het draait op 50 tokens per seconde. Het kost de helft van de prijs van de Lightning-versie ($0,15 per 1 miljoen inputtokens / $1,20 per 1 miljoen outputtokens).

Simpel gezegd: MiniMax beweert dat je voor ongeveer $10.000 een heel jaar lang vier ‘agenten’ (AI-werkers) continu kunt laten werken.

Voor zakelijke gebruikers ligt deze prijs tussen 1/10 en 1/20 van de kosten van concurrerende eigen modellen zoals de GPT-5 of Claude 4.6 Opus.

Model

Ingang

Productie

Totale kosten

Bron

Qwen3Turbo

$ 0,05

$ 0,20

$ 0,25

AlibabaCloud

chat-deepseek (V3.2-Exp)

$ 0,28

$ 0,42

$ 0,70

Diepzoeken

redenering voor diep zoeken (V3.2-Exp)

$ 0,28

$ 0,42

$ 0,70

Diepzoeken

Grok 4.1 Snel (redenering)

$ 0,20

$ 0,50

$ 0,70

xAI

Grok 4.1 Snel (niet redeneren)

$ 0,20

$ 0,50

$ 0,70

xAI

MiniMax M2.5

$ 0,15

$ 1,20

$ 1,35

MiniMax

MiniMax M2.5-Bliksem

$ 0,30

$ 2,40

$ 2,70

MiniMax

Gemini 3 Flash-voorbeeld

$ 0,50

$ 3,00

$ 3,50

Googlen

Kimi-k2.5

$ 0,60

$ 3,00

$ 3,60

Maanschot

GLM-5

$ 1,00

$ 3,20

$ 4,20

Z.ai

ERNI 5.0

$ 0,85

$ 3,40

$ 4,25

Baidu

ClaudeHaiku4.5

$ 1,00

$ 5,00

$ 6,00

Antropisch

Qwen3-Max (23-01-2026)

$ 1,20

$ 6,00

$ 7,20

AlibabaCloud

Gemini 3 Pro (≤200.000)

$ 2,00

$ 12,00

$ 14,00

Googlen

GPT-5.2

$ 1,75

$ 14,00

$ 15,75

Open AI

Claude Sonnet 4.5

$ 3,00

$ 15,00

$ 18,00

Antropisch

Gemini 3 Pro (>200K)

$ 4,00

$ 18,00

$ 22,00

Googlen

Vacature sluiten 4.6

$ 5,00

$ 25,00

$ 30,00

Antropisch

GPT-5.2Pro

$ 21,00

$ 168,00

$ 189,00

Open AI

Strategische implicaties voor bedrijven en leiders

Voor technische leiders vertegenwoordigt M2.5 meer dan alleen een goedkopere API. Verander nu het operationele draaiboek voor bedrijven.

De druk om spaarclaims te ‘optimaliseren’ is verdwenen. U kunt nu high-context modellering en redenering implementeren voor routinetaken die voorheen onbetaalbaar waren.

De snelheidsverbetering van 37% bij het voltooien van end-to-end taken betekent dat de ‘agentische’ pijplijnen die worden gewaardeerd door AI-orkestrators – waar modellen communiceren met andere modellen – eindelijk snel genoeg bewegen voor realtime gebruikerstoepassingen.

Bovendien suggereren de hoge scores van M2.5 op het gebied van financiële modellering (74,4% op MEWC) dat het met minimaal toezicht overweg kan met “stilzwijgende kennis” op gespecialiseerde gebieden zoals recht en financiën.

Omdat M2.5 is gepositioneerd als een open source-model, kunnen organisaties mogelijk intensieve, geautomatiseerde code-audits uitvoeren op een schaal die voorheen onmogelijk was zonder massale menselijke tussenkomst, en dat allemaal met behoud van een betere controle over de gegevensprivacy. Maar totdat de licentievoorwaarden en -gewichten worden gepubliceerd, zal dit slechts een bijnaam blijven.

MiniMax M2.5 is een signaal dat de grens van kunstmatige intelligentie niet langer alleen gaat over wie het grootste brein kan bouwen, maar wie van dat brein de nuttigste en meest kosteneffectieve werker in de kamer kan maken.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in