Het Chinese bedrijf Moonshot AI heeft zijn Kimi K2 open source-modelhet transformeren in een coderings- en visiemodel met een architectuur die een orkestratie van zwermen agenten ondersteunt.
Het nieuwe model, Moonshot Kimi K2.5, is een goede optie voor bedrijven die agenten willen die automatisch aandelen kunnen overdragen in plaats van dat een middenmanager als centrale beslisser optreedt.
Het bedrijf typeerde Kimi K2.5 als een “alles-in-één model” dat zowel visuele als tekstuele invoer ondersteunt, waardoor gebruikers het model kunnen gebruiken voor meerdere visuele codeerprojecten.
Moonshot heeft het aantal parameters van K2.5 niet openbaar gemaakt, maar het Kimi K2-model waarop het is gebaseerd had in totaal 1 biljoen parameters en 32 miljard geactiveerde parameters dankzij de door experts gemengde architectuur.
Dit is het nieuwste open source-model dat een alternatief biedt voor de meer gesloten opties van Google, OpenAI en Anthropic, en het presteert beter dan deze op het gebied van belangrijke prestaties, waaronder agentworkflows, codering en visie.
Op Het laatste onderzoek van de mensheid (HLE) mijlpaal, Kimi K2.5 scoorde 50,2% (met tools), beter dan OpenAI’s GPT-5.2 (xhigh) en Claude Opus 4.5. Hij heeft ook bereikt 76,8% OP SWE-bank geverifieerdHiermee wordt zijn status als codeermodel van het hoogste niveau bevestigd, hoewel GPT-5.2 en Opus 4.5 hier bovenaan staan met respectievelijk 80 en 80.9.
Moonshot zei in een persbericht dat het tussen september en november een toename van 170% in het aantal gebruikers zag voor Kimi K2 en Kimi K2 Denktdie begin november werd uitgebracht.
Zwerm agenten en geïntegreerde orkestratie
Moonshot heeft tot doel gebruik te maken van het zelfgestuurde agenten- en agentenzwermparadigma dat in Kimi K2.5 is ingebouwd. De zwermagent werd geadverteerd als de volgende grens in de ontwikkeling van kunstmatige intelligentie voor bedrijven en agent-gebaseerde systemen. Het heeft de afgelopen maanden veel aandacht getrokken.
Voor bedrijven betekent dit dat als ze agent-ecosystemen bouwen met Kimi K2.5, ze efficiënter kunnen opschalen. Maar in plaats van het model ‘op te schalen’ of te vergroten om grotere agenten te creëren, is het de bedoeling om meer agenten te creëren die zichzelf in wezen kunnen orkestreren.
Kimi K2.5 “creëert en coördineert een zwerm gespecialiseerde agenten die parallel werken.” Het bedrijf vergeleek het met een bijenkorf waarin elke agent een taak uitvoert en tegelijkertijd bijdraagt aan een gemeenschappelijk doel. Het model leert maximaal 100 subagenten zelf aan te sturen en kan parallelle workflows van maximaal 1.500 tooloproepen uitvoeren.
“Benchmarks vertellen slechts de helft van het verhaal. Moonshot AI is van mening dat AGI uiteindelijk moet worden beoordeeld op zijn vermogen om taken in de echte wereld efficiënt en onder reële tijdsbeperkingen uit te voeren. De echte maatstaf waar ze om geven is: hoeveel van je dag heeft de AI je daadwerkelijk teruggegeven? Parallel draaien vermindert aanzienlijk de tijd die nodig is voor een complexe taak: taken die vroeger dagen werk vergen, kunnen nu in minuten worden voltooid”, aldus het bedrijf.
Bedrijven die hun orkestratiestrategieën evalueren, zijn gaan kijken naar agentplatforms waar agenten communiceren en taken overdragen, in plaats van een rigide orkestratieraamwerk te volgen dat bepaalt wanneer een actie is voltooid.
Hoewel Kimi K2.5 een aantrekkelijke optie kan bieden voor organisaties die deze vorm van orkestratie willen gebruiken, voelen sommigen zich misschien meer op hun gemak bij het vermijden van op agenten gebaseerde orkestratie geïntegreerd in het model en in plaats daarvan een ander platform gebruiken om modeltraining te onderscheiden van de taak van de agent.
Dit komt omdat bedrijven vaak meer flexibiliteit willen bij het kiezen van de modellen waaruit hun agenten bestaan, zodat ze een ecosysteem van agenten kunnen opbouwen dat gebruik maakt van de LLM’s die het beste werken voor specifieke acties.
Sommige agentplatforms, zoals Salesforce, AWS Bedrock en IBM, bieden afzonderlijke tools voor observatie, beheer en monitoring waarmee gebruikers AI-agents kunnen orkestreren die met verschillende modellen zijn gebouwd en hen in staat stellen samen te werken.
Multimodale codering en visuele foutopsporing
Met de sjabloon kunnen gebruikers visuele lay-outs coderen, inclusief gebruikersinterfaces en interacties. Denk na over afbeeldingen en video’s om de activiteiten te begrijpen die zijn gecodeerd in visuele invoer. K2.5 kan bijvoorbeeld de code van een website reconstrueren door simpelweg een video-opname van de site in actie te analyseren en visuele aanwijzingen te vertalen naar interactieve lay-outs en animaties.
“Interfaces, lay-outs en interacties die moeilijk precies in taal te beschrijven zijn, kunnen worden gecommuniceerd via screenshots of schermopnames, die het model kan interpreteren en transformeren in volledig functionele websites. Dit maakt een nieuwe klasse van vibratiecoderingservaringen mogelijk”, aldus Moonshot.
Deze functionaliteit is ingebouwd in Kimi Code, een nieuwe terminalgebaseerde tool die werkt met IDE’s zoals VSCode en Cursor.
Het ondersteunt ‘op zichzelf staande visuele foutopsporing’, waarbij het model de uitvoer visueel inspecteert, zoals een weergegeven webpagina, naar documentatie verwijst en code herhaalt om lay-outverschuivingen of cosmetische fouten op te lossen zonder menselijke tussenkomst.
In tegenstelling tot andere multimodale modellen die afbeeldingen kunnen creëren en begrijpen, kan Kimi K2.5 frontend-interacties voor websites creëren met visuele elementen, en niet alleen met de code erachter.
API-prijzen
Moonshot AI heeft de K2.5 API agressief geprijsd om te concurreren met grote Amerikaanse laboratoria, en biedt aanzienlijke kortingen ten opzichte van het vorige K2 Turbo-model.
-
Ingang: 60 cent per miljoen tokens (a 47,8% verminderen).
-
Gecachte invoer: 10 cent per miljoen tokens (a 33,3% verminderen).
-
Productie: $3 per miljoen tokens (a 62,5% verminderen).
De lage kosten van in de cache opgeslagen invoer ($0,10/miljoen tokens) zijn vooral relevant voor de mogelijkheden van “Agent Swarm”, waarvoor vaak grote contextvensters over meerdere subagenten en uitgebreide tools nodig zijn.
Gewijzigde MIT-licentie
Hoewel Kimi K2.5 open source is, wordt het vrijgegeven onder een aangepaste MIT-licentie die een specifieke clausule bevat die gericht is op “hyperscale” commerciële gebruikers.
De licentie verleent standaardmachtigingen voor het gebruiken, kopiëren, wijzigen en verkopen van de software.
Er staat echter in dat als de software of enig afgeleid werk wordt gebruikt voor een commercieel product of dienst met meer dan 100 miljoen maandelijkse actieve gebruikers (MAU) of meer dan $20 miljoen aan maandelijkse inkomsten, de entiteit “Kimi K2.5” prominent moet weergeven op de gebruikersinterface.
Deze clausule zorgt ervoor dat, hoewel het model gratis en open blijft voor de overgrote meerderheid van de ontwikkelaars- en startup-gemeenschap, grote technologiegiganten de technologie van Moonshot niet kunnen whitelabelen zonder zichtbare attributie te bieden.
Het is niet helemaal “open source”, maar het is beter dan het vergelijkbare van Meta Licentievoorwaarden voor lama’s voor zijn “open source”-familie van sjablonen, waarvoor bedrijven met 700 miljoen of meer maandelijkse gebruikers een speciale bedrijfslicentie van het bedrijf moesten verkrijgen.
Wat dit betekent voor moderne AI-bouwers van ondernemingen
Voor professionals die de moderne AI-stack definiëren, van LLM-beslissers die implementatiecycli optimaliseren tot AI-orkestratieleiders die AI-gestuurde agenten en geautomatiseerde bedrijfsprocessen opzetten, vertegenwoordigt Kimi K2.5 een fundamentele verschuiving in de hefboomwerking.
Door zwermorkestratie rechtstreeks in het model in te bedden, biedt Moonshot AI deze bouwers met beperkte middelen effectief een synthetisch personeelsbestand, waardoor een enkele ingenieur honderd autonome sub-agenten net zo gemakkelijk kan aansturen als een enkele prompt.
Deze ‘scale-out’-architectuur pakt direct het dilemma van databeslissers aan om complexe pijplijnen met een beperkt aantal werknemers in evenwicht te brengen, terwijl de gereduceerde prijsstructuur dataverwerking met hoge context transformeert van een budgetbrekende luxe in een routineproduct.
Uiteindelijk suggereert K2.5 een toekomst waarin de belangrijkste beperking voor een technisch team niet langer het aantal handen op de toetsenborden is, maar het vermogen van de leiders om een zwerm te choreograferen.



