Het Allen Instituut voor AI (Ai2) heeft een nieuwe generatie van zijn grote taalmodellen uitgebracht, ontworpen om directer te concurreren met industriële en academische zwaargewichten.
De in Seattle gevestigde non-profitorganisatie presenteerde Olmo 3een verzameling open taalmodellen die volgens hem beter presteren dan volledig open modellen zoals Stanford’s Marin en open-weight commerciële modellen zoals Meta’s Llama 3.1.
Eerdere versies van Olmo waren in de eerste plaats ontworpen als wetenschappelijke hulpmiddelen om te begrijpen hoe AI-modellen worden gebouwd. Met Olmo 3 breidt Ai2 zijn focus uit en positioneert de modellen als krachtige, efficiënte en transparante systemen die geschikt zijn voor gebruik in de echte wereld, inclusief commerciële toepassingen.
“Olmo 3 laat zien dat openheid en prestaties samen kunnen evolueren”, zei Ali Farhadi, CEO van Ai2, donderdagochtend in een persbericht waarin hij de nieuwe modellen aankondigde.
Het maakt deel uit van een grotere evolutie in de wereld van kunstmatige intelligentie. Het afgelopen jaar zijn steeds krachtigere open modellen van bedrijven en universiteiten – waaronder Meta, DeepSeek, Qwen en Stanford – gaan concurreren met de prestaties van de eigen systemen van grote technologiebedrijven.
Veel van de nieuwste open modellen zijn ontworpen om hun stapsgewijze redenering te demonstreren – gewoonlijk ‘denkmodellen’ genoemd – die een belangrijke maatstaf in de sector zijn geworden.
Ai2 brengt Olmo 3 uit in meerdere versies: Olmo 3 Base (het belangrijkste basismodel); Olmo 3 Instruct (geoptimaliseerd om gebruikersinstructies te volgen); Olmo 3 Think (ontworpen om explicieter redeneren te tonen); en Olmo 3 RL Zero (een experimenteel model getraind met versterkend leren).
Open modellen winnen terrein onder startups en ondernemingen die meer controle willen over kosten en gegevens, samen met een duidelijker inzicht in hoe de technologie werkt.
Ai2 gaat nog verder door de volledige ‘modelflow’ achter Olmo 3 vrij te geven: een reeks snapshots die laten zien hoe het model door elke trainingsfase vorderde. Bovendien zal een bijgewerkte OlmoTrace-tool onderzoekers in staat stellen de redeneerstappen van een model te koppelen aan de specifieke gegevens en trainingsbeslissingen die daarop van invloed zijn geweest.
In termen van energie- en kostenefficiëntie beweert Ai2 dat het nieuwe Olmo-basismodel 2,5 keer efficiënter is om te trainen dan Meta’s Llama 3.1 (gebaseerd op GPU-uren per token, waarbij Olmo 3 Base wordt vergeleken met Meta’s 8B post-trained model). Een groot deel van deze winst komt voort uit het trainen van Olmo 3 met veel minder tokens dan vergelijkbare systemen, in sommige gevallen zes keer minder dan concurrerende modellen.
Naast andere verbeteringen zegt Ai2 dat Olmo 3 veel langere documenten in één keer kan lezen of analyseren, met ondersteuning voor invoer van maximaal 65.000 tokens, ongeveer de lengte van een kort boekhoofdstuk.
Ai2, opgericht in 2014 door wijlen mede-oprichter van Microsoft, Paul Allen, heeft lange tijd geopereerd als een op onderzoek gerichte non-profitorganisatie, die open source-tools en -modellen ontwikkelde, terwijl grotere commerciële laboratoria de schijnwerpers domineerden. Het instituut heeft dit jaar een reeks stappen gezet om zijn profiel te vergroten en tegelijkertijd zijn missie, het ontwikkelen van kunstmatige intelligentie om de grootste problemen ter wereld op te lossen, te behouden.
In augustus was Ai2 gekozen van de National Science Foundation en Nvidia voor een baanbrekend initiatief van $152 miljoen om volledig open, multimodale kunstmatige-intelligentiemodellen voor wetenschappelijk onderzoek te bouwen, waardoor het instituut een belangrijke bijdrage kan leveren aan de kunstmatige intelligentie-ruggengraat van het land.
Het fungeert ook als een belangrijke technische partner voor AI KankeralliantieFred Hutch en andere grote Amerikaanse kankercentra helpen bij het trainen van AI-modellen op basis van klinische gegevens zonder patiëntendossiers bloot te leggen.
Olmo 3 is nu beschikbaar op Hugging Face en Ai2’s modelspeeltuin.



