Home Nieuws Baidu onthult eigen ERNIE 5 die de prestaties van GPT-5 verslaat op...

Baidu onthult eigen ERNIE 5 die de prestaties van GPT-5 verslaat op het gebied van grafieken, documentbegrip en meer

7
0
Baidu onthult eigen ERNIE 5 die de prestaties van GPT-5 verslaat op het gebied van grafieken, documentbegrip en meer

Slechts enkele uren nadat OpenAI zijn vlaggenschipbasismodel had bijgewerkt Van GPT-5 naar GPT-5.1belooft een lager totaal tokengebruik en een aangenamere persoonlijkheid met meer vooraf ingestelde opties, Chinese zoekgigant Baidu onthulde zijn instapmodel van de volgende generatie, ERNIE 5.0, samen met een reeks AI-productupgrades en strategische internationale uitbreidingen.

Het doel: zichzelf positioneren als een mondiale concurrent op de steeds competitiever wordende zakelijke AI-markt.

Aangekondigd tijdens het Baidu World 2025-evenement van het bedrijf, is ERNIE 5.0 een eigen, native omnimodaal model dat is ontworpen om gezamenlijk inhoud te verwerken en te genereren in de vorm van tekst, afbeeldingen, audio en video.

In tegenstelling tot Baidu die onlangs is uitgebracht ERNIE-4.5-VL-28B-A3B-Denkendat open source is onder een tolerante en ondernemingsvriendelijke Apache 2.0-licentie, ERNIE 5.0 is een eigen model en is alleen beschikbaar via ERNIE Bot van Baidu website (ik moest het handmatig selecteren in het vervolgkeuzemenu van de sjabloonkiezer) en het bestand Application Programming Interface (API) van het Qianfan-cloudplatform voor zakelijke klanten.

Naast de modellancering heeft Baidu belangrijke updates geïntroduceerd voor zijn digitale menselijke platform, no-code tools en AI-agenten voor algemene doeleinden, allemaal gericht op het uitbreiden van zijn AI-aanwezigheid buiten China.

Het bedrijf introduceerde ook ERNIE 5.0 Preview 1022, een variant die is geoptimaliseerd voor tekstintensieve taken, samen met het algemene preview-model dat balanceert tussen modi.

Baidu benadrukte dat ERNIE 5.0 een verschuiving vertegenwoordigt in de manier waarop intelligentie op grote schaal wordt ingezet, waarbij CEO Robin Li zei: “Wanneer je AI internaliseert, wordt het een native mogelijkheid en transformeert intelligentie van een kostenpost in een bron van productiviteit.”

Waar ERNIE 5.0 GPT-5 en Gemini 2.5 Pro overtreft

De benchmarkresultaten van ERNIE 5.0 suggereren dat Baidu pariteit, of bijna pariteit, heeft bereikt met toonaangevende westerse oprichtingsmodellen over een breed spectrum van taken.

In openbare benchmarkdia’s die tijdens het Baidu World 2025-evenement werden gedeeld, presteerde ERNIE 5.0 Preview beter dan of evenaarde het OpenAI’s GPT-5-High en Google’s Gemini 2.5 Pro in multimodaal redeneren, documentbegrip en op afbeeldingen gebaseerde QAterwijl ook het demonstreren van sterke vaardigheden op het gebied van taalmodellering en code-uitvoering.

Het bedrijf benadrukte zijn vermogen om gezamenlijke inputs en outputs in verschillende vervoerswijzen te beheren, in plaats van te vertrouwen op post-hoc modusfusie, die het als een technische differentiator beschouwde.

Bij visuele taken behaalde ERNIE 5.0 sterke scores op OCRBench, DocVQA en ChartQA, drie benchmarks die documentherkenning, begrip en redenering op gestructureerde gegevens testen.

Baidu zegt dat het model zowel de GPT-5-High als Gemini 2.5 Pro versloeg op deze document- en grafiekgebaseerde benchmarks, gebieden die het beschrijft als cruciaal voor zakelijke toepassingen zoals geautomatiseerde documentverwerking en financiële analyse.

Bij het genereren van afbeeldingen evenaarde of overtrof ERNIE 5.0 Google’s Veo3 in categorieën, waaronder semantische uitlijning en beeldkwaliteit, volgens interne evaluatie op basis van Baidu’s GenEval. Baidu zei dat de multimodale integratie van het model het mogelijk maakt om visuele inhoud te genereren en te interpreteren met een groter contextueel bewustzijn dan modellen die afhankelijk zijn van modaliteitsspecifieke encoders.

Voor audio- en spraaktaken liet ERNIE 5.0 concurrerende resultaten zien op de MM-AU- en TUT2017-benchmarks voor audiobegrip, evenals het beantwoorden van vragen via gesproken taalinvoer. De audioprestaties, hoewel niet zo benadrukt als de visuele of tekstprestaties, suggereren een brede voetafdruk die bedoeld is om multimodale toepassingen met een volledig spectrum te ondersteunen.

Bij taaltaken presteerde het model goed bij het volgen van instructies, het feitelijk beantwoorden van vragen en het wiskundig redeneren, sleutelgebieden die het zakelijke nut van grote taalmodellen bepalen.

De Preview 1022-variant van ERNIE 5.0, afgestemd op tekstprestaties, liet zelfs sterkere taalspecifieke resultaten zien bij de initiële toegang voor ontwikkelaars. Hoewel Baidu geen brede superioriteit claimt op het gebied van algemene taalkundige redeneringen, suggereren de interne evaluaties dat ERNIE 5.0 Preview 1022 de kloof met Engelstalige topmodellen overbrugt en deze overtreft in prestaties in de Chinese taal.

Hoewel Baidu geen volledige benchmarkdetails of ruwe scores publiekelijk heeft vrijgegeven, suggereert de positionering van de prestaties een doelbewuste poging om ERNIE 5.0 niet te framen als een niche-multimode-systeem, maar als een vlaggenschipmodel dat concurreert met grotere modellen die zijn opgesloten in een algemene redenering.

Baidu zegt dat het een duidelijk voordeel heeft bij het begrijpen van gestructureerde documenten, het redeneren via visuele grafieken en het integreren van meerdere modaliteiten in één enkele native modelleringsarchitectuur.. Onafhankelijke verificatie van deze resultaten blijft hangende, maar de breedte van de geclaimde capaciteiten positioneert ERNIE 5.0 als een serieus alternatief in het landschap van multimodale basismodellen.

Prijsstrategie voor bedrijven

ERNIE 5.0 bevindt zich op einde prijs van Baidu’s modelprijsstructuur. Het bedrijf heeft specifieke prijzen vrijgegeven voor het gebruik van de API op zijn Qianfan-platform, waardoor de kosten in lijn komen met andere topaanbiedingen van Chinese rivalen zoals Alibaba.

Model

Invoerkosten (per 1K-token)

Uitvoerkosten (per 1K-token)

Bron

ERNI 5.0

$ 0,00085 (¥ 0,006)

$ 0,0034 (¥ 0,024)

Qianfan

ERNIE 4.5 Turbo (bijv.)

$ 0,00011 (¥ 0,0008)

$ 0,00045 (¥ 0,0032)

Qianfan

Qwen3 (bijv. encoder)

$ 0,00085 (¥ 0,006)

$ 0,0034 (¥ 0,024)

Qianfan

Het kostencontrast tussen ERNIE 5.0 en eerdere modellen zoals ERNIE 4.5 Turbo benadrukt Baidu’s strategie om onderscheid te maken tussen modellen met een hoog volume, lage kosten en modellen met hoge capaciteit, ontworpen voor complexe taken en multimodaal redeneren.

Vergeleken met andere Amerikaanse alternatieven blijft het qua prijs gemiddeld:

Model

Toegang (tokens /1M)

Uitvoer (/1 miljoen tokens)

Bron

GPT-5.1

$ 1,25

$ 10,00

OpenAI

ERNI 5.0

$ 0,85

$ 3,40

Qianfan

ERNIE 4.5 Turbo (bijv.)

$ 0,11

$ 0,45

Qianfan

Vacature sluiten 4.1

$ 15,00

$ 75,00

Antropisch

Tweeling 2.5 Pro

$ 1,25 (≤200.000) / $ 2,50 (>200.000)

$ 10,00 (≤200.000) / $ 15,00 (>200.000)

Google Vertex AI-prijzen

Grok 4 (grok-4-0709)

$ 3,00

$ 15,00

xAI-API

Mondiale expansie: producten en platforms

Parallel aan de modelrelease breidt Baidu zich internationaal uit:

  • GenFlow 3.0dat nu meer dan 20 miljoen gebruikers heeft, is de grootste AI-agent voor algemene doeleinden van het bedrijf en biedt verbeterd geheugen en multimodaal taakbeheer.

  • Bekendeen automatisch evoluerende agent die complexe problemen dynamisch kan oplossen, is nu op uitnodiging commercieel verkrijgbaar.

  • Angstde internationale versie van Baidu’s Miaoda codevrije builder is wereldwijd beschikbaar via medo.dev.

  • Oreatoeen productiviteitswerkruimte met ondersteuning voor documenten, dia’s, afbeeldingen, video’s en podcasts heeft wereldwijd meer dan 1,2 miljoen gebruikers bereikt.

Het digitale menselijke platform van Baidu, dat al in Brazilië is gelanceerd, maakt ook deel uit van de mondiale impuls. Volgens bedrijfsgegevens maakte 83% van de livestreamers tijdens het “Double 11” winkelevenement van dit jaar in China gebruik van de digitale menselijke technologie van Baidu, wat bijdroeg aan een stijging van 91% in GMV.

Ondertussen heeft Baidu’s autonome taxidienst Apollo Go de grens van 17 miljoen ritten overschreden, exploiteert het zelfrijdende wagenparken in 22 steden en claimt het de titel van ’s werelds grootste robotaxinetwerk.

Het open source visuele taalmodel trekt de aandacht van de industrie

Twee dagen vóór het vlaggenschipevenement ERNIE 5.0 bracht Baidu ook een open source multimodale sjabloon uit onder de Apache 2.0-licentie: ERNIE-4.5-VL-28B-A3B-Denken.

ALS gerapporteerd door mijn collega Michael Nuñez bij VentureBeathet model activeert slechts 3 miljard parameters terwijl het een totaal van 28 miljard behoudt, waarbij gebruik wordt gemaakt van een Mixture-of-Experts (MoE)-architectuur voor efficiënte gevolgtrekking.

Belangrijke technische innovaties zijn onder meer:

  • ‘Thinking with Images’, dat op zoom gebaseerde dynamische visuele analyse mogelijk maakt

  • Ondersteuning voor grafiekinterpretatie, documentbegrip, visuele basis en temporeel bewustzijn in video’s

  • Runtime op één enkele GPU van 80 GB, waardoor deze toegankelijk is voor middelgrote organisaties

  • Volledige compatibiliteit met Transformers, vLLM en Baidu FastDeploy-toolkits

Deze release verhoogt de druk op closed-sourceconcurrenten. Met de Apache 2.0-licentie wordt ERNIE-4.5-VL-28B-A3B-Thinking een levensvatbaar instapmodel voor commerciële toepassingen zonder licentiebeperkingen, iets wat maar weinig krachtige modellen in deze klasse bieden.

Communityfeedback en reactie van Baidu

Na de lancering van ERNIE 5.0 heeft ontwikkelaar en AI-evaluator Lisan al Gaib (@scaling01) plaatste een gemengde recensie op X. Hoewel ze aanvankelijk onder de indruk waren van de basisprestaties van het model, rapporteerden ze een aanhoudend probleem waarbij ERNIE 5.0 herhaaldelijk tools aanriep, zelfs als er expliciet werd opgedragen dat niet te doen, tijdens taken voor het genereren van SVG.

“ERNIE 5.0-benchmarks leken absurd totdat ik het testte…helaas heeft het RL-hersenbeschadiging of een ernstig probleem met het chat-/prompt-platform van het systeem”, schreef Lisan.

Binnen enkele uren, Baidu’s op ontwikkelaars gerichte ondersteuningsaccount, @ErnieforDevs, antwoordde:

“Bedankt voor de feedback! Het is een bekende bug – bepaalde syntaxis kan deze consistent activeren. We werken aan een oplossing. Voorlopig kun je proberen het bericht opnieuw te formuleren of te bewerken om dit te voorkomen.”

De snelle ommekeer weerspiegelt de groeiende nadruk van Baidu op communicatie met ontwikkelaars, vooral omdat het internationale gebruikers bevoordeelt via zowel propriëtaire als open source-aanbiedingen.

Vooruitzichten voor Baidu en zijn fundamentele LLM-familie ERNIE

Baidu’s ERNIE 5.0 markeert een strategische escalatie in de race naar het mondiale funderingsmodel. Met prestatieclaims die het op één lijn stellen met de meest geavanceerde systemen van OpenAI en Google, en een mix van premiumprijzen en open access-alternatieven, geeft Baidu blijk van zijn ambitie om niet alleen een binnenlandse AI-leider te worden, maar een geloofwaardige mondiale infrastructuuraanbieder.

In een tijd waarin zakelijke gebruikers van AI steeds meer eisen stellen aan multimodale prestaties, flexibele licentieverlening en efficiëntie bij de implementatie, zou Baidu’s tweesporenaanpak – premium gehoste API’s en open source-versies – de aantrekkingskracht ervan in zowel zakelijke als ontwikkelaarsgemeenschappen kunnen vergroten.

Het valt nog te bezien of de geclaimde prestaties van het bedrijf stand zullen houden bij tests door derden. Maar in een landschap van stijgende kosten, complexiteit van modellen en knelpunten in de verwerking geven ERNIE 5.0 en het ondersteunende ecosysteem Baidu een concurrentiepositie in de volgende golf van AI-implementatie.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in