- Robots blijven snel falen als ze eenmaal uit voorspelbare fabrieksomgevingen zijn verwijderd
- Microsoft Rho-alpha koppelt taalbegrip rechtstreeks aan robotische bewegingsbesturing
- Aanraakdetectie is van cruciaal belang om de kloof tussen software en fysieke actie te verkleinen
Robots functioneren al lang betrouwbaar binnen strak gecontroleerde industriële omgevingen met voorspelbare omgevingen en beperkte afwijkingen, maar daarbuiten hebben ze het vaak moeilijk.
Om dit probleem te verlichten, Microsoft kondigde hij aan Rho-alfahet eerste roboticamodel afgeleid van de Phi Vision-Language-serie, dat stelt dat robots betere manieren nodig hebben om instructies te zien en te begrijpen
Het bedrijf gelooft dat systemen buiten de assemblagelijnen kunnen werken door te reageren op veranderende omstandigheden in plaats van rigide scripts te volgen.
Waar is Rho-alpha voor ontworpen
Microsoft koppelt dit aan wat gewoonlijk fysieke AI wordt genoemd, waarbij van softwaremodellen wordt verwacht dat ze machines door minder gestructureerde situaties leiden.
Het combineert taal, perceptie en actie, waardoor de afhankelijkheid van productielijnen of vaste instructies wordt verminderd.
Rho-alpha vertaalt natuurlijke taalopdrachten in robotbesturingssignalen en richt zich op bimanuele manipulatietaken, waarvoor coördinatie tussen twee robotarmen en fijnmazige besturing vereist is.
Microsoft karakteriseert het systeem als een uitbreiding van de typische VLA-benaderingen door zowel de perceptie als de leerinput uit te breiden.
“De opkomst van vision-taal-actie (VLA)-modellen voor fysieke systemen zorgt ervoor dat systemen met toenemende autonomie naast mensen kunnen waarnemen, redeneren en handelen in veel minder gestructureerde omgevingen”, zegt Ashley Llorens, Corporate Vice President en Managing Director, Microsoft Research Accelerator
Rho-alpha omvat tactiele detectie samen met visie, met aanvullende detectiemodaliteiten zoals kracht, die in ontwikkeling is.
Deze ontwerpkeuzes suggereren een poging om de kloof tussen gesimuleerde intelligentie en fysieke interactie te verkleinen, hoewel de effectiviteit ervan nog steeds wordt geëvalueerd.
Een centraal onderdeel van de aanpak van Microsoft is gebaseerd op simulatie om beperkte robotgegevens op schaal aan te pakken, met name gegevens waarbij aanraking betrokken is.
Synthetische trajecten worden gegenereerd door middel van intern versterkend leren Nvidia Isaac Sim, vervolgens gecombineerd met fysieke demonstraties uit commerciële en open datasets.
“Het trainen van basismodellen die kunnen redeneren en handelen vereist het overwinnen van de schaarste aan diverse, real-world data”, zegt Deepu Talla, Vice President van Robotics en Edge AI, Nvidia.
“Door NVIDIA Isaac Sim op Azure in te zetten om fysiek nauwkeurige synthetische datasets te genereren, versnelt Microsoft Research de ontwikkeling van veelzijdige modellen zoals Rho-alpha die complexe manipulatietaken aankunnen.”
Microsoft legt ook de nadruk op menselijke corrigerende input tijdens de implementatie, waardoor operators kunnen ingrijpen met behulp van teleoperatie-apparaten en feedback kunnen geven waar het systeem in de loop van de tijd van kan leren.
Deze trainingscyclus combineert simulatie, gegevens uit de echte wereld en menselijke correctie, wat een groeiende afhankelijkheid van deze hulpmiddelen weerspiegelt Hulpmiddelen voor kunstmatige intelligentie om de schaarste aan ingebouwde datasets te compenseren.
Professor Abhishek Gupta, assistent-professor aan de Universiteit van Washington, zei: “Hoewel het genereren van trainingsgegevens via robotsystemen voor teleoperaties standaardpraktijk is geworden, zijn er veel contexten waarin teleoperaties onpraktisch of onmogelijk zijn.”
“We werken samen met Microsoft Research om pre-training datasets verzameld door fysieke robots te verrijken met verschillende synthetische demonstraties met behulp van een combinatie van simulatie en versterkend leren.”
Volg TechRadar op Google Nieuws EN voeg ons toe als uw favoriete bron om nieuws, recensies en meningen van onze experts in uw feeds te krijgen. Klik dan zeker op de knop Volgen!
En jij kunt dat natuurlijk ook Volg TechRadar op TikTok voor nieuws, recensies, unboxing in videoformaat en ontvang regelmatig updates van ons WhatsApp ook.



