Waymo explore l’utilisation des grands modèles de langage pour les voitures autonomes
Les modèles d’IA Gemini de Google révolutionnent déjà notre quotidien en répondant à nos questions, en nous assistant dans nos tâches d’organisation, en rédigeant des documents ou en développant des applications. Mais à l’avenir, ces modèles pourraient également être utilisés pour la conduite de véhicules autonomes. Waymo, la filiale d’Alphabet spécialisée dans les véhicules autonomes et les robotaxis, explore cette nouvelle piste en s’appuyant sur la technologie Gemini.
Aujourd’hui, Waymo occupe une place prépondérante dans l’industrie. La filiale d’Alphabet propose déjà un service concurrent d’Uber utilisant des voitures autonomes dans plusieurs villes américaines, avec plus de 150 000 courses effectuées chaque semaine. Toutefois, malgré la satisfaction actuelle des technologies utilisées, Waymo cherche à améliorer ses véhicules autonomes en intégrant l’intelligence de Gemini.
Récemment, Waymo a publié un article scientifique décrivant une nouvelle technologie nommée « End-to-End Multimodal Model for Autonomous Driving ». Ce nouveau modèle, nommé EMMA, utilisant le modèle de langage multimodal Gemini de Google, est conçu pour générer les trajectoires futures des véhicules autonomes à partir des données des capteurs. Grâce à l’expertise de Gemini, EMMA est capable de mieux comprendre les scénarios complexes sur la route.
Pourquoi privilégier Gemini ?
Le système actuel de Waymo repose sur plusieurs modules indépendants pour gérer les diverses tâches liées à la conduite autonome. Bien que ce système présente l’avantage de faciliter le débogage et l’optimisation de chaque module individuellement, il souffre d’un problème d’évolutivité, ayant du mal à s’adapter à de nouveaux environnements non ciblés. L’utilisation des grands modèles de langage multimodaux, comme Gemini, pourrait résoudre ce problème en offrant une base générale et en permettant un raisonnement avancé.
Cependant, malgré le potentiel immense de l’intelligence artificielle générative pour les voitures autonomes, Waymo identifie encore des défis importants à relever. Par exemple, le système EMMA rencontre des limitations dans le traitement des vidéos et ne prend pas encore en charge les données des capteurs LiDAR. Malgré ces obstacles, Waymo reste confiant dans les avancées à venir, inspirant de nouvelles recherches et progrès dans le domaine de la conduite autonome.
En résumé
- Les modèles Gemini de Google ont un potentiel considérable pour améliorer la conduite autonome
- Waymo explore l’utilisation de ces modèles pour optimiser ses véhicules autonomes
- Cependant, des défis subsistent, notamment en termes de traitement des vidéos et de prise en charge de capteurs spécifiques
Il n’y a pas d’entrée similaire.