Meta a annoncé la sortie de Llama 3.1, son dernier modèle d’intelligence artificielle open source le plus avancé. Cette nouvelle version représente un bond en avant significatif dans la technologie de l’IA, Meta affirmant qu’elle surpasse les principaux modèles propriétaires d’entreprises comme OpenAI.
Le modèle phare Llama 3.1 405B, doté de 405 milliards de paramètres, est désormais le plus grand modèle de base disponible au public. Il démontre des capacités de pointe en matière de connaissances générales, de mathématiques, d’utilisation d’outils et de traduction multilingue. Le modèle a été formé sur plus de 15 000 milliards de jetons en utilisant plus de 16 000 GPU H100 de Nvidia.
L’une des principales améliorations de Llama 3.1 est la longueur de contexte étendue de 128 000 jetons, soit 16 fois la capacité des modèles Llama précédents. Cela permet à l’IA de traiter et de comprendre des passages de texte beaucoup plus longs, améliorant ainsi sa capacité à gérer des tâches complexes et à générer des réponses plus nuancées.
Le nouveau modèle prend en charge huit langues : anglais, allemand, français, italien, portugais, hindi, espagnol et thaï. Cette capacité multilingue fait de Llama 3.1 un outil polyvalent pour les développeurs et les entreprises travaillant sur des applications d’IA mondiales.
Meta publie Llama 3.1 en trois tailles : paramètres 405B , 70B et 8B . Chaque taille est optimisée pour différents cas d’utilisation :
- Le modèle 405B est idéal pour les applications d’entreprise et la recherche avancée, capable de générer du texte long, de traduire en plusieurs langues, de coder et de réaliser des tâches de raisonnement complexes.
- Le modèle 70B est adapté à la création de contenu, à l’IA conversationnelle et à la compréhension du langage.
- Le modèle 8B est conçu pour les applications avec des ressources de calcul limitées, telles que les appareils mobiles.
Pour faciliter l’adoption, Meta collabore avec de grandes entreprises technologiques comme Amazon, Google et Databricks pour rendre Llama 3.1 disponible sur diverses plateformes. Par exemple, les modèles sont désormais accessibles sur Amazon Web Services (AWS) via des services comme Amazon SageMaker JumpStart et Amazon Bedrock.
Mark Zuckerberg, PDG de Meta, souligne l’importance de l’IA open source, affirmant qu’elle est essentielle à la démocratisation des avantages de l’IA. Il estime que les modèles open source comme Llama 3.1 finiront par surpasser les modèles propriétaires en termes de capacités et de taux d’adoption.
La sortie de Llama 3.1 s’accompagne également d’une licence mise à jour qui permet aux développeurs d’utiliser les résultats du modèle pour améliorer d’autres systèmes d’IA. Cette évolution devrait accélérer l’innovation dans le domaine de l’IA et offrir aux développeurs davantage de flexibilité dans la création et la personnalisation d’applications d’IA.
L’engagement de Meta en faveur de l’IA open source rappelle la façon dont Linux est devenu le système d’exploitation open source dominant pour de nombreux appareils et serveurs. L’entreprise espère que Llama 3.1 deviendra également une pierre angulaire du développement de l’IA.
Alors que l’IA continue d’évoluer rapidement, la sortie de Llama 3.1 marque une étape importante dans l’accessibilité des puissants modèles d’IA aux développeurs et aux entreprises du monde entier. Elle ouvre la voie à une nouvelle ère d’innovation en matière d’IA, où les modèles open source concurrencent directement, voire surpassent, leurs homologues propriétaires.
Laisser un commentaire