OpenAI dévoile la première série de modèles de raisonnement : lancement d’o1

Au milieu du buzz autour de la sortie attendue du projet Strawberry d’OpenAI, la société a lancé son dernier modèle, OpenAI o1. Bien que n’étant pas officiellement nommé Strawberry, cette version présente des capacités de raisonnement avancées qui ont suscité de nombreuses spéculations.

En plus d’OpenAI o1, il existe une variante plus abordable appelée OpenAI o1 mini. Cette évolution s’inscrit dans la continuité de la tendance d’OpenAI à proposer des modèles plus petits pour mieux accompagner les développeurs, suite à l’introduction de GPT-4o mini.

Le nom o1 signifie un nouveau départ, réinitialisant le système de dénomination qui était devenu quelque peu alambiqué avec les modèles précédents.

Il est important de noter que le o1 présente des coûts d’exploitation plus élevés que les modèles existants, ainsi que des temps de réponse plus lents. Cependant, la version actuelle n’est qu’un « aperçu » reflétant sa phase de développement précoce.

OpenAI o1 est nettement différent des modèles GPT, bénéficiant d’une méthodologie de formation unique qui utilise un nouvel algorithme d’optimisation et un nouvel ensemble de données.

Ce modèle innovant excelle dans la résolution de problèmes complexes dans des domaines tels que la science, le codage et les mathématiques grâce à un raisonnement amélioré. OpenAI o1 utilise l’apprentissage par renforcement pour résoudre les problèmes, en intégrant un mécanisme de récompense et de punition. Contrairement aux modèles précédents qui prédisaient principalement le mot suivant, o1 intègre une « chaîne de pensée » incitant à répondre efficacement aux requêtes. Cette avancée représente une étape importante vers l’obtention d’une intelligence de type humain, conduisant à une précision améliorée et à une réduction des tendances aux hallucinations (bien qu’elle soit toujours sujette à des inexactitudes occasionnelles).

Lorsqu’une invite lui est présentée, o1 articulera son processus de réflexion, démontrant des améliorations notables dans ses capacités de raisonnement par rapport aux modèles précédents. Par exemple, o1 a obtenu un score impressionnant de 83 % à l’Olympiade internationale de mathématiques (IMO), tandis que GPT-4o n’a obtenu que 13 %.

Malgré sa capacité à raisonner et à partager ses processus de pensée, il existe une limite imposée au temps de réflexion. Les utilisateurs peuvent recevoir un message du type : « Oh, je n’ai plus beaucoup de temps, laissez-moi obtenir une réponse rapidement », comme le rapporte The Verge.

Alors que o1 est capable de résoudre des problèmes complexes nécessitant des connaissances générales approfondies, o1 mini est mieux adapté au codage, aux mathématiques et aux tâches scientifiques qui ne nécessitent pas une compréhension approfondie des connaissances générales. De plus, o1 mini est nettement plus abordable, étant près de 80 % moins cher que o1.

Actuellement, o1 ne dispose pas des fonctionnalités présentes dans GPT-4o, telles que la navigation sur Internet ou l’acceptation de fichiers/images en tant qu’entrées, bien qu’OpenAI travaille activement à l’intégration de ces capacités. Les modèles o1 sont spécifiquement conçus pour les utilisateurs ayant besoin de solutions à des problèmes complexes, notamment les chercheurs en santé, les physiciens, les économistes et les développeurs de logiciels.

Qui peut accéder au modèle ? À partir d’aujourd’hui, les utilisateurs de ChatGPT Plus et Team peuvent accéder à o1-preview et o1-mini. Les utilisateurs Edu et Enterprise y auront accès la semaine prochaine. Les utilisateurs du plan ChatGPT Free n’auront pas d’accès immédiat, mais OpenAI a pour objectif de fournir un accès à o1-mini aux utilisateurs gratuits à l’avenir.

Les limites d’utilisation pour les deux modèles sont fixées à 30 messages hebdomadaires pour o1 et 50 pour o1-mini, avec des projets d’augmenter ces restrictions à l’avenir.

En termes de prix, l’API pour o1 est relativement chère ; o1-preview coûte 15 $ par million de jetons d’entrée et 60 $ par million de jetons de sortie. En revanche, GPT-4o coûte 5 $ par million de jetons d’entrée et 15 $ par million de jetons de sortie.

Comment accéder aux modèles ? Les utilisateurs peuvent basculer entre o1 et o1-mini à partir du menu ChatGPT. OpenAI travaille également à l’automatisation de la sélection de modèles en fonction des invites de l’utilisateur à l’avenir.

Le lancement d’o1 et d’o1-mini souligne l’engagement d’OpenAI en matière d’innovation, ce qui le distingue de ses concurrents. Si le modèle peut exécuter avec succès des tâches de raisonnement complexes, il pourrait représenter une avancée significative vers l’intelligence artificielle générale (AGI). Cependant, certains retours initiaux indiquent que o1 pourrait avoir des difficultés avec les tâches de raisonnement de base.

Le nouveau O1 échoue toujours lamentablement aux questions triviales par
u/knowledgehacker dans
ChatGPT

Alors qu’OpenAI continue de développer la série o1, les utilisateurs espèrent que les futures mises à jour amélioreront les performances du modèle. En outre, OpenAI prévoit de continuer à déployer de nouveaux modèles au sein de la série GPT, ce qui laisse planer les attentes d’un éventuel GPT-5.

Source