GPT-4o, le dernier modèle phare d’OpenAI, a reçu des sentiments mitigés de la part des utilisateurs. Si certains sont impressionnés par sa rapidité et ses capacités multimodales, d’autres sont déçus par le fait qu’il ne présente aucune amélioration en termes d’intelligence et de raisonnement par rapport à GPT-4. Mais que vous soyez une équipe « époustouflée » ou une équipe « meh », il est toujours difficile d’ignorer le fait que les capacités multimodales de GPT-4o changent la donne.
Voici certaines manières dont GPT-4o pourra vous aider après qu’OpenAI ait publié les nouvelles capacités vocales et visuelles.
Partenaire d’apprentissage/Tuteur
Grâce aux capacités du GPT-40, il pourrait être le partenaire d’apprentissage idéal ou un tuteur. Vous pouvez l’utiliser pour apprendre des langues ou obtenir de l’aide pour résoudre des problèmes mathématiques. Vous pouvez pointer du doigt des objets pour obtenir de l’aide pour l’apprentissage des langues ou partager vos questions mathématiques avec eux. Il ne se contentera pas de vous donner les réponses ou de faire vos devoirs à votre place.
https://www.youtube.com/watch?v=_nSmkyDNulk
Il peut créer une série de questions pour vous aider à comprendre le concept et à résoudre vous-même le problème, comme un vrai tuteur. De plus, grâce à ses capacités avancées, il est capable de gérer une situation « avec empathie ». Ainsi, pendant qu’il vous enseigne, il peut faire preuve d’une patience et d’une empathie incroyables, vous poussant dans la bonne direction, sans être frustré. Pour beaucoup de gens, cela peut parfois être assez difficile à obtenir dans la vraie vie.
Les autres applications seraient encore plus intrigantes si vous pouviez utiliser GPT-4o sur des lunettes intelligentes (en reprenant l’idée du projet Astra de Google) pour avoir toujours votre partenaire d’apprentissage à vos côtés.
Obtenez de l’aide pour la préparation des entretiens
ChatGPT, lorsqu’il est alimenté par GPT-4o, peut être le partenaire ultime dans la préparation des entretiens. Bien que vous puissiez déjà simuler une conversation aller-retour avec ChatGPT pour préparer un entretien et que cela puisse aider à en comprendre les aspects techniques de manière assez fantastique, le processus n’était pas aussi naturel en raison de facteurs tels que la latence et l’absence de multimodalité au cœur de ChatGPT.
Mais grâce à ses capacités de raisonnement améliorées au niveau de la voix et de la vision, il peut aller encore plus loin en vous aidant. Pour commencer, avec sa nouvelle capacité à vous « voir », il peut même vous guider sur la partie esthétique de la préparation à l’entretien, comme votre tenue vestimentaire.
https://www.youtube.com/watch?v=wfAYBdaGVxs
Cependant, les implications sont bien plus importantes. Grâce à ses capacités visuelles et à sa capacité à interpréter les émotions humaines, il peut même vous fournir des retours sur votre langage corporel, un peu comme un véritable coach.
Assistante de réunion
ChatGPT peut participer à vos réunions, écouter vos appels et transcrire, résumer et même présenter ses avis, le tout en temps réel, tel un véritable assistant.
Vous pouvez lui demander ce qui a été discuté lors de l’appel, quel était le point de vue de chacun sur un certain point de vue, identifier des points de vue contradictoires, travailler sur des problèmes d’analyse de données, rechercher certaines informations et bien plus encore.
Traducteur de langue personnel
GPT-4o peut être un excellent assistant de traduction linguistique. Il peut traduire une conversation en temps réel, sans avoir besoin de la réinviter plusieurs fois. Ainsi, vous pouvez avoir une conversation normale dans différentes langues, et chaque fois qu’un locuteur a fini de parler, ChatGPT le traduirait dans la deuxième langue.
En quoi est-ce différent de l’utilisation de Google Translate ou de tout autre outil de traduction ? Outre le fait que vous n’avez pas besoin d’activer la traduction à chaque fois et que la conversation reste naturelle, la capacité de GPT-4o à comprendre l’intonation derrière les mots signifie que moins de pertes sont perdues dans la traduction.
Assistante d’accessibilité pour les aveugles
ChatGPT-4o, grâce à ses capacités visuelles, peut aider les personnes malvoyantes en regardant votre environnement à votre place et en vous décrivant tout cela.
https://www.youtube.com/watch?v=KwNUJ69RbwY
Bien que cela semble plutôt ambitieux dans son état actuel, imaginez les implications si vous pouviez avoir GPT-4o dans des lunettes intelligentes, comme les lunettes Meta Rayban, où GPT-4o pourrait littéralement être les yeux d’une personne malvoyante. Même dans sa forme actuelle, il est plutôt étonnant que les gens puissent pointer l’appareil photo de leur téléphone vers quelque chose et qu’il puisse fournir tous les détails.
Si ChatGPT pouvait devenir capable d’interpréter la langue des signes, il pourrait même aider les personnes sourdes à l’avenir.
Capacités de surveillance
ChatGPT-4o peut « potentiellement » être utilisé pour surveiller les enfants, les animaux domestiques, les malades et les personnes âgées, ou même simplement des choses comme les portes d’entrée, etc. Imaginez que vous deviez vous éloigner un instant et que vous souhaitiez que quelqu’un surveille votre enfant ou votre animal de compagnie et vous alerter immédiatement s’ils se livrent à des activités dangereuses (que vous pouvez définir).
Même s’il faudra un certain temps avant que vous puissiez faire confiance à l’IA pour ne pas commettre d’erreurs et fournir des résultats fiables à chaque fois, il s’agit certainement d’un cas d’utilisation possible et passionnant pour l’avenir.
Assistant de codage
Grâce à ChatGPT pouvant accéder à votre écran grâce au partage d’écran, vous pouvez avoir un assistant de codage à vos côtés et vous guider tout au long. Bien que cela soit également utile avec d’autres applications, grâce aux capacités de codage améliorées de GPT-4o, obtenir de l’aide pour le codage sera la meilleure application.
L’analyse des données
GPT-4o présente des améliorations étonnantes en termes de vitesse par rapport à GPT-4 Turbo, et il apporte également cette vitesse à l’analyse des données. Il peut traiter des feuilles de calcul, analyser des données et même créer des diagrammes statistiques, des graphiques et des tableaux en moins de 30 secondes.
Création de modèles 3D
GPT-4o peut même créer des fichiers STL pour des modèles 3D à partir d’invites de texte unique, accélérant ainsi le processus de visualisation et de prototypage. Ainsi, que vous souhaitiez accélérer votre flux de travail ou que vous soyez quelqu’un qui ne possède pas les connaissances techniques autrement requises pour cette tâche, ChatGPT peut vous aider !
J’ai utilisé GPT-4o pour créer un fichier STL pour un modèle 3D en environ 20 secondes sur mon téléphone. C’est assez remarquable ce que vous pouvez générer avec l’IA et une invite simple maintenant. pic.twitter.com/2fbObrpPol
– Min Choi (@minchoi) 14 mai 2024
Créer des caractères cohérents
OpenAI a introduit les capacités de génération d’images de DALL-E dans ChatGPT il y a quelque temps. Mais avec GPT-4o, vous pouvez créer plusieurs images du même personnage tout en conservant la cohérence des personnages. Ainsi, vous pouvez désormais utiliser ChatGPT pour créer des personnages cohérents pour vos histoires et en créer des images dans différentes actions.
Transcrire des notes manuscrites
Grâce aux capacités accrues de GPT-4o en matière de reconnaissance d’images, il peut désormais mieux transcrire les notes manuscrites. Vous pouvez l’utiliser pour numériser vos notes scolaires ou universitaires. Il démontre même d’étonnantes capacités de transcription lors du traitement de lettres manuscrites du XVIIIe siècle. Ainsi, même s’il y aura des erreurs, cela accélérera également l’ensemble du processus de manière exponentielle !
GPT-4o est vraiment remarquable sur la 18ème écriture. Je lui ai remis la lettre suivante et lui ai demandé une transcription. Quelques erreurs très mineures… incroyable ! pic.twitter.com/3JevZvd5p5
– Histoire générative (@HistoryGPT) 14 mai 2024
Bien que GPT-4o ne constitue pas une énorme mise à niveau par rapport à GPT-4 en termes d’intelligence et de raisonnement, ce n’est en aucun cas une petite mise à niveau. Même si vous êtes quelqu’un de plus effrayé par son anthropomorphisme ou ses similitudes avec l’IA de Scarlett Johannsen dans Her, vous ne pouvez pas nier que le fait qu’elle soit devenue plus intelligente sera utile de manière pratique.
Cependant, il existe également un autre fait qui ne peut être négligé lors de l’examen des applications pratiques de GPT-4o : la fenêtre contextuelle de 128 Ko de ChatGPT. Avec une fenêtre contextuelle limitée, ChatGPT ne peut être que très utile dans des scénarios tels que celui d’assistant de réunion ou de traducteur de langue. La question de savoir combien de temps après le début de la réunion/conversation la fenêtre contextuelle de ChatGPT s’épuisera est extrêmement valable. Il y a aussi la question des plafonds d’utilisation limités pour GPT-4o.
Laisser un commentaire