Qu’est-ce que Gemini Live et quand sera-t-il disponible

Qu’est-ce que Gemini Live et quand sera-t-il disponible

Google a récemment annoncé une série de mises à jour de son modèle Gemini AI, notamment plusieurs mises à niveau et de nouveaux modèles. Parmi ceux-ci, celui qui a retenu beaucoup d’attention était Gemini Live, un modèle d’IA multimodal doté de capacités vidéo et vocales.

Depuis que Bard a été renommé Gemini en février, le modèle d’IA remplace Google Assistant sur les appareils Android. Cependant, ce qu’il peut faire actuellement est assez limité. Avec Gemini Live, Google vise à changer cela en proposant un modèle d’IA plus puissant et plus polyvalent.

Qu’est-ce que Gemini Live ?

Pour offrir aux utilisateurs une expérience d’IA améliorée et pour adopter le ChatGPT amélioré GPT-4o d’OpenAI, Google a récemment annoncé Gemini Live lors de sa conférence des développeurs d’E/S. Gemini Live permettra aux utilisateurs d’avoir des conversations naturelles et personnalisées en temps réel avec la voix, et plus tard, la vidéo.

Le nouveau modèle d’IA fait partie du projet Astra de Google, qui est la tentative du géant de la recherche de créer un assistant d’IA universel capable d’utiliser différents types d’entrées de la vie quotidienne pour fournir une assistance. Par exemple, Gemini Live peut utiliser le texte, les visuels de l’appareil photo de votre smartphone et votre voix pour répondre aux questions.

Selon Google, le nouveau modèle de langage naturel aidera non seulement les utilisateurs à résoudre des problèmes et à effectuer diverses actions, mais il se sentira également complètement naturel lors des interactions. Les utilisateurs pourront lancer Gemini Live en appuyant sur l’icône vocale de leur téléphone, ce qui affichera l’IA en plein écran avec un effet de forme d’onde audio.

Vous pouvez alors converser avec l’IA comme vous le feriez avec un véritable assistant personnel. Un excellent exemple de la façon dont le modèle d’IA amélioré peut vous aider est lorsque vous lui demandez de vous aider dans la préparation d’un entretien. Gemini Live vous suggérera les compétences que vous pouvez mettre en valeur, vous fournira des conseils pour prendre la parole en public, et bien plus encore.

Caractéristiques

Gemini Live est livré avec quelques fonctionnalités qui en font un bien meilleur assistant IA que Google Assistant, Siri d’Apple ou Alexa d’Amazon.

Conversations vocales bidirectionnelles

Gemini Live vous permet de converser avec lui et fournit des réponses verbales de type humain, résultant en des conversations engageantes et intuitives. Par exemple, vous pouvez lui poser des questions sur la météo et il vous donnera une mise à jour précise et concise.

Capacités de l’assistant intelligent

Le modèle d’IA peut servir d’assistant intelligent et effectuer des tâches telles que résumer les informations des e-mails et mettre à jour votre calendrier. Par exemple, vous pouvez prendre une photo d’un flyer de concert et Gemini ajoutera l’événement à votre calendrier.

Capacités visuelles

En utilisant la caméra de votre smartphone, Gemini Live peut capturer des vidéos en temps réel. Cela lui permet d’identifier des objets et de répondre aux questions les concernant. À titre d’exemple, si vous pointez l’appareil photo de votre smartphone vers un haut-parleur et demandez à Gemini de l’identifier, il vous dira de quoi il s’agit et identifiera même sa marque et son modèle.

Source : Google

Comment fonctionne Gemini Live ?

Le projet Astra peut combiner des entrées vocales et visuelles, ce qui les rend faciles à comprendre pour le modèle d’IA. Il peut alors réagir aux informations et fournir l’assistance requise. Comme ChatGPT basé sur GPT-4o d’OpenAI, Gemini Live est une IA multimodale et ne repose pas uniquement sur le texte comme entrée.

Alors que Gemini Live utilisera à l’origine la saisie vocale pour collecter et analyser les données lors de la version initiale, il sera mis à niveau dans les mois à venir pour traiter et analyser également les vidéos en les décomposant image par image pour une meilleure compréhension et interaction.

L’IA peut s’adapter à la vitesse à laquelle les différents utilisateurs parlent, et vous pouvez même l’interrompre pour demander des éclaircissements ou fournir plus d’informations. Sa capacité à imiter le dialogue humain peut offrir une interaction plus engageante. Ainsi, vous pouvez avoir une conversation avec lui, tout comme avec un assistant humain. De plus, vous pourrez choisir entre dix voix différentes pour l’IA.

GPT-4o contre. Gémeaux en direct

Bien que GPT-4o et Gemini Live soient tous deux des modèles d’IA multimodaux, il est actuellement difficile de voir lequel fonctionne le mieux dans la vie réelle, d’autant plus qu’aucun des deux n’est disponible publiquement pour le moment.

Cependant, contrairement à ChatGPT, Gemini Live s’appuie sur d’autres modèles d’IA comme Google Veo et Imagen 3, pour fournir une sortie sous forme de vidéos et d’images. Malgré cela, dans les démos présentées par OpenAI et Google, ChatGPT semblait plus naturel et le nouveau modèle GPT-4o pouvait même détecter et simuler les émotions humaines à travers les tonalités vocales.

De plus, il peut s’adapter à la manière dont vous souhaitez qu’il réponde, ce que Gemini Live ne peut pas faire, du moins dans son état actuel.

Disponibilité Gemini Live

Gemini Live sera disponible pour les abonnés Gemini Advanced, qui est la version payante du chatbot IA. Il sera déployé dans les mois à venir et devrait être largement disponible d’ici la fin de l’année.

Des applications telles que Google Messages pourront tirer pleinement parti de Gemini Live, permettant aux utilisateurs d’interagir avec l’IA directement dans l’application de messagerie.

Gemini Live pourrait être la prochaine mise à niveau majeure du chatbot IA de Google, et exactement ce dont il a besoin pour affronter des concurrents comme ChatGPT d’OpenAI. Avec une fonctionnalité multimodale et de puissantes capacités vocales, le modèle mis à niveau peut aider Google à réussir en fournissant un assistant numérique polyvalent et fiable.

Pour l’instant, Google a seulement annoncé qu’il proposerait le nouveau modèle d’IA aux abonnés payants. Bien que cela laisse de côté les utilisateurs gratuits, qui constituent une grande partie de la base d’utilisateurs de Google, nous espérons que Google changera de position et décidera d’étendre la disponibilité de Gemini Live.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *