L’événement Made by Google de Google s’est officiellement terminé, au cours duquel la société a lancé la dernière gamme de ses smartphones phares de la série Pixel. Les rumeurs tournent à plein régime depuis quelques semaines à ce sujet et de nombreuses rumeurs se sont finalement transformées en réalité. De plus, comme prévu, l’événement a également compté plus d’une mention – en fait beaucoup – de l’IA.
Parmi les autres annonces importantes concernant l’IA, l’une d’entre elles a été le lancement de Gemini Live. Google a annoncé Gemini Live lors de sa conférence I/O plus tôt cette année. Il est enfin disponible pour les abonnés Gemini Advanced sur Android en anglais, et sera bientôt déployé dans d’autres langues et sur iOS (via l’application Google).
Avec Gemini Live, Gemini est désormais capable de tenir des conversations plus naturelles et bidirectionnelles. Vous pouvez également l’interrompre au milieu d’une réponse, comme dans toute conversation naturelle. Vous pouvez accéder à l’application Gemini sur Android pour converser avec le chatbot.
Cette fonctionnalité est similaire à l’expérience du mode vocal avancé dans l’application ChatGPT qui est désormais disponible en version alpha limitée pour les utilisateurs de ChatGPT Plus. Pour une fois, Google s’est placé devant OpenAI dans le calendrier de sortie en lançant un déploiement plus large.
Gemini Live est également disponible en mode mains libres, ce qui vous permet de parler à Gemini en arrière-plan ou même lorsque votre téléphone est verrouillé. Vous pouvez également quitter les conversations en cours et y revenir plus tard.
Google déploie Gemini Live dans 10 nouvelles voix pour que vos conversations avec l’IA soient encore plus authentiques ; vous pouvez choisir la voix et le ton qui vous conviennent.
Notamment, Gemini Live ne peut pas simuler d’autres voix que les 10 voix disponibles dans l’application, peut-être pour éviter les problèmes de droits d’auteur. ChatGPT-4o suit la même politique. Il y a un domaine dans lequel Gemini Live n’est pas le même que le mode vocal de ChatGPT-4o. Le premier ne peut pas comprendre vos émotions à partir de votre ton, ce que OpenAI a démontré que son chatbot pouvait faire.
De plus, il existe également une fonctionnalité de Gemini Live que Google a présentée lors de la conférence I/O et qui ne sera pas disponible au lancement. Oui, nous parlons d’entrées multimodales. Si vous ne savez pas de quoi il s’agit, ne vous inquiétez pas. Voici un récapitulatif : avec les entrées multimodales, Gemini Live peut prendre des entrées de l’appareil photo de votre téléphone (photos et vidéos) en temps réel et répondre à toutes vos questions ou vous aider à identifier les objets que vous pointez. Par exemple, vous pouvez le pointer vers un équipement de DJ et lui demander d’identifier le nom d’une partie ou vous pouvez le pointer sur votre écran et demander à quoi sert une certaine partie d’un code.
Mais les fonctionnalités multimodales sont retardées pour l’instant et Google a seulement déclaré qu’elles arriveraient plus tard cette année, sans plus de détails. Il est intéressant de noter que le mode vocal avancé de ChatGPT-4o est également censé avoir des capacités similaires, mais il n’a pas non plus été lancé avec le déploiement alpha limité.
Notamment, Gemini Live est une étape importante sur la voie de la concrétisation du projet Astra par Google.
Parler à un chatbot est parfois bien plus pratique que de taper quelque chose, surtout lorsque vous voulez réfléchir à quelque chose. Et avec Gemini Live, la conversation peut être beaucoup plus fluide. Ou si l’on en croit les démonstrations en direct de l’événement Made by Google, elle est assez fluide. (Le chatbot a apparemment eu des hallucinations pendant la démonstration en direct et il y a quelques frictions lors de la mise en place de la fonction « interrompre Gemini au milieu » pour la tester). Voyons comment cela se passe dans le monde réel, hein ? Préparez-vous à tester Gemini Live sur votre Pixel, Samsung ou d’autres appareils Android au cours des prochaines semaines, à partir d’aujourd’hui.
Laisser un commentaire