Le lancement de Sora d’OpenAI a ouvert la porte à des applications de génération vidéo basées sur l’IA, capables de créer de courts clips à partir d’invites de texte. Aujourd’hui, Google s’est également lancé dans la mêlée en annonçant sa propre application d’IA génératrice de vidéos, Veo, lors de sa conférence annuelle des développeurs d’E/S cette semaine.
Cependant, tout comme la plupart des autres outils d’IA récemment annoncés, le nouveau générateur vidéo n’est pas encore disponible pour un usage public. Google prévoit de permettre aux artistes et aux créateurs d’essayer l’outil via des exercices participatifs, ce qui peut contribuer à l’améliorer. Voici ce que nous avons appris d’autre sur Google Veo.
Que peut faire Veo ?
Google Veo peut générer des vidéos 1080p d’une durée supérieure à une minute et vous pouvez également les modifier via des instructions écrites. Il peut garantir que les cadres sont visuellement cohérents et les utilisateurs peuvent utiliser une seule invite ou une série d’invites qui créent un récit. L’outil peut inclure des effets cinématographiques comme des prises de vue aériennes et créer des scènes très détaillées.
Vous pouvez opter pour le réalisme, le surréalisme et même l’animation lors de la création de vidéos avec Veo. En plus de cela, il vous permet d’utiliser des commandes de réalisation de films et comprend des termes tels que « prise de vue aérienne » et « timelapse ». Par rapport aux précédents générateurs vidéo IA annoncés par Google, Veo offre un meilleur contrôle tout en fournissant des vidéos de meilleure qualité.
Veo prend également en charge l’édition masquée, qui vous permet d’effectuer des ajustements sur des sections spécifiques de la vidéo. Vous pouvez le faire en incluant une zone de masque dans l’invite, et les images peuvent également être utilisées avec des invites textuelles pour générer des vidéos.
Dans un tel cas, il utilisera l’image fournie comme référence et générera une vidéo dans le même style, comme la vidéo suivante qui a été générée à l’aide d’une image d’alpagas portant des pulls tricotés et de l’invite Alpacas dancing to the beat
.
Comment fonctionne Véo ?
Les modèles d’IA vidéo doivent comprendre correctement l’invite qui leur est fournie et combiner ces informations avec les références disponibles. Veo a été conçu pour être exceptionnellement performant dans la compréhension du langage naturel et des visuels, ce qui lui permet de générer des vidéos avec précision, y compris celles comportant plusieurs détails.
Pour cette raison, une invite comme Timelapse of a common sunflower opening, dark background
peut vous fournir une vidéo de très haute qualité.
Selon Google, Veo améliore d’autres outils de génération vidéo annoncés précédemment par la société, tels que Lumiere, VideoPoet, WALT, etc., en utilisant des utilisations de vidéos latentes compressées. Contrairement à ces outils, Veo est formé aux sous-titres vidéo détaillés, ce qui aide l’IA à mieux comprendre les invites.
Google déclare que le générateur vidéo s’appuie sur des transformateurs de diffusion latente, qui garantissent la cohérence et empêchent les personnages et les objets de scintiller et de sauter entre les scènes. Il utilise également des latents, qui sont des représentations compressées de la vidéo qui la rendent plus efficace et contribuent à améliorer les performances. Grâce à cela, Veo peut générer des vidéos de haute qualité en moins de temps.
Les vidéos que vous générez à l’aide de Veo seront filigranées à l’aide du SynthID de Google, qu’il utilise pour identifier le contenu généré par l’IA, similaire à ce que fait Sora d’OpenAI via la norme Coalition for Content Provenance and Authenticity (C2PA).
De plus, il existe des processus de vérification de la mémorisation et des filtres de sécurité pour aider à réduire les risques de partialité, de droits d’auteur et de confidentialité. Malgré ces technologies et processus, Veo a encore besoin d’être amélioré, car les arrière-plans ont encore tendance à changer et les zones très détaillées ne semblent pas très bien assemblées. C’est pourquoi Google n’autorise que quelques créateurs à le tester.
Comment utiliser Veo ?
Comme mentionné ci-dessus, Veo n’est actuellement pas disponible pour un usage public et Google n’autorise que quelques créateurs sélectionnés à essayer l’outil. Ils peuvent l’essayer en utilisant VideoFX, un autre outil expérimental disponible dans Google Labs, où sont présents tous les produits Google en cours de test.
Si vous êtes créateur et souhaitez tester Veo,
- Visitez le site Web de Google Labs pour rejoindre la liste d’attente.
- Entrez vos coordonnées et soumettez-les.
- Attendez que Google vérifie votre soumission. S’il le juge approprié, vous serez autorisé à essayer Veo.
Google Veo est le dernier d’une longue lignée de générateurs vidéo basés sur l’IA annoncés par Google et semble être le plus puissant à ce jour. Il peut non seulement vous permettre de créer des vidéos en utilisant différents styles et effets, mais également de modifier facilement les vidéos créées.
Nous avons expliqué comment les créateurs peuvent s’inscrire sur la liste d’attente et essayer l’outil par eux-mêmes, mais on ne sait pas si Veo sera lancé publiquement. Google a seulement laissé entendre que certaines des capacités de l’outil pourraient être intégrées dans des courts métrages YouTube, il y a donc de quoi s’attendre.
Laisser un commentaire