Google a présenté Veo, son nouveau modèle d’intelligence artificielle générative pour la création de vidéos. Pour l’instant, le modèle a été mis à la disposition d’un groupe restreint de développeurs et de chercheurs dans le cadre de la plateforme Google Vertex AI.
Google Veo est capable de générer des vidéos haute définition 1080p à partir d’invites textuelles ou d’images existantes, tout en parvenant à maintenir une grande cohérence visuelle entre les images. La technologie est basée sur une architecture de diffusion, similaire à celle utilisée dans d’autres modèles de génération d’images, mais optimisée spécifiquement pour la production de contenu vidéo. Google précise également qu’il a mis en place plusieurs mesures de sécurité, notamment des filigranes numériques invisibles et des filtres pour les contenus inappropriés, afin de garantir une utilisation responsable de la technologie.
Au cours de cette phase de prévisualisation, les développeurs pourront expérimenter le modèle via une interface API dédiée. Google a précisé que cette version limitée visait à recueillir les commentaires de la communauté des développeurs avant une éventuelle distribution plus large.
Google a également annoncé simultanément le lancement d’Imagen 3, la dernière évolution de son modèle texte-image, qui sera disponible la semaine prochaine via Vertex AI pour tous les clients de Google Cloud.
Le lancement de Veo par Google est un gant important jeté à OpenAI, qui a pris du retard et se trouve même dans une situation délicate pour lancer Sora d’ici l’année 2025.