Tech&Co
Google

Google I/O: toutes les annonces de Google pour rivaliser avec ChatGPT

Google a dévoilé, lors de sa conférence dédiée aux développeurs, ses nouveautés en matière d'IA. Au menu: de la génération de vidéos mais aussi un outil dédiés aux musiciens.

Au tour de Google de faire ses grandes annonces IA. Si OpenAI a coupé l'herbe sous le pied du géant américain en dévoilant ce lundi 13 mai les nouvelles fonctionnalités de ChatGPT, son concurrent a tout de même consacré une bonne partie de sa conférence Google I/O, dédiée aux développeurs, à ce sujet. Voici ce qu'il faut retenir des annonces.

· Gemini 1.5 Flash: un modèle léger et plus rapide

Annoncé en décembre dernier, l'outil d'IA maison de Google, Gemini 1.5, a droit à une cure de jouvence. S'il existait trois modèles (Ultra, Pro et Nano), en voici une quatrième baptisée Flash.

Principalement dédiée aux entreprises qui pourront l'utiliser comme interface, Gemini 1.5 Flash se veut plus léger que la version Pro mais aussi plus efficace pour certaines tâches comme la synthèse de documents ou l'extraction de données. Une manière pour Google de proposer un modèle moins coûteux.

· Gemini 1.5 Pro: un modèle puissant et plus efficace

Le modèle star de Google gagne en efficacité. "1.5 Pro peut désormais suivre des instructions de plus en plus complexes et nuancées" assure Google qui a ajouté la compréhension de l'audio et des images. Une manière de se rapprocher des dernières versiones de ChatGPT même s'il est encore un peu tôt avant de savoir qui est devant.

Parmi les exemples concrets, Google évoque la possibilité de faire analyser des contrats à Gemini 1.5 Pro, afin de poser des questions à la machine pour mieux les comprendre.

· Projet Astra: l'avenir de l'agent conversationnel

Comment répondre à OpenAI? Google a évoqué un "projet Astra", présenté comme "l'avenir des assistants IA".

"Pour être vraiment utile, un agent doit comprendre et réagir à un monde complexe et dynamique, tout comme le font les gens, et retenir et mémoriser ce qu'il voit et entend pour comprendre le contexte et agir" explique Google qui veut aussi réduire la latence de la réponse. "Certaines des fonctionnalités seront intégrées aux produits Google, comme l'application Gemini, plus tard cette année."

En attendant, Google lancera dans le courant de l'année Gemini Live pour les abonnés. "Avec Gemini Live, vous pouvez parler à Gemini et choisir parmi une variété de voix au son naturel avec lesquelles il peut répondre" souligne Google. "Vous pouvez même parler à votre rythme ou interrompre une réponse au milieu d'une phrase avec des questions de clarification, comme vous le feriez dans n'importe quelle conversation."

Google donne un exemple: Gemini pourra vous écouter et vous aider à préparer un entretien d'embauche.

· Veo: bientôt des vidéos IA sur Youtube?

A l'image de Sora, Google a présenté Veo, son générateur de vidéo à partir d'un texte. Ce nouveau modèle peut créer "des vidéos de résolution 1080p qui peuvent aller au-delà d'une minute, dans un large éventail de styles cinématographiques et visuels" indique Google. Forcément, le groupe promet que cette IA viendra "aider" les artistes.

Veo est pour l'instant testé par certains vidéastes, tandis que certaines de ses possibilités devraient être intégrées à Youtube Shorts. Google a aussi annoncé une nouvelle version de son générateur d'images Imagen et son générateur de musique Lyria.

Thomas Leroy Journaliste BFM Business