Tech&Co
Google

Intelligence artificielle: Google a un peu triché dans sa vidéo de présentation de Gemini

Les démonstrations faites dans la vidéo ont été raccourcies.

Google vient de dévoiler Gemini, sa nouvelle intelligence artificielle générative. Ce modèle de langage est présenté comme "le plus performant et le plus général à ce jour" par le patron de l'entreprise Sundar Pichai. Une alternative concurrente à ChatGPT, le modèle de langage d'OpenAI qui a été révélé il y a désormais un an et qui a secoué le secteur.

Mais dans son impressionnante vidéo de démonstration, il semblerait que Google ait un peu triché sur les compétences de Gemini. L'entreprise affirme en tout cas discrètement que la vidéo a été éditée pour un rendu plus spectaculaire, a remarqué Bloomberg.

"Latence réduite"

"Pour les besoins de cette démonstration, la latence a été réduite et les temps de réponses de Gemini ont été raccourcis pour des questions de temps", peut-on lire dans les petites lignes de la description de la vidéo sur Youtube.

Concrètement, cela signifie que la démonstration aurait dû être plus longue pour respecter les temps de réponses réels. Elle ne reflète donc pas précisément les capacités de Gemini, dont les experts disent déjà qu'elle surpasse ChatGPT 3.5. Ce n'est pas anecdotique, puisque Gemini est faite pour interagir en temps réel avec un humain. Un billet publié sur le site de Google dédié aux développeurs détaille également la réalisation de la vidéo. On y apprend notamment que, pour la démonstration, il n'y a jamais eu d'échange en temps réel et que les images sont fixes.

Oriol Vinyals, chef de projet chez DeepMind (filiale de Google dédiée à l'IA), explique d'ailleurs sur X (anciennement Twitter) que la vidéo a effectivement été raccourcie pour des "questions de brièveté". Il précise que la vidéo "illustre ce à quoi pourrait ressembler une expérience multimodale construire avec Gemini", et qu'elle a pour but "d'inspirer les développeurs".

Dans les grandes lignes, Gemini est une intelligence artificielle multimodale: elle peut gérer plusieurs sources d'information en simultanée. Elle accumule à la fois connaissances générales et résolution de problème, lui permettant d'assister avec précision ceux qui l'utilisent. Elle est déjà intégrée dans l'autre IA de Google, Bard, ainsi que le smartphone de l'entreprise, le Pixel 8 Pro mais pas pour l'Europe.

Victoria Beurnez