Tech&Co Intelligence artificielle
Intelligence artificielle

Jouer avec vous, résoudre vos problèmes: Google lance Gemini, son IA aussi performante qu'angoissante

Google a officialisé l'arrivée de sa nouvelle génération d'IA générative, capable de prendre en considération du texte, de l'image, de la vidéo, du son et du code en même temps pour mieux vous répondre.

Rien n’arrête l’intelligence artificielle qui semble s’améliorer à une cadence folle depuis l’avènement au grand public de ChatGPT il y a à peine un an.

Depuis, Google a lancé Bard, Amazon a dopé les possibilités d'Alexa, Meta y va de ses travaux et Apple paraît en embuscade. Mais avec sa filiale Deepmind, Google paraît le mieux armé pour répondre aux avancées d'OpenAI avec le lancement de sa nouvelle version de modèle de langage (LLM) baptisée Gemini.

Trois versions pour Gemini

"Le modèle le plus performant et le plus général à ce jour", annonce Sundar Pichai, patron de Google. Les équipes de Deepmind se félicitent d’ailleurs des performances de pointe affichées par Gemini, qui a surclassé GPT 3.5 dans de nombreux tests et critères de référence, notamment grâce à son modèle le plus avancé.

Il faut dire que la nouvelle IA maison, version nettement améliorée et plus rapide du modèle de langage précédent, peut s'adonner à une variété de tâches aussi utiles au quotidien qu'inquiétantes dans la réflexion profonde.

Conçu en collaboration entre Google Research et Deepmind, Gemini 1.0 va être capable de gérer plusieurs sources d’information simultanément (texte, vidéo, audio, image, code) pour mieux répondre à vos questions, être capable de concevoir à la seconde un jeu avec vous ou résoudre un exercice de mathématiques sur lequel vous butez depuis trois heures. Et le tout avec humour et convivialité pour mieux vous accompagner, comme le montre Google dans une vidéo de présentation de sa version Ultra.

Gemini arrive en effet en trois versions pour trois cibles et usages différents:

- Gemini Nano: ce modèle d’IA va faciliter les tâches pour les supports mobiles comme les smartphones. Ce sont notamment pour ceux tournant sous Android AI Core. Le Google Pixel 8 Pro devrait être le premier appareil à en profiter.

- Gemini Pro: ce modèle polyvalent va profiter à une large variété de supports et d’usages.

- Gemini Ultra: permis grâce à des supercalculateurs de haut vol, le modèle le plus grand et le plus puissant de Google est destiné aux tâches les plus complexes, telles que les besoins des développeurs, des entreprises, des centres de données, etc.

Un modèle capable de dépasser les experts humains

Fort de ses résultats aux référentiels académiques utilisés dans la recherche et le développement de ce type d'intelligences artificielles, Gemini est le premier modèle capable de surpasser les experts humains en matière de compréhension massive du langage multitâche.

L’IA peut ainsi mêler connaissances sur le monde et capacité à résoudre des problèmes dans de nombreux domaines tels que les mathématiques, l’histoire, le droit, la médecine ou encore l’éthique. Pour le Youtubeur Mark Rober, cela lui permet même de gagner des semaines de travail tout en donnant des conseils d'excellent niveau.

Face à une difficulté dans un exercice de mathématiques, Gemini pourra désormais vous expliquer d’où vient votre erreur dans un raisonnement, même écrit à la main, et vous aider à la résoudre.

Ainsi, Gemini peut ingurgiter des centaines de milliers de documents, les assimiler, les filtrer et en extraire les idées principales à une vitesse beaucoup plus importante. Et ce, quel que soit le domaine, que ce soit pour une recette de cuisine, un problème de droit ou une question financière. Il peut même écrire du code informatique encore plus rapidement avec AlphaCode 2, un système de génération de code encore plus avancé, qui peut résoudre des programmes de haut niveau.

Disponible dès maintenant dans Bard et sur Pixel 8 Pro

Google assure que Gemini répond à toutes les exigences en matière de sécurité, notamment face à la toxicité et les biais. Mais l’entreprise californienne, si elle souligne les progrès en compréhension des faits, demande encore à rester prudent face à la véracité parfois douteuse des informations qui en résulteront, notamment avec Bard, le robot conversationnel de Google qui va en profiter dès ce 6 décembre.

En intégrant Gemini Pro, Google Bard (librement accessible) pourra mieux résumer, suggérer des idées, écrire ou planifier. Mais il ne fonctionne qu’en anglais dans un premier temps, les équipes Google expliquant que des négociations sont en cours avec les régulateurs européens pour un déploiement sur le Vieux continent et dans d’autres langues.

Le Pixel 8 Pro profite quant à lui de la version de Gemini Nano dès maintenant pour faire mieux tourner plusieurs fonctions sur l’appareil grâce à sa puce Tensor G3. Cela concernera l’enregistreur qui hérite d’une fonction "Résumer" et de "Réponses suggérées" dans Gboard. Le nouveau modèle d’IA devrait avoir également des effets sur les vidéos en améliorant la couleur, la stabilisation ou encore l’éclairage, mais aussi les modes Nuit et Exposition Longue, le portrait ou la fonction Anti-Flou.

Melinda Davan-Soulas