Tech&Co Intelligence artificielle
Intelligence artificielle

Midjourney: voici les images impressionnantes de la nouvelle version de l'IA générative

La version 6.0 de Midjourney est disponible depuis ce 21 décembre. Sur les réseaux sociaux, les créations s'enchaînent, montrant les progrès effectués depuis la version précédente.

La génération d'images grâce à l'intelligence artificielle atteint (presque) des sommets. La sixième version de l'outil Midjourney est disponible depuis jeudi 21 décembre sur son canal Discord, où plus de 17 millions de personnes sont inscrites.

Sur les réseaux sociaux, et notamment X (ex-Twitter), les résultats de génération d'images pullulent. L'occasion, pour certains utilisateurs, de faire des comparaisons entre cette v6 et les précédentes versions. Le résultat est sans équivoque: Midjourney est encore plus réaliste qu'avant.

Plus de détails dans les portraits

Exit les visages lisses et sans imperfections, Midjourney v6 se penche sur les détails. Sourcils, cheveux rebelles, poils de barbe, rides. L'IA générative est bien plus précise qu'avant, d'après les tests effectués par Tech&Co. Sur l'image ci-dessus, l'implantation capillaire d'Elon Musk, PDG de Tesla, reste un peu trop parfaite pour être vraie. Mais les différences avec la v5 sont nettes.

Et la comparaison est encore plus significative entre la v4 et la v6. Un an sépare les deux versions et le changement se fait sentir. Boris Johnson n'a jamais été aussi réaliste dans une tenue de chevalier d'un autre temps.

Outre le costume, impressionnant de détails, le corps (et la tête tout particulièrement) est mieux proportionné. Comme pour Elon Musk, le visage est moins lisse, plus marqué. Et l'IA générative va même jusqu'à ajouter un bouton sur le menton de l'ancien premier ministre anglais...comme dans la "vraie" vie.

Un flou arrière amélioré

Même constat pour les photos générées en "cinématique". Ci-dessous, un vieil homme paré d'un manteau noir brave le froid et la neige. Julie W. Design, à l'initiative des créations, donne une comparaison entre la v5.2 à (gauche) et la v6 (à droite).

La comparaison de deux images générées par Midjourney v5.2 (à gauche) et v6 (à droite)
La comparaison de deux images générées par Midjourney v5.2 (à gauche) et v6 (à droite) © Capture d'écran/Twitter (Julie W. Design)

Le second plan de l'image donne plus de détails et le flou est moins prononcé. L'apparence des flocons de neige est aussi plus semblable à la réalité. Qu'ils soient encore dans les airs ou accrochés à la veste du personnage.

Jeux de lumière

Et si les effets de basse luminosité restent à améliorer, le rendu des effets du soleil sur la peau n'a plus rien avoir. En mentionnant "afternoon time" (heure d'après-midi), James Yeung nous fait remarquer que les jeux de lumière sont plus prononcés.

Dans l'image générée par la v6, affichée ci-dessus à droite, les couleurs sont plus chaudes, le reflet de la lumière sur la peau est on ne peut plus réaliste. Tout comme les rochers, en arrière-plan, qui brillent à la surface de l'eau.

L'environnement aussi

Désormais, lors de la génération de bâtiments ou de monuments, l'environnement adjacent est bien plus réaliste. Et c'est le cas avec la Tour Eiffel. Midjourney v5.2 (image de gauche ci-dessous) propose une Tour Eiffel au milieu d'un "idéal parisien", avec une avenue menant directement au pied de l'édifice.

À l'inverse de la génération proposée par la v6. Qui ajoute un environnement réaliste à l'édifice. Voitures et piétons y sont intégrés de façon très réaliste. L'architecture, bien connue, de la Tour Eiffel est semblable à la version précédente. Au fond de l'image, la tour Montparnasse est visible, tout comme l'hôtel des Invalides.

Midjourney v6 et GTA 6

La nouvelle version de Midjourney se fait aussi plus intelligente, dans le fond. Elle semble mieux comprendre les rouages d'un jeu vidéo, qui a été officialisé début décembre, Grand Theft Auto (GTA) 6.

L'illustration de gauche (v5) n'est pas très représentative de la franchise GTA dans sa largeur; la scène a l'air de se dérouler dans un pays d'Amérique du Sud. L'image de droite (Midjourney v6), elle, offre une "skyline" (enchaînement de gratte-ciels) semblable à celle de GTA 5.

Le personnage principal ressemble - dans les grandes lignes - à Michael, l'un des trois personnages principaux de GTA 5. Arme à la main, comme sur la pochette officielle du cinquième opus, il semble incarner "l'esprit voyou" de GTA.

Les animaux

Autre très gros progrès - peut-être l'un des plus significatifs - de Midjourney: les animaux. Comme pour les portraits humains, le visage du chat est nettement plus réaliste. Sur l'image générée à droite (Midjourney v6), ses vibrisses (moustaches), ses poils et ses oreilles n'ont rien à voir avec la version passée.

La v5 gardait une version simplifiée du chat. Avec un pelage parfait et des oreilles droites. Le regard de l'animal est aussi une différence nette à souligner, désormais bien plus réaliste.

Willem Gay