Accéder au contenu principal

On n'IA voit rien

Daniel Arasse me pardonnera pour ce piètre jeu de mot qui témoigne peut-être d'un appel au secours à l'heure où les images se génèrent à l'infini, par boîte de neuf. 

 

En plein cœur de la pandémie de Covid-19, le musée de l'imprimerie et de la communication graphique à Lyon a réalisé une exposition numérique intitulée Eye eye eye pour « voir quelque chose dans ce brouillard, cette brume épaisse qui s’est formée autour de nous. » 

 


 

Cette prise de position forte abordait de front « toutes les violences que nos yeux ont subies ces dernières années » et exposait sans fard, en miroir, la brutalité de la situation que nous vivions alors. Les mois ont passé, les mesures sanitaires se sont assouplies. Nos yeux subissent-ils moins de violences ? Je dirais qu'au contraire, elles perdurent dans une forme pernicieuse qui serait celle de la répétition, du mash-up, du remâchage, de la mastication. L'allusion à des activités de bouche est ici volontaire : c'est que l'axe language-image est renforcé par de nouveaux dispositifs de production visuelle, comme Craiyon

Craiyon, anciennement connu sous le nom DALL-E mini, est un système de génération d'image à partir de texte (comme WordsEye). Accessible à tous, il invente une grille de neuf images à partir de quelques mots (prompt). Invente ? pas exactement si l'on considère que l'IA derrière le dispositif s'abreuve d'un corpus d'images existantes, les piochant, assemblant, compactant, déformant selon des règles obscures - propres à chaque réseau de neurones artificiels, qui collaborent parfois avec des trublions du marché de l'art ou des créatrices talentueuses comme Helena Sarin (#potteryGAN). 

 

 

L'effet produit par les images de Craiyon est saisissant - car il émane d'un mode de réflexion non-humain. Le cérémonial d'apparition (d'épiphanie ?) est d'ailleurs intéressant : on réfléchit d'abord à une grappe de mots, qu'on saisit ensuite dans la barre de recherche, on appuie sur Entrée, on compte jusqu'à 60 environ en regardant défiler les chiffres, et la grille apparaît comme par magie

Survient un premier instant de stupéfaction face aux images générées, et, en simultané, à l'image globale produite par cette grille assez proche formellement d'un CAPTCHA. L'ensemble donne une impression mais ne raconte pas d'histoire ; les images ne se répondent ni ne résistent entre elles, elles sont simplement juxtaposées, car non choisies et potentiellement « re-créables » à l'infini. Elles ne signifient rien, n'ont pas de valeur. Elles n'ouvrent pas de porte. Elles ne nous disent rien. 

 

 

Impossible donc de les rapprocher d'autres démarches, désinvoltes comme l'art brut ou créatives comme des dessins d'enfant - même si certains, comme l'écrivain Clemens Setz, défendent la valeur poétique de ces algorithmes. Il s'agit d'autre chose, comme d'une vision atone de notre humanité, en reproduisant ses biais et en déformant ses traits ou ses attributs. Quel effroi d'entendre récemment un brillant chercheur en intelligence artificielle comparer la production de Craiyon à celle d'un artiste dont l'inspiration viendrait au hasard ! 

Il faudrait en effet, pour que les hommes académiques soient contents, que l'univers prenne forme. La philosophie entière n'a pas d'autre but : il s'agit de donner un redingote à ce qui est, une redingote mathématique. Par contre affirmer que l'univers ne ressemble à rien et n'est qu'informe revient à dire que l'univers est quelque chose comme une araignée ou un crachat.

- Georges Bataille: « Informe. » Documents 7 (Décembre 1929), p. 382

 

Parlons de l'univers, tiens ! La première fois que j'ai découvert les images captées par le télescope James-Webb, c'était à la radio. On y parlait d'un bond en avant exceptionnel pour la connaissance spatiale, d'une résolution d'image incroyable, d'une absolue nécessité de s'en rendre compte par soi-même en allant consulter les images en ligne. 

 

 

Quelle déception en face de mon écran, de constater qu'aucune d'entre elles n'était « neuve » à mes yeux ! Et quelle platitude dans la description de ces images par un astrophysicien (même s'il faut noter l'effet de style assez réussi de répétition et d'amplification) : 

[...] puisqu'on voit beaucoup d'étoiles, beaucoup de galaxies qui sont un peu allongées et on voit aussi l'effet des amas de galaxies sur les galaxies qui sont derrières. On voit des arcs, ce sont des arcs gravitationnels, on en voit une série.

Je dois reconnaître que j'ai passé beaucoup plus de temps à contempler l'image de reconstitution du trou noir dormant autour d'une étoile, que les images en infrarouge de JWST. Elle m'évoque un travail de texture qui mêle deux mondes, dont se ferait écho le travail graphique de Tina Touli. Cette image, Craiyon n'arrive pas à en imiter la beauté : 

 

ESO/L. Calçada

 

Alors que l'IA parvient assez bien, de mon point de vue, à recréer des images relativement similaires à celles transmises par James-Webb : 

 


Sur la thématique spatiale, j'ai bien du mal à être emportée par mon imagination - et l'imaginaire collectif ne m'aide pas beaucoup : quand je vois les plans des chercheurs japonais pour construire sur la Lune, cela m'évoque aussitôt la base secrète d'un James Bond versé un peu « trop loin dans l'exotisme » ou bien un décor virtuel pour réunion dominicale de mordus d'astronomie. D'autant qu'au même moment, dans la collection Travel Book de Louis Vuitton (!), l'incroyable voyage sur Mars croqué par François Schuiten et narré par Sylvain Tesson se termine [spoiler] dans le renoncement à l'exploitation des ressources extra-terrestres.

 

 

Aux espaces froids et insondables des galaxies, j'ai toujours préféré les espaces froids et insondés des océans : j'ai aimé suivre par exemple les bathyfolages de Théodore Monod dans son bathyscaphe de 1947 - la même année où les premières fusées « boiteuses » quittaient la Terre. 

L'image la plus marquante de cette année 2022 est pour moi la découverte d'une mystérieuse route de briques jaunes dans une zone méconnue du Pacifique, au nord-ouest d'Hawaii. L'un des scientifiques de l'équipe, en découvrant ces images, s'est exclamé : 

C'est la route de l'Atlantide ! 

La route de brique jaune est surtout une référence au roman de Lyman Frank Baum, Le Magicien d'Oz. C'est le chemin que Dorothy doit emprunter pour chercher l'aide du magicien. Ainsi, quand Craiyon essayera de représenter platement une route de briques jaunes, je verrais dans cette découverte sous-marine une référence à un univers fictionnel imaginaire de l'époque victorienne. 

 

Illustration by W.W. Denslow (d. 1915)

Pourquoi est-ce nécessaire de tenir à distance ces images artificielles, générées par Craiyon et autres DALL-E ? Pas uniquement pour des raisons d'éducation à l'image ou d'éthique

Quand Meta a présenté en février dernier son Builder Bot, une IA qui met en forme un univers virtuel en 3D sur simple requête vocale de l'utilisateur (donc une description textuelle, lue à voix haute), l'exemple qu'a choisi Mark Zuckerberg pour sa vidéo de démonstration a été... la plage. 

[...] il suffit donc de dire « Allons à la plage » pour que Builder Bot s’exécute et nous crée instantanément une île tropicale avec sa plage de sable fin ! 

Le fait est que je ne vis pas sur une île tropicale avec des palmiers, en buvant de l'eau de coco et en écoutant une mélodie au ukulélé. J'ai fait mes études dans une ville de montagne, à Annecy, où aller à la plage signifie s'allonger sur l'herbe près du lac, entourée par la chaîne des Aravis. Cette plage de sable fin que veut m'imposer Facebook est pour moi d'un exotisme déplacé, culturellement construit, une forme d'orientalisme plaquée contre mon gré sur mon imaginaire du bien-être et de la détente. Le pendant du chalet en somme, à l'autre extrémité de l'année.

 

© Marie-Paule Rouge-Pullon / SAMETT



Ce n'est pas qu'une histoire de description ou de ressemblance avec la réalité : le langage est une affaire de pouvoir, car il définit, délimite, autorise ou interdit, formalise ou invisibilise. Dans le roman 1984 de George Orwell, les autorités ont créé la novlangue pour s’assurer le contrôle des esprits. Jean-Jacques Rosat, professeur de philosophie, éditeur et spécialiste d'Orwell :

Le langage courant [...] est extrêmement appauvri, il n’y a plus de distinction entre les mots et les verbes. On déshabille les mots de toutes les significations secondaires. [...] Un certain nombre de mots qu’Orwell appelle des « blanket words », des mots-couvertures [...] vont recouvrir tout un ensemble de concepts anciens pour pouvoir les étouffer et les remplacer. [...] Le but là, c’est de vous enlever cette pensée de la tête.

Nous enlever la charge de pens[er], n'est-ce pas le but du Builder Bot et autre Craiyon ? En prenant note de nos commandes vocales et textuelles, les IA nous font croire qu'elles exécutent nos désirs, elles nous font croire que les résultats obtenus sont ceux auxquels nous aspirions - alors que notre esprit était dans l'incapacité même de les concevoir. Il n'y a que Craiyon pour imaginer Clippy à la plage (tiens, encore du sable fin) et qu'un humain pour lui demander quelque chose d'aussi absurde (sans offense ;)

 

 

Dans son livre The Web of Life, Fritjof Capra écrit : 

Information is presented as the basis of thinking, whereas in reality the human mind thinks with ideas, not with information.

Les systèmes de génération d'images traitent les informations que nous leur donnons et qu'elles ont à disposition dans leur corpus ; quand je pense au Magicien d'Oz au bout de la route de briques jaunes, c'est une idée qui s'épanouit dans mon esprit, par définition difficilement représentable hors de mon monde intérieur, qui a été implantée là par une puissance littéraire et imaginaire ultime : le roman.

C'est la finesse et la subtilité de notre langage qui nous permet d'appréhender le monde avec finesse et subtilité, d'avoir la capacité de créer - et non pas seulement de reproduire. A ce titre, quel plus bel exercice de pensée créative que ce concours de kanji, relayé en français par cette prof de japonais.

Mon préféré, bien sûr, va à la Lune qu'on aperçoit derrière la brume : inspiré du kanji 月 (lune) dont des traits horizontaux ont été remplacés par des vagues (pour faire allusion à la brume), j'aurais tout le mal du monde à l'expliquer au Craiyon le plus affûté ! 

 

(lien Twitter)


Commentaires

Posts les plus consultés de ce blog

Pédagogie du corps scanné

Avec sa première classe culturelle numérique, la metteuse en scène Anne-Sophie Grac met au défi les collégiens d'imaginer les canons de beauté de demain, en passant par la déconstruction du corps réel et représenté.

Sur Minecraft, le beau ne s'apprend pas

Dans un jeu vidéo comme Minecraft, comment donner à un bâtiment ce petit quelque chose qui fait son charme ? J'ai commencé à construire un chalet (pas ordinaire) en suivant les conseils des meilleurs architectes.

En voyage dans les métavers : plaidoyer pour la diversité

Retranscription illustrée d'une conférence présentée le 25 mai 2022 à Québec dans la catégorie « Innovation » du WAQ (Web à Québec).  Merci au comité de programmation pour l'invitation !