Leonardo On-Line, the website 
of Leonardo/ISAST  Leonardo, the Journal of the International 
Society for the Arts, Sciences and Technology  Leonardo Music 
Journal  Leonardo Electronic 
Almanac: monthly coverage of Internet news and digital media culture  Book Series: 
innovative discourse on art, science and technology topics by 
artists, scientists, researchers and scholars Leonardo Reviews: scholarly reviews of books, exhibitions, CDs, 
journals and conferences  OLATS, 
l'Observatoire Leonardo des Arts et des Technosciences: key works, 
artists, ideas and studies in the field  Leonardo / Activities and Projects  Leonardo / About Us   
 

ETUDES ET ESSAIS > La synthèse numérique de l'image. Vers un nouvel ordre visuel
   



La synthèse numérique de l'image. Vers un nouvel ordre visuel

Edmond Couchot



Ce texte a été originellement publié dans la revue Traverses, n°26, octobre 1982, pp. 56-63


Résumé :
[effectué par la rédaction de Leonardo/Olats]

Ce texte expose, à travers sa morphogenèse, la nature de l'image de synthèse. L'image de synthèse n'appartient ni à l'ordre optique-chimique de la photographie et du cinéma, ni à l'ordre optique-électronique de la vidéo et de la télévision mais repose sur du langage. Quittant le régime de la représentation, l'image de synthèse engendre un nouvel ordre visuel. Outre l'ordre visuel, elle bouleverse également l'ordre temporel, passant du "ça-a-été" Barthien, à un "ça-peut-être".


On estime que dans les vingt prochaines années le tiers des images télévisées, sans compter le cinéma et les autres médias, sera créé par des ordinateurs. L'image numérique constitue un champ de recherche particulièrement important d'un point de vue culturel et sociologique. Je n'examinerai ici ce champ que sous l'angle de la morphogenèse, c'est-à-dire des processus qui interviennent dans la synthèse numérique de l'image.

Je laisserai donc de côté, par souci méthodologique, la question de sa distribution (réseaux, diffusion, stockage, reproduction, etc.) et celle de sa perception, encore que l'une et l'autre jouent leur rôle dans cette morphogenèse.

 

 

DÉFINITIONS

Une image numérique 1 est une image composée point par point. Chaque point est défini par deux coordonnées. Pour affecter un point à une place dans l'espace bidimensionnel de l'image, il faut donner à l'ordinateur la valeur numérique de ces deux coordonnées. Selon les dispositifs, le nombre possible de ces coordonnées, abscisses et ordonnées, est plus ou moins grand, mais dans tous les cas strictement déterminé ; abscisses et ordonnées correspondent à des lignes horizontales et verticales constituant la trame invisible de l'image.

Dans le cas d'une image en couleurs, chaque point est lui-même composé de trois sous-éléments -un point rouge, un point vert, un point bleu- qui, par synthèse additive, peuvent recréer toutes les teintes du spectre visible ; en principe du moins, car à chacun de ces points n'est attribuable qu'une valeur numérique elle aussi déterminée, par exemple de 0 à 15 (0 pour la plus claire, 15 pour la plus foncée). Ainsi l'on peut affecter à un point rouge la valeur 0, la valeur 8 ou la valeur 14, mais en aucun cas une valeur non déterminée d'avance, comme la valeur 3,5.

Ces valeurs, comme nous le montre cet exemple, s'expriment par des nombres entiers décimaux, eux-mêmes convertis par le calculateur en nombres binaires, des zéros et des uns. Mais des zéros et des uns ne font pas une image visible. Pour rendre perceptibles les valeurs numériques qu'il garde en mémoire, l'ordinateur doit les traduire en image réelle. Le moyen le plus utilisé est l'écran vidéo. Cet écran affiche, sous une forme lumineuse appelée pixel (un point plus ou moins petit), les informations mémorisées par l'ordinateur. L'image numérique est donc une image composée d'un certain nombre d'éléments discontinus et déterminés numériquement, totalement maîtrisables. Plus ce nombre est grand, plus la trame de l'image est fine, sa couleur riche : les dégradés de teintes ou les passages de l'ombre à la lumière apparaissent à l'œil continus, même si les valeurs numériques des points constituant l'image demeurent discontinues. Les dispositifs les plus performants à l'heure actuelle permettent de composer avec 1 million de points (trame de 1 000 lignes verticales sur 1 000 lignes horizontales) et 16 millions de teintes différentes.

 

 

LA SYNTHÈSE : UN CONTRÔLE POINT À POINT

Le caractère numérique et discontinu de l'image informatique la distingue fondamentalement de l'image optique-chimique de la photo et du cinéma et de l'image optique-électronique de la télévision. Fortement agrandie, une photo apparaît bien comme discontinue, mais les grains d'argent qui la composent sont répartis d'une façon totalement indéterminée sur le support ; ils ne se présentent ni en rangées horizontales ni en lignes verticales, ils s'agglomèrent en petits paquets hétérogènes qui n'ont rien de commun avec un pixel. Il en est de même pour l'image générée par une caméra de télévision conventionnelle ; cette image est discontinue dans sa hauteur, puisque composée de lignes horizontales, discontinue aussi sur chacune de ses lignes qui comportent un nombre déterminé de points différenciés, mais continue dans la variation des intensités lumineuses de chaque point. 2 Les points constituant l'image photographique ou électronique ne sont pas, d'autre part, affectés de valeurs numériques.

C'est donc l'association de la discontinuité et de la précision numérique qui, rendue réalisable par la technologie informatique, a permis le contrôle total de l'image point à point. L'intérêt du contrôle point à point a été ressenti par les peintres bien avant que l'état des technologies l'eût autorisé. Les néo-impressionnistes ont abordé le problème, mais n'ont pu lui apporter une solution définitive. Ils ont exploité la discontinuité de la touche (par la méthode de fragmentation qu'ils appelaient "divisionnisme") et le mélange optique de pigments purs, mais la position des touches n'était pas déterminée par des coordonnées spatiales numériques et leurs valeurs chromatiques ne correspondaient pas à une échelle discontinue strictement définie.

Les immenses possibilités de la technologie numérique ont mis cependant le créateur d'images devant un problème particulièrement embarrassant. Capable de créer en principe n'importe quelle image puisqu'il en contrôle au plus près chaque élément, il se trouve en réalité obligé de définir un nombre extrêmement grand de paramètres. Il a le choix alors, soit de s'inspirer de la méthode néo-impressionniste et d'indiquer à l'ordinateur chacun de ces millions de paramètres, point par point, comme le fait un tapissier qui reproduit un carton, soit d'adopter une démarche plus économique et plus synthétique : faire calculer par l'ordinateur la plupart de ces paramètres. Par exemple, pour tracer une ligne droite horizontale, le programmeur indiquera au calculateur, en quelques courtes instructions, que les points qui la composent gardent la même ordonnée d'un bout à l'autre, tandis que la valeur des abscisses augmentent d'unité en unité. Le travail ainsi systématisé se sera alors singulièrement raccourci. Cet ensemble d'instructions s'appelle un algorithme. On définit plus généralement l'algorithme comme un procédé logique conduisant à la solution d'un problème à travers une suite finie d'opérations qui reposent sur le calcul et le raisonnement. Dans l'exemple précédent, l'algorithme est des plus simples ; il deviendra de plus en plus complexe lorsqu'on demandera à l'ordinateur de tracer des courbes, de restituer les volumes, les couleurs, les ombres, la transparence, la texture des matières ou le mouvement. Mais le principe restera le même : définir l'ensemble des règles opératoires permettant à l'ordinateur de composer l'image point à point -on dira de la synthétiser- à partir de données numériques-discontinues. 3

 

 

UNE IMAGE GÉNÉRÉE PAR DU LANGAGE

En conclusion, on peut dire que l'image synthétisée se réduit essentiellement à des combinaisons d'algorithmes. Or c'est là que se tient la nouveauté radicale de cette image, quand on en considère la morphogenèse. L'algorithme est une opération abstraite dictant à l'ordinateur des instructions rigoureusement définies (itérations, boucles, branchements conditionnels, calculs divers, etc.), mais pour que ces instructions soient comprises et exécutées par l'ordinateur, il faut que l'algorithme soit écrit conventionnellement dans le langage parlé par celui-ci (Basic, Fortran, Lisp, Assembleur, etc.). Le même algorithme s'écrit différemment selon qu'on utilise tel ou tel langage, mais l'opération reste la même. 4 L'image synthétisée est la traduction et l'exécution d'ordres exprimés dans un langage. Il faut d'abord agencer des mots et des nombres pour que, dans un deuxième temps, naissent des formes, des couleurs, du mouvement. L'image synthétisée est générée directement par du langage, elle n'existe pas sans ce langage. 5

Il semble que l'on n'ait pas encore bien saisi ce qu'il y a là de profondément différent par rapport aux anciens procédés technologiques de création d'images, ni les implications culturelles qui ne manqueront pas d'en découler. Les procédés optiques fondés sur le principe de la camera obscura, qu'ils soient optiques-chimiques (la photographie et le cinéma où l'image est fixée à l'aide de substances chimiques), ou optiques-électroniques (la vidéo où l'image est fixée par magnétisation), ont en commun qu'ils mettent en présence, par l'entremise du photographe, du cinéaste ou du vidéaste, l'objet originel et sa reproduction au moment où a lieu la prise de vue (qui est aussi prise de temps). Le faisceau lumineux qui relie chaque point de l'objet à chaque point de la plaque sensible de la pellicule ou du fond photo-sensible de la caméra vidéo, reproduit fidèlement cet objet au moment précis où l'opérateur à décidé d'en fixer la copie (le double) bidimensionnelle. D'où cet effet de vérité puissant qui se dégage de la photo. La photo : "c'est la vérité même", disait Alophe en 1861. La photo est vraie parce qu'elle re-présente : elle restitue le présent fugitif où l'objet a été saisi. Regarder une photo c'est toujours revivre ce présent-là, cet instant qui n'est plus, ce "ça-a-été" qui pour Roland Barthes constitue l'essence de la photographie. La photo se conjugue au passé composé (passé cadré, exposé, révélé, fixé) toujours prêt à réoccuper le présent. On peut ici reprendre ce que Benveniste dit du langage et de l'expérience humaine : "la condition d'intelligibilité du langage, révélée par le langage [...] consiste en ce que la temporalité du locuteur, quoique littéralement étrangère et inaccessible au récepteur, est identifiée par celui-ci à la temporalité qui informe sa propre parole quand il devient locuteur" 6. Le locuteur et le récepteur partagent le même présent linguistique, le présent du locuteur est d'emblée accepté comme sien par le récepteur. L'instantané photographique renvoie à un présent (la pose photographique) prélevé par le photographe dans l'écoulement de sa propre temporalité, et le regardeur qui l'accepte plus tard comme sien retrouve cette co-présence partagée par l'objet, son double et le photographe. C'est la condition d'intelligibilité de la communication photographique ; sa différence avec la communication linguistique tient dans l'irréversibilité de l'échange qui ne se fait que dans un sens, du photographe au regardeur.

Les nouvelles techniques de développement instantané -le Polaroïd par exemple- ne mettent pas en défaut ce principe, elles le poussent au contraire dans ses ultimes conséquences. Le regardeur retrouve le temps du photographe (c'est le plus souvent le photographe lui-même qui est le premier regardeur de l'image Polaroïd) presque instantanément. Instantané de l'instantané, le Polaroïd permet au photographe, à l'objet, à son image et au regardeur d'être co-présents presque au même instant et donc confrontables dans un va-et-vient en abîme fascinant. (Si la photo est la vérité même, le Polaroïd est la vérité vraie).

Dans le cinéma aussi le regardeur accepte d'emblée le présent du locuteur-narrateur, souvent totalement impersonnel ou absent, comme dans le roman. Il en va de même dans la télévision. Le "direct", sans mettre en présence réelle l'objet et le regardeur, puisque le lieu de la prise de vue n'est pas le lieu de la distribution de l'image, leur fait cependant partager le même présent simultané, celui de la communication linguistique. Quand enfin, dernier cas de figure, l'objet, le vidéaste, l'image et le regardeur sont présents dans le même lieu, nous retrouvons la combinatoire du Polaroïd avec une dimension supplémentaire dans la mise en abîme de l'objet et de l'image : la continuité temporelle. Mais dans tous les cas la condition d'intelligibilité passe par la nécessité pour le regardeur d'accepter en partage le présent -simultané ou différé- de l'auteur de l'image et de l'objet.

On comprend ainsi pourquoi cet ordre visuel propre à la culture occidentale, qu'on peut définir comme l'ordre de la re-présentation, est en corrélation étroite avec les technologies optiques fondées sur le principe de la camera obscura, avec leur apparition au Quattrocento, avec leurs transformations et l'accélération de leur développement depuis la deuxième moitié du XIXe siècle.

 

 

ENTRE L'OBJET ET L'IMAGE : LE LANGAGE PROGRAMMATIQUE

Avec la synthèse de l'image, quelque chose de radicalement différent apparaît. L'artiste ne travaille plus d'après nature. Il n'a devant lui qu'un clavier de lettres et de chiffres (pas de palette garnie ni de pots de peinture). Il doit d'abord définir son projet avec la plus grande précision, créer des algorithmes, les combiner, les traduire dans le langage approprié : bref, écrire un programme. 7 L'image synthétisée par l'ordinateur à partir d'un programme ne re-présente donc rien, au sens où nous avons employé ce mot. Elle n'est pas la reproduction optique et analogique d'un objet originel qui aurait laissé une trace lumineuse sur l'écran. Elle n'est pas co-présente à l'objet qu'elle figure. Il n'y a plus d'objet présent. Entre cet objet et l'image s'est glissé l'écran du langage programmatique.

Voilà donc un nouveau rapport entre l'image et le langage qui s'instaure. Toute image est bordée de langage, invisible sans le langage. "Est-ce qu'on verrait, demande Jean-François Lytoard, si on ne parlait pas ?" Réciproquement, il y a de l'image en bordure du langage. L'image fait jaillir du langage dans son sillage et vice-versa. Mais quel que soit leur mode d'induction, image et langage sont dans un rapport de signification ou d'expression que je désignerais plus généralement comme un rapport de sens. Il en va tout autrement dans la synthèse de l'image. Le langage programmatique qui préexiste à l'image et qui la génère n'entretient aucun rapport de sens avec cette image ; les instructions symboliques, les valeurs numériques qui entrent dans l'ordinateur n'ont aucun sens rapportable au sens de l'image. Elles n'ont de sens qu'en tant que processus opératoires. Le langage programmatique reste extérieur à l'image, il n'est pas inducteur de sens, mais de formes visuelles. Certes, ces formes se chargeront, une fois l'image générée sur l'écran, d'une signification ou d'une force expressive aux yeux du regardeur -l'image fonctionnera alors comme n'importe quelle autre image-, mais le langage programmatique qui les sous-tend restera inaccessible à celui-ci ; il ne donnera lieu à aucune communication linguistique, aucun présent partagé entre locuteur et récepteur.

 

 

VERS UN NOUVEL ORDRE VISUEL

On ne manquera pas de faire remarquer que le photographe et plus encore le peintre se font du cliché ou de la toile qu'ils vont produire une certaine idée préalable que l'on pourrait comparer au programme d'un artiste travaillant avec un ordinateur. Cette idée prendra même des formes très précises, mais ces formes resteront visuelles, elles ne s'exprimeront pas par du langage. L'ordinateur, par contre, oblige l'utilisateur à préciser au plus près son intention et à l'exprimer dans un langage qui n'admet aucune opacité. Il exige de l'artiste une pré-vision aiguë : même le flou, même le hasard doivent être prévus. 8 Il arrive couramment que cette pré-vision n'ait pas toute l'acuité nécessaire ; le programmeur se trompe. (C'est même ce qui se produit systématiquement au cours de l'élaboration d'un programme. Cependant, comme le fait observer Michel Bret, loin d'être des parasites, ces effets imprévus nous révèlent souvent des richesses insoupçonnées et nous invitent à les exploiter). Mais alors qu'il suffit à un peintre -cela dit sans intention péjorative- de reprendre sa toile en la grattant et en repeignant par-dessus, le programmeur doit retrouver dans le langage la source de "l'erreur". Il doit analyser pas à pas son programme, se mettre à la place de l'ordinateur et comprendre par déduction pourquoi l'effet visuel attendu n'a pas eu lieu. Il doit pénétrer à l'intérieur de son propre langage.

Cette nécessité de pénétrer à l'intérieur des choses se retrouve aussi dans la conception de l'image. La camera obscura donne de l'objet photographié une projection bidimensionnelle ; la même opération, à travers la perspective géométrique, a affecté les objets figurés dans la peinture occidentale jusqu'aux cubistes qui ont tenté de présenter (plutôt que de re-présenter) la totalité de l'espace tridimensionnel en le disloquant et en le mettant à plat. Mais un compotier cubiste montre toutes ses faces à la fois ; il n'essaie de n'en cacher aucune. Le compotier synthétisé -quand l'artiste tente de faire autre chose que la copie d'une photo ou du fond de sa rétine- n'est plus une projection sur un plan de représentation ou de présentation se réduisant à une image unique, mais une multiplicité d'images. Plus précisément, un ensemble extrêmement grand d'images du même objet, donc semblables, en même temps que différentes puisque chacune ne fait voir qu'un des aspects de l'objet : une série quasi infinie dont l'ordinateur peut calculer chaque terme par la seule variation numérique de ses paramètres. Ainsi le programmeur pourra-t-il faire tourner dans l'espace ce compotier, le présenter au regard d'une quasi-infinité de points de vue, de couleurs, d'éclairages.

C'est alors toute la position de l'artiste qui change par rapport à l'objet et par rapport à l'image. Celui-ci ne peut plus avoir en regard de l'objet et de l'image cette relation frontale qui caractérise le peintre ou le photographe.9 Relation d'affrontement aussi bien, puisque la prise de vue crée un double mimétique, rival qui prétendra non seulement reproduire l'objet référentiel, mais en instaurer un autre sur la dépouille du premier (faire une image d'un objet, c'est avoir sa peau visuelle). L'artiste ne fait plus front ni à l'objet ni à l'image. Le langage programmatique se glissant entre l'objet et l'image, l'image n'en saurait être le double mimétique, pas plus qu'elle n'est elle-même le double mimétique de ce langage. Les notions mêmes d'objet et d'image et celle de sujet (sujet qui prend la vue ou qui fait l'image, sujet qui regarde), se modifient profondément. L'objet n'est plus ce qui est placé devant -c'est la signification étymologique-, il se déplace dans un espace qui n'a plus aucun lien direct avec celui de l'image : objet et image flottent l'un par rapport à l'autre. Et le sujet ne les surplombe plus, il n'occupe plus ce point sommital et focal 10 par où passent obligatoirement toutes les liaisons de l'image et de l'objet (l'objectif de la camera obscura est le lieu même du sujet). Alors que l'ordre optique de la représentation renvoie à une topologie de la convergence où le centre organisateur se donne comme "le point de vue à partir duquel la totalité du réel serait simultanément visible", comme le dit Prigogine, le nouvel ordre visuel relèverait d'une topologie totalement différente d'où serait exclu tout centre organisateur. A l'objet référentiel ne correspond plus une image-duplicatum, mais une série quasi infinie d'images, toutes semblables et différentes, comme on l'a dit. Mais cette multiplicité sérielle d'images, cette théorie quasi infinie, n'est pas visible non plus dans sa totalité. L'ensemble possible des images du compotier synthétisé est impossible à voir.

Là intervient le temps. Si la topologie de l'image change, sa temporalité change également. Voir la totalité des images du compotier exigerait un temps quasi infini. L'ordinateur ne pourrait pas non plus garder la série entière en mémoire, il lui faudrait une mémoire quasi infinie. Il peut seulement générer quelques images du compotier. L'ensemble des images possibles est de fait incopossible. L'ensemble des images possibles n'est pas présentable. Toute tentative donc de retrouver le présent originaire où l'objet a produit son double -la co-présence de l'image, de l'objet et du preneur de vue- est vaine ou illusoire.

L'image synthétisée est dans une autre temporalité ; elle ne renvoie pas comme l'image optique de la représentation à un "ça-a-été", présent passé et forclos que le regardeur peut cependant partager, mais à un "ça-peut-être" : un événement pur, car jamais actualisable dans sa totalité. Elle ne re-présente ni ne présente. Elle est potentielle, en puissance.

Si les technologies de l'image sont bien des façons de voir et de percevoir le monde qui fondent la topologie de nos relations avec celui-ci (relations de l'objet, du sujet et de l'image), comme le montrent les technologies optiques de la représentation dont le modèle structurel traverse les Arts et les Sciences, voire les formes d'organisation de nos sociétés, depuis un demi-millénaire, il faut s'attendre à ce que ces nouvelles images, dont on a vu ce qu'elles changeaient dans la perception des choses et du temps, modifient à leur tour notre culture et notre société en profondeur. Pour l'instant, on n'en peut saisir que le germe. Il faut s'interroger avec précaution sur ce germe, profiter du rare moment où ces technologies se cherchent et s'élaborent, les expérimenter avant qu'elles ne se figent, les adoucir avant qu'elles ne se durcissent. Travail d'artistes plus que de techniciens.




© Edmond Couchot - 1982 pour le texte original ; 2001 pour la version en ligne

 

Notes
En cliquant sur les numéros, vous reviendrez sur le texte que vous étiez en train de consulter.

1 - On dit aussi "digitale", de l'anglais "digit" (chiffre)
2 - L'image vidéo est donc un mixte continu-discontinu susceptible de subir certaines transformations affectant le balayage et l'intensité lumineuse, mais le manipulateur ne la maîtrise pas encore point à point. On a appelé abusivement "synthétiseurs d'images" les appareils permettant ces transformations. La synthèse totale de l'image n'est réalisable qu'avec des dispositifs numériques.
3 - Il faut remarquer que le processus qui vient d'être décrit permet également de transformer une image en une suite de valeurs numériques- discontinues. C'est le cas des images (photos, films, etc.) enregistrées sur vidéodisque. Cependant, les informations contenues dans un vidéodisque, bien qu'elles soient numériques-discontinues, ne sont pas générées par un algorithme de synthèse, mais par une opération s'effectuant sans programme.
4 - Dans son principe du moins, car certains langages permettent des performances que d'autres n'autorisent pas (vitesse d'exécution plus grande, encombrement de mémoire moindre, etc.).
5 - Le programmeur s'adresse obligatoirement à l'ordinateur avec du langage, même dans la méthode du "tapissier, mais la syntaxe en est rudimentaire. L'algorithme met en jeu des syntaxes plus complexes.
6 - Voir l'article : "Le langage et l'expérience humaine", in Problèmes du langage, Paris, Gallimard, 1966.
7 - Même quand il s'attache à conserver une dimension gestuelle dans son rapport à l'ordinateur en autorisant une intervention directe interactive dans le déroulement des opérations, il doit programmer ce mode de relation.
8 - Ce hasard prévu n'en reste pas moins un hasard. Le programmeur est le premier surpris par l'image qu'il crée, ne serait-ce que sur le plan de la perception visuelle. Si le langage programmatique est un langage fonctionnel, excluant le hasard, l'image synthétisée n'en devient pas, par là même, inéluctablement fonctionnelle.
9 - Certains peintres ont commencé d'y échapper : Pollock, par exemple, qui cherchait à être dans la toile plutôt que face à elle.
10 - Position épistémique de toute la science classique.


   



[ S'informer ]   [ Recherche ]    [ Commander ]    [ Statistiques ]    [ Accueil ]


Copyright Association Leonardo/OLATS © 1997
pour toute re-publication de cette page, merci de contacter Annick Bureaud <info@olats.org>
pour les problèmes concernant le site, notre webmaster <webmaster@olats.org>
Leonardo is a federally registered trademark of Leonardo/ISAST -
Leonardo est une marque déposée de Leonardo/ISAST, selon la loi fédérale des Etats-Unis d'Amérique.