Habilitation à Diriger des Recherches

Formalisation de la vision bas niveau et application à la représentation des images





HDR soutenue le mardi 30 Mai 2000 à l'Université Paris 5.

Téléchargement du mémoire (format PostScript compressé par l'utilitaire gzip; ne contient pas les publications jointes au mémoire).

Jury :

Yves Meyer (Président)
Vicent Caselles
Donald Geman
Jean-Michel Morel
Bernard Rougé
Michel Schreiber

Résumé


Mes recherches portent sur la formalisation mathématique de la vision bas niveau et ses applications, notamment en compression d'images. La vision par ordinateur pose le problème de la détermination d'un modèle mathématique et de la définition d'une représentation par primitives qui soient adaptés à la caractérisation de l'information pertinente contenue dans les images numériques. Ces primitives ont vocation à servir de données à la plupart des algorithmes d'analyse d'images. Un exemple d'algorithme particulièrement intéressant est donné par la compression d'images à de faibles débits : il s'agit non seulement d'une technologie très demandée par notre société de communication, mais aussi d'une application permettant de valider rapidement la pertinence de la formalisation mathématique.

Mes travaux commencent avec les bases d'ondelettes orthogonales développées par I. Daubechies et Y. Meyer, qui offrent une alternative séduisante à la représentation trigonométrique classique par la base de Fourier. Avec A. Cohen, je montre qu'une représentation par ondelettes à support compact est supérieure à celle par Fourier pour l'opération d'échantillonnage. Ce travail aboutit à la mise au point du premier algorithme de compression d'images par ondelettes. Par la suite, je cherche à structurer géométriquement les primitives données par les coefficients en ondelettes, de manière à dégager l'information pertinente pour la perception visuelle et, dans le cadre de la compression, à réduire les corrélations spatiales et inter-échelles. J'utilise la représentation par maxima locaux du module d'une transformée en ondelettes dyadiques, due à S. Mallat et S. Zhong. Avec S. Mallat, je propose une représentation mixte basée sur les maxima locaux pour extraire l'information géométrique de contour, et sur une base d'ondelettes pour caractériser l'information résiduelle, laquelle à l'apparence de microtextures. Cette nouvelle approche me permet de réaliser un algorithme de compression structurant l'information contenue dans les images naturelles.

Si la théorie des ondelettes améliore de manière sensible les représentations harmoniques classiques, j'en arrive à conclure qu'elle ne peut donner une approximation de la géométrie dépourvue d'artefacts, lorsqu'on ne conserve qu'un nombre très réduit de primitives. Par la suite, je m'intéresse ainsi à des représentations géométriques qui ne dérivent pas de l'analyse harmonique. Dans un premier temps, il s'agit d'approfondir la ``grammaire de la vision'' proposée par l'école gestaltiste et qui se donne pour but la formalisation géométrique de la perception visuelle, à travers l'interprétation de figures simples. Avec J-P. D'Alès et J-M. Morel, je propose une relecture et une simplification des principes gestaltistes dans le cadre du traitement des images. Des expériences menées avec S. Masnou et J-M. Morel montrent comment les primitives qui servent à la reconstruction visuelle dans le cas de figures simples se retrouvent dans le cas des images naturelles, sous la forme de lignes de niveau. Ces travaux, qui s'ajoutent à ceux de V. Caselles, B. Coll, J-M. Morel et C. Sbert, m'amènent à proposer un modèle morphologique et compact, basé sur les lignes de niveau perceptuellement significatives. Le modèle utilise la variation totale et il suppose toute image naturelle comme somme d'une fonction à variation bornée, qui contient l'information géométrique, et d'une fonction à variation non bornée, laquelle supporte les microtextures. Je montre qu'une représentation mixte par des primitives géométriques (pour la composante à variation bornée) et par ondelettes (pour la composante à variation non bornée) offre une alternative intéressante aux représentations entièrement harmoniques. Ces avantages sont exploités pour définir une méthode de compression respectueuse du système visuel.

En parallèle à ces travaux, je crée un logiciel de traitement d'images libre et ouvert, MegaWave1 puis MegaWave2 qui, grâce à l'apport de nombreux collaborateurs, participe à la reproductibilité de la recherche. MegaWave2 est reconnu par une centaine d'universités et de centres de recherches.