École Nationale Supérieure des Mines de Paris

logo

Centre de Morphologie Mathématique 

RESUME DE THESE

Segmentation interactive d'images fixes et séquences vidéo basée sur des hiérarchies de partitions

Auteur : Francisca Zanoguera



Date de soutenance: 13/12/2001, à 14h30
Lieu : Grand Amphithéâtre, sur le site de Fontainebleau
Téléchargement: thèse complète au format Postscript compressé.

Résumé

Cette thèse présente des algorithmes de segmentation interactive d'images et de séquences vidéo génériques, en réponse aux besoins croissants en outils de segmentation et manipulation de séquences vidéo, que ce soit dans le domaine du codage (MPEG-4), de l'indexation (MPEG-7), de l'infographie, ou même dans des applications d'édition grand public motivées par l'apparition de caméscopes numériques de prix abordable. La grande variété des images et séquences vidéo rencontrées dans le domaine multimédia rendent tout projet de segmentation automatique extrêmement complexe. C'est pourquoi nous avons préféré développer un ensemble d'outils de segmentation interactive permettant une segmentation très efficace au prix d'un minimum d'interaction.

Pour permettre une grande flexibilité et des temps de réponse rapides, nous avons choisi une représentation riche et analytique du contenu de la séquence, en forme de partitions emboîtées. En quelque sorte, nous détectons tous les contours possibles dans l'image, chacun avec un indice indiquant sa force. L'étape de segmentation proprement dite offrira à l'utilisateur divers mécanismes de sélection finale des contours qui réellement l'intéressent. Ainsi de multiples segmentations sont possibles sur cette représentation hiérarchique, sans nécessiter de nouveaux calculs.

Dans un premier temps, nous étudions différentes hiérarchies associées aux inondations morphologiques, ainsi que plusieurs mécanismes permettant l'introduction de connaissances a priori quand elles sont disponibles. Dans un deuxième temps, les notions présentées pour les images fixes sont étendues aux séquences vidéo en utilisant une approche 3D-récursive. Ainsi, une unique hiérarchie associée à une séquence vidéo complète est calculée. Des outils d'interaction sont proposés permettant à l'utilisateur de manipuler la hiérarchie de manière intuitive et transparente. Grâce aux représentations en forme d'arbre utilisées, la manipulation de la hiérarchie se fait avec un très faible coût de calcul et les résultats de l'interaction sont perçus par l'utilisateur comme étant immédiats.


[Accueil] [Commentaires]