Chapitre 8 : Applications (suite)



Structuration du document

Nous proposons au bout de ce lien la structuration linéaire et relationnelle obtenue pour le document vidéo jornaldanoite2 . Cette structuration est présentée de façon à utiliser au maximum l'interactivité avec le lecteur. Ainsi la première page donne de façon linéaire le découpage en scènes obtenu, chaque scène étant représentée par une seule image clé (la première de la scène). Une représentation plus détaillée de chacune des scènes extraites est alors accessible par simple clic sur cette image. On accède ainsi à une page contenant l'ensemble des prises de vue de la scène correspondante, chacune étant également représentée par sa première image clé. Les autres images clés choisies de façon automatique pour une prise de vue donnée (une fois la détection de changement interne aux prises de vue effectuée) sont accessibles en cliquant à nouveau sur cette première image clé.

La page apparaissant alors fournit non seulement l'ensemble des images clés pour la prise de vue courante, mais également divers renseignements sur son type, ses début et fin, etc. Les relations déterminées pour cette prise de vue sont également disponibles, toujours sous la forme d'une image clé par prise de vue en relation. Il suffit également de cliquer sur ces images clés pour accéder à la prise de vue en relation désirée. Notons la correction de flashes, pour les prises de vue 62, 206 et 668, ainsi que la détection de présentateur (indiqué par le label "newscaster" pour les prises de vue correspondantes) et le découpage en scènes qui en découle.

La robustesse de notre algorithme par rapport aux mouvements de caméra est par ailleurs très bien illustrée par le morceau de séquence allant de la prise de vue 278 à la prise de vue 282, pour lequel la scène est filmée d'une caméra placée à l'intérieur d'une voiture en mouvement sur une petite route de montagne.

Enfin nous invitons le lecteur à tester les relations établies par comparaison des images clés, ainsi que le découpage en scènes obtenu, tout au long du document vidéo.

En résumé la structure linéaire du document vidéo est proposée sous la forme de trois niveaux hiérarchiques successifs : ensemble des scènes, pour chaque scène ensemble des prises de vue, et pour chaque prise de vue, ensemble des images clés. Une autre représentation sous la forme de deux niveaux hiérarchiques et donnant une vision plus globale du découpage effectué, est également proposée au bout de ce lien. Cette autre version présente cependant l'inconvénient de poser des problèmes de visualisation éventuels, suivant le type de machine et la version d'Internet Explorer utilisés sous Windows, du fait de la taille mémoire nécessaire à l'affichage de cette première page.


Demarty - Beucher / © 2000 CMM - ARMINES - Ecole des Mines de Paris
Dernière mise à jour : 11-02-2000