Suivi multi-objets dans les images
Sans connaissances a priori sur les objets, leur nombre et leurs trajectoire, on cherche à prédire les déplacements d'objets dans des séquences vidéo. Dans notre cas, on s'intéresse de plus aux séquences multimodales, c'est-à-dire acquise par un ensemble de capteurs, chacun délivrant une modalité spécifique (CCD, infra-rouge, etc.). Les observations dont on dispose sont donc nombreuses.
Filtrage particulaire
Parmi les méthodes de suivi, nous travaillons principalement sur les filtres particulaires, qui consistent à estimer les lois des objets à suivre conditionnellement aux observations disponibles à l'aide d'un ensemble de particules pondérées. Cette approche méthodologique vise à estimer des lois (ici celles des objets à suivre en deux temps :
- une première étape dite de prédiction qui consiste à utiliser une loi de transition (via une fonction de proposition) pour prédire la loi recherchée,
- une seconde etape d'estimation, consistant à corriger cette prédiction à l'aide des observations courantes, par le biais d'une fonction de vraisemblance.
Choix et positionnement scientifiques
Bien que le filtrage particulaire soit beaucoup utilisé pour le suivi multi-objets, certains problèmes inhérents à la méthodologie n'ont pas été résolus encore parfaitement. Nous avons en particulier choisi de travailler sur les suivants.
- Nous souhaitons augmenter la qualité d'estimation des lois en traitant de manière exhaustive l'information dont on dispose. Pour le suivi d'objets, cela signifie augmenter la taille des espaces d'état et d'observation. Les approches classiques ne permettent pas de prendre en compte des dimensions trop grandes, car cela peut rendre la résolution du problème impossible. Nous proposons d'utiliser d'autres types d'approche d'inférence dans l'étape de correction, pour pouvoir traiter des observations multimodales et des états complexes.
- L'étape de prédiction nécessite l'utilisation d'une fonction de transition. Le plus souvent, on utilise des connaissances a priori sur la loi que l'on cherche à estimer, provenant par exemple, des événements passés, ou tout simplement d'hypothèses de départ. Nous travaillons sur l'utilisation de fonctions de proposition et lois de transitions pour avoir une prédiction réellement adaptée aux données dont on dispose. Pour cela, nous intégrons des relations spatiales floues pour rendre les hypothèses plus souples sur les lois de transitions.
- Dans les approches classiques on suppose que les dépendances entre observations, entre les états, et entre observations et états sont les mêmes. Quand on se place dans un cadre de séquences multimodales, on ne dispose pas de toutes les modalités à chaque instant, de plus, en cas d'occultation, d'apparition ou de disparition, tous les objets ne sont pas visibles à un isnatnt donné. Il est dans ce cas plus intéressant de supposer que le schéma d'inférence est différent à chaque instant et donc d'adapter ce dernier au cas rencontré.