ECOLE
NORMALE SUPERIEURE DE CACHAN
CMLA/Département de
Mathématiques
61, av. du Président Wilson 94235
CACHAN Cedex
tel. : 01 47 40 59 02
Master recherche spécialité
``Mathématiques Appliquées'' (2ème
année)
M2
parcours MATHEMATIQUES / VISION /
APPRENTISSAGE
2007 / 2008
Directeur :
Alain Trouvé
Directeur adjoint : Bernard Chalmond
ETABLISSEMENTS CO-HABILITES SUR CE PARCOURS DU MASTER (et enseignants affectés)
Ecole
Normale Supérieure de Cachan
Département de
Mathématiques
CMLA (UMR 8536)
Jean-François
Aujol, Bernard Chalmond, Jean-Michel Morel, Mila Nikolova, Alain
Trouvé
Université
de Paris 5
UFR de mathématiques et Informatique
MAP5
(UMR 8145)
Agnès Desolneux, Christine Graffigne, Lionel
Moisan
Université
de Paris-Dauphine
Département de
Mathématiques
Ceremade (UMR 7534)
Laurent Cohen, G.
Peyre
Ecole
Polytechnique
Département
Maths Appliquées et Informatique
CMAP (UMR 7641)
Emmanuel
Bacry, Stéphane Mallat
Ecole Nationale Supérieure
des Télécommunications de Paris
(ENST)
TSI (UMR 5141)
Isabelle Bloch, Julie Delon, Yann Gousseau, Yves Grenier,
Henri Maître, Jean-Marie Nicolas
Ecole
Centrale Paris (ECP)
Nikos
Paragios
Ecole
Nationale des Ponts et Chaussées (ENPC)
CERTIS
J.-Y.
Audibert, Maureen Clerc, Renaud Keriven,
Ecole Généraliste d'Ingénieurs de Marseille (EGIM)
AUTRES
ETABLISSEMENTS PARTICIPANT A CE PARCOURS
Ecole Normale Supérieure de Paris
Laboratoire
Odyssée
Olivier Faugeras, Théo Papadopoulo
Equipe
WILLOW
Jean
Ponce, Francis Bach (INRIA)
LPSENS
(UMR 8550)
Jean-Pierre Nadal
Ecole
des Mines de Paris
Pierre Rouchon, Jean-Philippe Vert
Université
Paris 13
Françoise Dibos, François Malgouyres
INRIA Sophia Antipolis
Equipe
Asclepios:
N.
Ayache, H. Delingette, X. Pennec, et G. Malandain
INRIA
Futurs
Rémi Munos
OBJECTIFS PEDAGOGIQUES, SCIENTIFIQUES, PROFESSIONNELS DU PARCOURS
Ce parcours de master comporte des cours théoriques assortis, pour la plupart, de travaux pratiques pour éprouver la validité des modèles et des algorithmes. L'examen peut consister en problème en temps limité ou, sur demande motivée, en un projet sur ordinateur. Toutes mesures sont prises pour que les étudiants physiciens, informaticiens, mathématiciens ou ingénieurs de formation aient des chances égales de réussir brillamment.
Sur le plan pédagogique il s'agit d'offrir une initiation cohérente et solide à tout un faisceau de concepts, modèles, et techniques mathématiques (ou informatiques) de haut niveau applicables à la vision, à la perception, à l'apprentissage, en focalisant les enseignements sur des domaines de recherche très actifs : la vision artificielle, l'analyse automatique du signal et de l'image, l'émulation des comportements perceptifs ou adaptatifs de l'homme. Ce parcours de master se place donc dans la perspective du développement rapide et passionnant des mathématiques appliquées à la modélisation et à l'émulation de l'intelligence humaine, développement soutenu par la montée en puissance accélérée des sciences du cerveau.
Depuis
dix ans, ces champs applicatifs importants attirent l'intérêt
d'un nombre croissant de mathématiciens, liés à
des domaines de recherche mathématique en pleine activité
: analyse harmonique, analyse en ondelettes et traitement du signal,
méthodes variationnelles et EDP en analyse d'images,
relaxation stochastique, champs markoviens, géométrie
algèbrique et algèbre effective en vision artificielle,
théorie des déformations élastiques appliquée
à l'imagerie automatique et à la reconnaissance de
formes, théories de l'information et reconnaissance des
formes, théories probabilistes de l'apprentissage,
modélisations de textures et de backgrounds, modèles
statistiques parcimonieux et réseaux neuronaux formels,
modélisation de tâches intelligentes par minimisation de
fonctions de coût complexes.
Au plan
professionnel, des débouchés vers les grands
laboratoires de recherche franco-européens, privés
(Aérospatiale / Alcatel / Sagem/ General Electric / Matra /
Philips / Siemens / Thomson / Xerox etc...) ou publics (CEA / CNES /
INRA / INRIA / ISPRA / LETI etc...) sont évidemment ouverts
aux bons thésards ou étudiants doctorants formés
dans un master de ce type.
Les
débouchés vers l'enseignement supérieur
s'orienteront d'une part vers les départements de
Mathématiques Appliquées, et d'autre part vers certains
départements d'Informatique.
Les offres de stages et
de thèses sur un des thèmes du parcours, souvent déjà
financées, sont supérieures en nombre aux étudiants
inscrits.
Le nombre d'étudiants inscrits était de
21 en 1999-2000, de 33 en 2000-2001, de 61 en 2001-2002, de 66 en
2002-2003, et de 56 en 2004-2005.
DESCRIPTION RESUMEE DU PARCOURS
Le parcours de master propose une initiation cohérente et solide à un faisceau de concepts, modèles et techniques mathématiques (ou informatiques) de haut niveau applicables à la vision par ordinateur, la perception et l'apprentissage. Il se compose de cours orientés vers les mathématiques appliquées à la vision par ordinateur et aux réseaux neuronaux, ainsi que de cours à vocation plus informatique, fournissant ainsi une formation à la fois théorique et pratique sur les thématiques développées, dont voici une liste :
Analyse harmonique et analyse en ondelettes en traitement du signal et de l'image
Méthodes variationnelles et EDP en analyse d'images
Relaxation stochastique et champs markoviens
Théorie des déformations élastiques appliquée à l'imagerie automatique et à la reconnaissance des formes
Théories de l'information et reconnaissance de formes
Théories probabilistes de l'apprentissage
Modèles statistiques d'images
Modèles statistiques parcimonieux et réseaux neuronaux formels
Modélisation de tâches intelligentes par minimisation de fonctions de coût complexes
Analyse du son
La
majorité des cours sont accompagnés de travaux
pratiques sur ordinateur. L'ENS Cachan a installé une salle
dédiée au master à cet effet.
La
deuxième année de master se fait donc en deux
trimestres et un stage dans un laboratoire de recherche (Université,
INRIA, CEA,...) ou dans l'industrie.
L'équipe
pédagogique est encadrée par le Département de
mathématiques de l'ENS de Cachan. Ce département
héberge également le secrétariat du master
(deuxième année), la majorité des cours, et en
assume la responsabilité scientifique.
Les
cours ont lieu majoritairement à l'ENS Cachan. Certains cours
se déroulent à l'Ecole Polytechnique ou à
l'ENST. Dans les trois centres, des travaux pratiques sont
organisés.
Sous réserve de modification :
ENS
Cachan :
Salle
de cours : salle 103, 1er étage du bâtiment
Cournot, ENS de Cachan
Salle informatique : salle 109, 1er
étage du bâtiment Cournot, ENS de Cachan
Ecole
Polytechnique :
Salle
d'informatique pour les TP à l'Ecole Polytechnique : salle
n° 35
Ecole
Centrale de Paris :
Les cours de master de reconstruction et traitement numérique
des images médicales (Nicolas Ayache) auront lieu à
l'Ecole Centrale de Paris avec des élèves de 3ème
année de l'option Mathématiques Appliquées ayant
choisi ce module de spécialisation.
Lieu : Grande Voie
des Vignes, 92295 Chatenay Malabry
Tél : 01 41 13 10 00
Site web : http://www.ecp.fr/
Contact sur place : M. de Lessan, inspecteur des études
mdelessa@ads.ecp.fr
tel :
01 41 13 11 67
Dates
et horaires des cours : cf. planning
ENST-TSI
:
Les cours d'Yann Gousseau et ceux d'Yves Grenier ont lieu à
l'Ecole Nationale Supérieure des Télécommunications
46,
rue Barrault
75013 Paris (M° Corvisart)
plan
Université
Paris I :
Les cours de Marie Cottrell ont lieu Salle
B15-11
Samos-Matisse
Université Paris I
90, rue de
Tolbiac
75634 Paris Cedex 13
REGLEMENT DU MASTER CONCERNANT LES STAGES ET LEUR VALIDATION
Choix du stage : le candidat choisit librement un stage proposé par l'un des enseignants du master, ou un stage proposé dans le cadre de la "bourse des stages", ou un stage d'origine différente ayant reçu l'agrément d'un enseignant du master. Le stage doit être effectué après l'inscription au master. Il doit présenter un enjeu scientifique réel et le développement applicatif d'un des thèmes développés dans le master. En cas de doute, le Directeur ou le Directeur adjoint du master nomment un rapporteur de l'équipe enseignante du master.
Démarches
administratives : chaque étudiant doit remplir une fiche
de stage (disponible sous formes électroniques sur la page
principale du M2 MVA) et la
faire viser par le responsable du parcours afin qu'une convention de
stage puisse être établie avant le début du stage
(attention, prévoir un délai d'environ une à
deux semaines pour l'établissement de la convention).
Durée
du stage :
quatre mois minimum, entre le 1er avril et le 20 septembre.
Sauf
dérogation exceptionnelle (pour les élèves de
l'École Centrale Paris par exemple, contraints à un
stage de 6 mois), le stage doit se terminer au plus tard le 20
septembre.
Rapport :
chaque étudiant doit remettre au secrétariat du master
un rapport écrit sur son stage, le plus complet et le plus
illustré possible, avant le 20 septembre
(date de
réception par le secrétariat). Cette date est
impérative.
Ce rapport sera mis à la disposition du
jury de master. Les rapports de stage seront consultables par les
élèves du master.
Soutenance
: la
présentation orale du travail de stage est fortement
conseillée. Cette soutenance peut avoir lieu n'importe où
avant le 20 septembre (sauf dérogation) et doit si possible
inclure un enseignant du master dans le jury.
Note
: La note sur
20 doit être proposée par le responsable du stage, selon
la grille proposée dans la fiche de stage. Une lettre
indiquant le travail de recherche effectué, les résultats
obtenus, et évaluant la performance du candidat peut être
jointe afin de faciliter l'évaluation du stage par le
jury.
Prise en compte de la note :
Le jury du master se réserve le droit de modifier la note de
stage pour la mettre en harmonie avec les autres notes. Une note de
stage supérieure à 10/20 est impérative pour
obtenir le master. La note de stage est prise en compte pour l'octroi
d'une mention.
M2 parcours Mathématiques /
Vision / Apprentissage
2007 /
2008
RÉSUMÉS DES COURS
COURS MATHÉMATIQUES / VISION /
AUDIO
A. ALMANSA, L. MOISAN
«
Modélisation en traitement d'images»
L'objectif
de ce cours est de confronter la modèlisation mathématique
du traitement d'images à l'expérimentation numérique.
Les thèmes abordés couvriront un spectre assez large,
afin de mettre en valeur plusieurs aspects de cette modélisation
: axiomatique ou principes variationnels, passage du continu au
discret et mise en oeuvre numérique, interprétation ou
élimination des paramètres, etc.
Ce cours sera
accompagné de séances de travaux pratiques sur
ordinateur à l'aide du logiciel public MegaWave2.
1.
Formation et représentation des images numériques.
Principe de perspective, homographies. Distorsions optiques :
diffraction, défocalisation, aberration chromatique,
astigmatisme et coma. Capteurs. Echantillonnage. Analyse de Fourier
et théorie de Shannon : interprétation de l'aliasing,
du ringing et du flou.
2. Interpolation et transformations
géométriques.
Sinus cardinal discret, FFT et
DCT, interpolations directes et indirectes (splines). Translation non
entière, rotation, zoom. Réduction par atténuation
spectrale (gaussienne, prolate) ou par projection (Shannon, splines).
3. Le modèle morphologique.
Décomposition
radiométrique (histogramme) et géométrique
(lignes de niveau) d'une image. Egalisation
d'histogramme,
estimation d'un changement de contraste. Propriétés et
calcul des lignes de niveau.
4. Opérateurs locaux.
Pixel infinitésimal et opérateurs différentiels.
Calcul effectif de l'orientation, de la courbure. Lien entre filtrage
isotrope et flou gaussien : application au déflouage (filtre
de Gabor). Opérateurs itérés et équations
aux dérivées partielles, introduction de l'échelle.
Consistance, Stabilité, Convergence. Propagation de fronts et
discrétisation des opérateurs morphologiques.
5.
Le modèle variationnel.
Interprétation des
opérateurs locaux classiques, généralisation aux
M-filters. Modèle Ku+n pour la restauration d'images,
filtre de Wiener, régularisation H1 et BV, lien avec le
formalisme bayésien et les EDP. Recalage et application à
la super-résolution.
6.
Détection statistique a contrario.
Principe de
Helmholtz, événements significatifs. Application à
la détection d'alignements. Statistiques des images naturelles
et généralisation du principe de Helmholtz. Application
à la détection de contours (frontières
significatives). Comparaison avec le détecteur de Canny et les
contours actifs (snakes). Validation psychophysique du principe de
Helmholtz.
Pour plus de détails, voir ici.
J-F. AUJOL, M. NIKOLOVA, F. MALGOUYRES
«
Calcul des variations, méthodes d'optimisation, et
applications »
Ce cours s'articule en deux parties et est illustré par des séances de travaux pratiques.
Après avoir présenté les problèmes inverses mal posés, la première partie du cours s'intéresse à la méthode directe du calcul des variations. On introduit les outils mathématiques nécessaires à la modélisation, afin de pouvoir étudier quelques problèmes du traitement d'images (restauration, déconvolution, décomposition). On montre comment construire une fonctionnelle consistante avec les hypothèses de modélisation et qui reste mathématiquement bien posée (existence et unicité d'une solution).
Dans un deuxième temps, on s'attaque concrètement aux problèmes d'optimisation étudiés dans la première partie en proposant des algorithmes numériques pour les résoudre. L'étude commence par la minimisation de fonctionnnelles différentiables avec ou sans contraintes. On continue ensuite en présentant les méthodes numériques pour traiter la minimisation de fonctionnelles non différentiables.
L'ensemble du cours sera illustré par des Travaux Pratiques permettant à l'étudiant de se confronter à une vaste gamme de problématiques du traitement d'image (restauration d'images, zoom, déquantification,décomposition d'images, basis pursuite).
N. AYACHE, H. DELINGETTE, X. PENNEC et G.
MALANDAIN
«
Reconstruction et traitement numérique des images médicales
(I et II) »
L'objectif
du cours est de présenter un ensemble cohérent d'outils
algorithmiques permettant
le traitement numérique des
images médicales. Les applications visées sont l'aide
au diagnostic
et à la thérapeutique.
Les 7
premiers cours introduisent la problématique générale
du domaine, et les principes
physiques qui permettent d'acquérir
les principales modalités d'imagerie
(Radiographies X,
Tomographie par rayons X, Imagerie par Résonance Magnétique,
Scintigraphies, Echographies).
On y aborde également le
traitement des radiographies, et le prétraitement des images
volumiques
(topologie discrète 3-D, morphologie
mathématique 3-D, Filtrages 3-D).
Les 7 cours suivants
introduisent des traitements d'images volumiques plus spécialisés,
notamment pour la fusion d'images (approches géométriques,
iconiques, hybrides),
la segmentation d'images (approches
statistique, ou par surface active explicite ou implicite),
et la
simulation de chirurgie (modélisation des tissus mous).
Une
conférence donnée par un industriel du domaine et/ou la
visite d'un site industriel viendra
compléter ces
présentations. Par ailleurs, les étudiants du master
qui le souhaitent pourront participer
aux séances de TD
associées aux cours.
Les cours auront lieu à
l'Ecole Centrale de Paris, avec des élèves de 3ème
année de l'option
Mathématiques Appliquée
ayant choisi ce module de spécialisation.
Adresse : Grande
Voie des Vignes, 92295 Chatenay Malabry Tél : 01 41 13 10 00
Site web : http : //www.ecp.fr/
Contact sur place : M. de
Lessan, inspecteur des études <mdelessa@ads.ecp.fr>
tel
: 01 41 13 11 67
Les intervenants sont : Nicholas Ayache
(NA), Grégoire Malandain (GM), Hervé Delingette (HD),
tous trois chercheurs à l'Inria Sophia-Antipolis au sein
du projet Epidaure (Imagerie et robotique médicale),
et
Régis Vaillant (RV), ingénieur de recherche chez
General Electric Medical Systems (Buc).
Les dates et horaires
des cours sont présentés sur la page lieu des cours.
E. BACRY
«
Traitement du signal sonore, analyse temps-fréquence »
Ce cours
traitera des différentes techniques plus spécifiques au
traitement des signaux sonores
(parole et/ou musique) et
notamment aux analyses temps-fréquence.
Des problèmes
liés aussi bien à l'analyse, à la
reconnaissance, à la déformation ou à la
synthèse
des signaux sonores seront abordés.
L'enseignement sera organisé en deux parties distinctes :
un cours (d'environ 12h) sera d'abord
dispensé à
la suite duquel les élèves devront réaliser un
projet en relation avec le cours.
L. COHEN et G. PEYRE
«
Modèles
déformables elastiques de courbes et de surfaces en traitement
d'Images »
Ce cours présente l'utilisation de courbes et de surfaces non-rigides pour l'analyse d'images, de surfaces et de donnes en grande dimension. Les modèles déformables sont devenus des outils incontournables pour résoudre les problèmes de vision par ordinateurs tels la segmentation d'images ou la reconstruction de surfaces 3D. Des idées similaires ont émergées récemment en infographie et analyse de donnes de grande dimension. Dans tous ces domaines, des apriori géométriques permettent de contraindre des problèmes difficiles tel que l'optimisation de maillages ou la paramétrisation de collections d'images. Ces surfaces déformables sont contraintes à minimiser une énergie traduisant les a priori géomtriques de chaque problème. Ce cours propose ainsi un panorama des méthodes variationelles et des équations aux dérivées partielles utilisées pour manipuler et optimiser ces courbes et surfaces non-rigides. Une partie du cours étudie en particulier l'extraction de ces chemins minimaux et les connexions avec les géodsiques sur des surfaces 3D et les graphes en grande dimension. La figure 1 montre un exemple de calcul géodsique sur une surface triangulée

Le cours
est assorti de nombreuses illustrations par des applications en
imagerie médicale 2D et 3D, aérienne et industrielle,
ainsi que des démos sous matlab. Des séances de TP sur
machine viendront compléter le cours. Sur la page
web du cours les étudiants pourront trouver des supports
de cours (polycopis et transparents), les énoncés
interactifs des TP (avec figures et code matlab), des articles
complétant les détails du cours ainsi que la liste des
projets à faire pour valider le cours. Plusieurs stages,
éventuellement poursuivis par une thèse, sont possibles
en traitement d'images, au CEREMADE ou en entreprise. Contactez nous
assez tôt par courrier électronique en joignant un CV.
A. DESOLNEUX
«
Analyse d'images et géométrie stochastique »
Ce cours porte sur les applications systématiques d'un principe de l'analyse d'images appelé principe de Helmholtz.
Selon ce principe, toute grande déviation d'une répartition stochastique uniforme engendre une perception.
Inversement,
"on ne voit rien dans le bruit". Il est étonnant
qu'un principe aussi général permette de mener des
calculs effectifs de détection de structures dans les images
digitales, et que ces seuils correspondent assez bien aux seuils de
perception observables chez les humains. Nous essayerons de montrer
que c'est pourtant le cas, en traitant les problèmes de
détection suivants :
-alignements dans une image digitale
-détection de bords
-détection de parallélisme
-calcul automatique des points de fuite.
Les connaissances
mathématiques requises sont standard. Tous les éléments
nouveaux feront l'objet d'un rafraichissement. Il s'agit de notions
de probabilité, notamment lois des grands nombres, grandes
déviations, inégalités de Hoeffding, entropie
relative, géométrie stochastique et éléments
d'analyse de Fourier. Un polycopié sera disponible (en
anglais).
Des séances de travaux pratiques sont
assurées par Julie Delon.
« Méthodes variationnelles pour l'analyse de séquences vidéo.»
1) Présentation des formulations variationnelles usuelles pour la détermination du flot optique : Régularisation L2, anisotropique et BV.
2) L'espace des fonctions à variation bornée, principaux théorèmes :semi continuité, approximation, compacité, trace, formule de la coaire, régularité de l'ensemble des sauts.
3) Optimisation de formes : application au tracking.
4) Transport de masses : application au recalage.
Bibliographie.
-Measure
theory and the properties of functions. Evans , Gariepy.CRC
Press, Boca Raton, FL, 1992
-Shapes and geometries. Delfour,
Zolsio. SIAM Philadelphia, PA, 2001.
-Variational optic flow
computation with a spatio temporal smoothness constraint. Weickert,
Schnrr. Journal of Mathematical Imaging and Vision, 14, p245-255,
2001.
Y. GRENIER
«
Traitement de Signaux Audio-Fréquence »
Responsable: Yves
Grenier
Enseignants: Yves Grenier, Jean-Marie Nicolas, Gaël
Richard.
Objectifs et contenu
Ce cours propose de parcourir, depuis les bases méthodologiques et théoriques jusqu'aux applications, les domaines de l'acoustique et des signaux audio-fréquence. Ces domaines donnent lieu actuellement à de nombreux développements dont la plupart touchent même à notre vie quotidienne, dans nos loisirs (musique, home studio, multimedia, home cinema...) ou dans nos activités professionnelles (entrées vocales sur nos PC).
Dans ce domaine, comme dans de nombreux domaines du traitement du signal, il y a une interaction profonde entre la compréhension physique des phénomènes, leur modélisation mathématique et la finalité applicative. Le cours aura pour objectif de faire percevoir cette interaction en présentant ces trois aspects de manière conjointe. Nous étudierons surtout les applications de prise de son et de restitution du son, en nous concentrant en particulier sur les méthodes permettant de recréer un relief sonore.
Quelques rappels sur les bases physiques de la production et de la propagation des sons introduiront les bases physiques nécessaires pour le cours. Prise et restitution des sons ne pouvant se déconnecter de l'environnement acoustique dans lequel elles se font, nous approfondirons donc les modèles décrivant l'acoustique d'une salle. Nous étudierons ensuite la modélisation des transducteurs électro-acoustiques et leur emploi en prise des sons et en sonorisation. Nous verrons comment les techniques de traitement numérique du signal permettent désormais de fournir une restitution spatialisée du son, et de recréer artificiellement la réverbération d'un lieu d'enregistrement.
L'enseignement se fait sous forme de leçons, complétées par des travaux pratiques. Ces derniers, réalisés par programmation sous Matlab, permettront à l'étudiant de concrétiser sur des signaux réels ses acquis théoriques. L'un d'eux comporte aussi une séance de mesure en chambre sourde.
Y. GOUSSEAU
«
Introduction à l'image numérique »
Cet
enseignement constitue une première approche de l'image
numrique et a pour but de donner aux étudiants une bonne
intuition concernant les principaux ingrédients de la
structure des images (géométrie, texture, couleur,
artefacts d'acquisition), ainsi qu'une connaissance des outils les
plus classiques de l'amélioration des images (suppression du
bruit, amélioration du contraste, déconvolution). Un
deuxième objectif du cours est de confronter dans une approche
thématique divers outils mathématiques approfondis par
ailleurs dans le master (Ondelettes, EDP, champs de Markov). Ce cours
est assuré par plusieurs enseignants-chercheurs de l'ENST, et
sera aussi souvent que possible illustré par des exemples
d'application issus des domaines de l'imagerie arienne, de l'imagerie
médicale ou de l'archivage du patrimoine culturel.
Plan
du cours (chaque sance : 3h, les cours ont lieu l'ENST)
1)
Acquisition et traitement de l'image numérique I (Y.
Gousseau):
échantillonage bidimensionnel, filtrage
linaire, bruit, introduction au débruitage et la
déconvolution.
2) Acquisition et traitement de l'image numrique II (J. Delon):Quantification, contraste, modifications de contraste, introduction aux techniques de transport
3)
Contours et régions dans les images (J. Delon):
Détection et rôle des contours (filtrage de Canny et
variantes, poursuite et fermeture des contours,
contours actifs), segmentation par zones
(méthodes
par histogramme, partage et réunion, croissance de régions,
Mumford et Shah, Minimum Description Length)
4)
Statistiques des images naturelles (Y. Gousseau):
Non-gaussianité,
lois d'échelle, modèles stochastiques pour les images
naturelles, décompositions d'images, espaces fonctionnels
pour les images.
5)
Analyse et synthèse de textures (Y. Gousseau)
Représentation et rôle des textures, outils d'analyse
(Gabor, ondelettes, matrices de coocurrences, Champs de Markov),
méthodes de synthèse ad'hoc (modèles de
réflexion, shot noise, fractals), méthodes de synthèse
génériques (ondelettes, méthodes par
rechantillonnage ou copier coller, desoccultation et inpainting)
6)
Extraction et repérsentation de formes (Y. Gousseau)
Extraction de formes paramétriques (moindres carrés,
Hough, ransac),
codage des courbes de Jordan et rôle
de la courbure, représentation par lignes de niveau, mise en
correspondance de formes.
7)
Représentation et traitement des images couleurs (F.
Schmitt)
Introduction la perception des
couleurs et la colorimétrie, espaces
couleurs, traitements couleur.
R. KERIVEN
«
Vision par ordinateur: reconstruction 3D»
La reconstruction tridimensionnelle d'objets à partir de photographies a de nombreuses motivations et applications: robotique, reconstruction automatique d'environnements virtuels, trucages vidéo, etc. Il s'agit d'un des plus anciens problèmes de vision par ordinateur et n'est pourtant toujours pas résolu. Les mathématiques et l'algorithmique qu'il sollicite sont variées, parmi lesquelles on peut compter: optimisation continue et discrète, optimisation de forme, géométrie algorithmique, calcul différentiel et théorie des graphes.
A
travers de nombreux exemples et projets, nous essayerons de
comprendre où est en réellement l'état de l'art
et quels sont les défis et les questions encore ouvertes. Les
sujets abordés seront:
- photogrammétrie
(corrélation, points d'intérêts, ...)
-
méthodes discrètes (programmation dynamique, belief
propagation, graph cuts)
- stereo multivues (space carving, ...)
-
méthodes variationnelles (level sets, maillages déformables,
...)
- problèmes de visibilité et d'occlusion
-
utilisation de processeurs graphiques
- extraction de textures
-
a priori de formes
- stereo spatio-temporelle
Ils sont
complémentaires d'un cours sur la géométrie de
la vision par ordinateur, sujet qui ne sera pas abordé ici.
S. MALLAT
«
Estimation / Compression par ondelettes »
Traiter des
signaux de grande taille tels que des images ou des sons nécessite
de construire des
représentation permettant d'approximer
ces signaux par un petit nombre de coefficients. L'élaboration
et l'analyse d'algorithmes non-linéaires est alors
considérablement simplifiée. Le cours étudie des
applications pour la compression d'images, le débruitage
et la solution de problèmes inverses.
Les sujets suivants seront abordés :
-
Approximations linéaires et non-linéaires dans des
bases ;
- Modèles d'images par fonctions à
variation bornée ;
- Approximations dans des bases
d'ondelettes ;
- Compression d'images ;
- Estimation minimax
linéaire et non-linéaire pour le débruitage ;
-
Déconvolution d'images .
Quelques
problèmes ouverts seront discutés.
Y. MEYER
«
Compressed Sensing»
Le
compressed sensing (du à Emmanuel Candes et al.) a introduit
une vraie révolution en traitement du signal et de l'image.
Voici de quoi il s'agit:
Des classes importantes de signaux
``structures" peuvent être reconstruits a l'aide
d'échantillonnages qui, du point de vue de toutes les théories
existantes (Shannon, etc) devraient etre interdits comme l'est la
conduite en état d'ivresse. Il faut bien sûr donner un
sens tres précis aux ``structures" en jeu et ce sera l'un
des objets du cours. L'autre étant de donner des énoncés
précis et des preuves.
J.-M. MOREL
«
Les filtres itérés d'image et leur lien avec les
équations aux dérivées partielles »
Il est
recommandé de suivre en paralèlle le cours de d'Andres
Almansa et Lionel Moisan
POLYCOPIE : En anglais.
Téléchargeable
ici
DESCRIPTION
DU COURS:
Le but du cours est de montrer l'équivalence
entre plusieurs filtres d'images classiques et des équations
aux dérivées partielles qui en donnent une formulation
plus invariante. Le cours permettra de comprendre mieux la
nature des filtres linéaires d'images et celle des filtres
invariants par changement de contraste. En effet l'analyse par
équations aux dérivées partielles permet de
démontrer que beaucoup de ces filtres sont en fait équivalents
entre eux et une formulation par EDP qui permet d'en définir
des implémentations plus invariantes.
Les prérequis
du cours sont seulement une habitude du raisonnement math?atique et
quelques notions élémentaires de calcul diffrentiel et
d'analyse. Pour le contrôle un problème sera proposé
mais aussi des projets de lecture ou d'implémentation pour
ceux qui préfèrent. Le cours durant trois heures, je
m'arrangerai pour traiter deux thèmes distincts chaque séance
pour éviter la saturation.
Il est recommandé de
suivre en parallle le cours et les TPs de d'Andres Almansa où
la plupart des filtres dont je parle seront décrits plus en
détail et implémentés.
PROGRAMME DU
COURS
A-EQUATION DE LA CHALEUR
Le modlèe
Existence
unicité régularité
Preuve du principe que
tous les filtres linéaires itérés convergent
vers
l'équation de la chaleur
Applications : filtres
directionnels, détection de bords, de Canny et de
Haralick,
et quatre algorithmes pour lisser les formes
B-MORPOHOLOGIE
MATHEMATIQUE (la partie invariante par contraste)
Des images aux
ensembles de niveau et réciproquement
Operateurs monotones
invariant par contraste et "stack filters",
théorie
Application : le tueur d'extrema
Oprateurs
sup-inf, classification de tous les filtres morphologiques.
Erosions
et dilatations
Filtre médian
C-LES EQUATIONS PAR
COURBURE
Il s'agit d'un mini cours de calcul différentiel
adapté au sujet :
tangente, normale, courbure, principales
courbures d'une surface, et les
principales équations par
courbure avec leurs invariants : MCM, AMSS.
D-LIEN ENTRE
FILTRES MORPHOLOGIQUES ET EQUATIONS PAR COURBURE:
traitement
détaillé du filtre médian, applications.
J.-M. NICOLAS
«
Imagerie satellitaire »
Ce module a
pour but d'effectuer une présentation globale des satellites
d'imagerie existants (visible,
radar, IR), d'analyser les moyens
et les techniques mises en ?uvre dans ces systèmes d'imagerie
et de
montrer leurs diverses applications : surveillance de
l'environnement, météorologie, cartographie,
archéologie, renseignement militaire? il s'attachera à
souligner les problèmes spécifiques à chaque
technique d'imagerie, et à montrer, au travers des
applications, les techniques utilisées. Il vise à
donner
une formation pour de futurs ingénieurs R&D de
groupes industriels impliqués dans le domaine de
l'imagerie
satellitaire (Aérospatiale, CNES, Dassault, Matra, Thompson).
Programme :
- Les
satellites : mécanique satellitaire, choix d'orbite,
contraintes physiques et technologiques,
planification de mission
d'imagerie.
- Imagerie
dans le domaine visible et Infra Rouge : Présentation des
différents satellites existants
(SPOT, LANDSAT, NOAA,
Meteosat,...). Problèmes liés aux capteurs et à
la propagation dans
l'atmosphère, recalage et
reconstruction. Problèmes liés à la géométrie
du système pour des
applications de stéréovision.
Modèle numérique de terrain. Application en analyse de
texture :
classification, analyse multispectrale, fusion de
données. Application en cartographie : Analyse de
scènes,
reconnaissance de primitives (routes, côtes, fleuves?),
extensions à l'imagerie aérienne et
aux futurs
systèmes imageurs satellitaires métriques.
- Imagerie
radar : présentation des différents satellites
existants (ERS1, JERS, SIR, Radarsat).
Problèmes liés
aux capteurs, à la polarimétrie, à la
propagation dans l'atmosphère, aux lois de
réflexion,
au chatoiement (speckle). Principe du radar à ouverture
synthétique (ROS).
Reconstruction des images. Traitements
et filtres spécifiques. Images d'interférométrie
: principes
de la construction de telles images, extraction des
informations, utilisation et exploitation.
- Les SIG (systèmes
d'informations géographiques) : applications et réalisations,
perspectives.
- Etude de
problèmes spécifiques liés à la
cartographie (géoréférencement, géodésie,?)
T.PAPADOPOULO, M. CLERC, S. BAILLET
«
Problèmes inverses en imagerie fonctionnelle cérébrale
»
Ce
cours porte sur l'imagerie cérébrale fonctionnelle par
des techniques non-invasives basées soit sur la mesure passive
du champ électromagnétique (M/EEG) créé
par les courants électriques corticaux provenant de l'activité
cérébrale soit sur l'IRM fonctionnelle.
L'électroencéphalographie (EEG) et la
Magnétoencéphalographie (MEG) sont des modalités
d'imagerie cérébrale qui offrent une excellente
résolution temporelle, de l'ordre de la milliseconde. La
localisation spatiale au niveau du cortex des événements
mesurés est cependant délicate, car elle nécessite
la résolution de problèmes inverses mal posés. A
l'inverse, l'IRM fonctionnelle offre une excellente résolution
spatiale, mais une résolution temporelle de l'ordre de la
seconde.
L'objectif de ce cours est de présenter l'état
de l'art dans le domaine de l'imagerie cérébrale
fonctionnelle.
1 Introduction (Research and Clinical
Motivations)
I Magneto-electroencephalography models
2 Electromagnetic propagation:
Maxwell equations: quasistatic regime, Biot and Savart law.
Source models.
3 Geometric
modeling of the head.
4 Forward MEEG problem
Finite element solution.
Boundary element solution.
5 Head
conductivity: models and estimation
II Analysis of
functional imaging data
6 Designing an Experimental
Protocol for Functional Imaging and Statistical Significance of the
Results.
7 Functional Magnetic Resonance Imaging
8 Localizing
cortical activity
De-noising MEEG signals.
Inverse problem (MUSIC, Beamforming, Imaging).
N. PARAGIOS
«Advanced
mathematical models in low and mid-level vision: discrete
and
continuous »
The visual
perception task is often associated with the ability of
understanding
the environment. The most common way to perform this task
is
through mathematical modeling. In other words, the answer to
the
perception task refer to the lowest potential of a
specifically designed
cost function. The definition of this cost
function and the estimation
of the most appropriate parameter set
are very challenging tasks in
computer vision. The aim of this
class is to study advanced mathematical
models for low and
mid-level computer vision as well as appropriate
minimization
techniques: to recover their optimal solutions. The class
consists
of several lectures covering a wide spectrum of problems, like:
-
image denoising/inpainting
- model free segmentation: continuous
and discrete approaches
- knowledge based segmentation: continuous
and discrete approaches
- optical flow estimation/image
registration/morphing: parametric and
dense models
- motion
analysis and tracking moving objects
- feature extraction, feature
representations and object recognition
- discrete optimization
methods: dynamic programming, linear
programming, max flow/min
cut, belief propagation networks, etc...
textbook: The
Handbook of Mathematical Models in Computer
Vision
(http://vision.mas.ecp.fr/paragios-chen-faugeras/).
Nikos Paragios,
Yunmei Chen & Olivier Faugeras (INRIA,
France) Springer (2005), ISBN
0387263713, 596 pages,
2005
Lectures: in English
A. TROUVÉ
«
Géométrie et espace de formes. Théorie et
applications »
Ce
cours a pour objectif de proposer une exposition introductive d'un
point de vue géométrique sur les modèles
déformables qui consiste à construire des métriques
riemanniennes sur des espacesd'objets (n-uplet de points, courbes,
regions binaires, surfaces, champ de tenseurs, images en niveau de
gris, mesures etc) considérés commes des variétes
de dimension finie ou infinie à partir de l'étude des
déformations infinitésimales naturelles agissant sur
ces objets.
Nous montrerons que la construction et l'étude
de ces métriques, le calcul effectif des géodésiques
dans ces espaces de formes et la compréhension des cartes
exponentielles locales sont des questions d'une grande importance
théorique et pratique. Nous verrons que ce point de vue
géométrique unifie un grand nombre de questions
importantes très concrètes: appariements denses à
partir de points marqués ou de nuages de points, appariements
de variétés, appariements difféomorphique
d'images dans le cas de grandes déformations, métamorphoses
automatiques entre images et ouvre des voies nouvelles pour la
construction de modèles probabilistes de formes.
Si le
cours s'attachera principalement à expliquer les outils et les
concepts qui sont assez nouveaux dans le cadre du traitement d'images
et les algorithmes associés, nous proposerons plusieurs
illustrations dans le cadre médical pour l'analyse de la
variabilité anatomique.
Pré-requis: Les outils
mathématiques nécessaires seront introduits au fur et à
mesure notamment en ce qui concerne la geometrie riemannienne, les
groupes de Lie et la mécanique hamiltonienne.
COURS MATHEMATIQUES / APPRENTISSAGE
J.-Y. AUDIBERT
«
Introduction aux théories de l'apprentissage »
Objectifs
du cours :
Les procédures d'apprentissage statistique
utilisent une base de données pour déduire de
caractéristiques observées la prédiction d'une
caractéristique inconnue. Ces méthodes sont devenues
incontournables dans de nombreuses applications pratiques
(classification et analyse d'images, reconnaissance d'objets,
classification de documents textuels (par ex : spam / non spam),
diagnostic mdical, analyse de séquences génétiques
ou de protéines, prédiction du rendement d'actifs
financiers ...).
A la frontière entre théorie de
l'information, théorie de la complexité, et statistique
non paramétrique, la théorie sur laquelle repose ces
méthodes propose des concepts efficaces pour l'analyse de
l'apprentissage (performance, marge, vitesse de convergence, capacité
de généralisation / complexité).
L'objectif de ce cours est d'introduire les différentes
procédures d'apprentissage génériques
(machines à vecteurs supports, méthodes d'aggrégation,
réseaux de neurones, arbres de dcision, ...) et les concepts
théoriques qui les motivent et les justifient. En raison de
leur facilité d'implémentation, leur flexibilité
et leur robustesse, nous détaillerons en particulier le cas
des méthodes d'aggrégation.
Validation
du cours :
Elle sera basée sur
un projet dont l'objectif est l'assimilation et/ou l'implémentation d'un article scientifique. Ces articles pourront concerner aussi bien les domaines applicatifs (reconnaissance d'objets, détection d'évnements dans les vidéos, interface cerveau-machine, ...) de l'apprentissage statistique que ses aspects conceptuels.
un examen final.
Contenu du cours
Sur-apprentissage et régularisation
Capacité de généralisation d'une classe de fonctions de prédiction
Théorie de Vapnik/Cervonenkis
Les algorithmes génériques et les liens entre eux: SVM, AdaBoost et ses variantes, réseaux de neurones, arbres de décision, méthode des plus proches voisins...
Consistence des algorithmes d'apprentissage
Fonctions de perte et optimisation convexe
Sélection de variables et estimation adaptative
Méthodes d'aggrgation par projections successives
Références bibliographiques
R. Duda, P. Hart et D. Stork, Pattern Classification, 2nd ed., Wiley, 2000.
L. Devroye, L. Gyorfi et G. Lugosi, A Probabilistic Theory of Pattern Recognition, Springer-Verlag, 1996.
V. Vapnik, The nature of statistical learning theory, 2nd ed., Springer-Verlag, 1995.
S. Boucheron, O. Bousquet et G. Lugosi, Theory of classification: some recent advances,
ESAIM Probability & Statistics, 9, 323-375, 2005.
R. E. Schapire. The boosting approach to machine learning: An overview. In Advanced Lectures on Machine Learning (LNAI2600) , 2003.
P. Viola and M. Jones, Robust Real-time Object Detection, International Journal of Computer Vision, 57 (2), 137-154, 2004.
F. BACH
«
Modèles graphiques probabilistiques (réseaux bayésiens)
»
Thème
:
Ce cours porte sur la modélisation statistique de
données complexes multivariées. Il est centré
sur le formalisme des modèles graphiques probabilistes (aussi
appelés réseaux Bayésiens), qui se trouvent à
la frontière entre la théorie des graphes et les
probabilités. Ce formalisme regroupe un grand nombre de
modèles existants (modèle de Markov cach és,
filtres de Kalman) et définit la sémantique et les
algorithmes d'inférence et d'apprentissage nécessaires
pour étendre naturellement ces modèles à des
situations plus complexes . Des applications des réseaux
Bayésiens à des problèmes de vision, traitement
du signal, intelligence artificielle et bioinformatique seront
présentées.
Positionnement
du cours :
Ce cours donne une perspective nouvelle sur de
nombreux algorithmes, dont certains sont déjà présentés
de manière indépendante dans d'autres cours. Le
formalisme et les algorithmes présentés constituent un
traitementunifié permettant (1) l'échange d'idées
entre ces algorithmes qui proviennent souvent de communautés
différentes (par exemple, les modèles de Markov cach és
discrets et les filtres de Kalman) et (2) l'application de ces
algorithmes aux situations complexes rencontrées en vision,
traitement du signal, intelligence artificielle, bioinformatique, ...
( par exemple, les modèles de Markov à variables
continues et discrètes).
Références
:
Le cours sera basé sur le livre en préparation
de Michael Jordan (Berkeley) (http://www.cs.berkeley.edu/~jordan)
sur les modèles graphiques, et sur des articles scientifiques
appliquant ces techniques.
Travaux
:
Le cours comportera des exercices pratiques d'
implémentation en Matlab ou en R d'algorithmes d'inférence
et d'apprentissage.
Liste prévisionnelle de sujets :
Introduction aux modèles graphiques, algorithmes d'élimination
Méthodes fréquentistes et Bayésiennes
Classification LInéaire, modèles linéaires et linéaires généralisés
Estimation de densités, méthodes à noyaux, mixtures
L'algorithme EM
Modèles de Markov cachés
Analyse factorielle
Filtres de Kalman
Algorithme des arbres de jonctions
Algorithmes de simulation (Importance sampling, Gibbs, Metropolis-Hastings)
Algorithmes variationnels : champs moyen, belief propagation, relaxations convexes
B. CHALMOND
«
Traitement de l'information en biotechnologie :
Analyse
statistique des données de micro-array »
Durée
: 20h (8 sances), Examen : oral sur thème choisi ou
mini-projet.
La technologie récentes des puces
ADN permet de mesurer simultanément l'expression de milliers
de gènes. Cette technologie a entraîné une très
grande effervescence chez les biologistes et les statisticiens. En
effet, les donnes de micro-array apportent des informations cruciales
pour comprendre la fonction des gènes. On espère ainsi
découvrir des gènes impliqués dans le
développement d'un cancer en comparant leurs niveaux
d'expression dans des tissus prélevés chez des patients
sains et chez des patients malades. Ce cours s'adresse des
étudiants ayant un bon niveau de mathématique et de
statistique. Une connaissance de base en biologie moléculaire
est souhaitable mais pas indispensable. Il est conseill de suivre les
cours de Jean-Yves Audibert et de Jean-Philippe Vert. Les donneés
de micro-array se présentent sous la forme d'un tableau
croisé <<gènes*individus>> où
contrairement la situation habituelle en statistique, le nombre
d'individus est bien plus petit que le nombre de variables (les
gènes), rendant pas là difficile l'utilisation des
méthodes statistiques d'apprentissage (non supervisé et
supervisé) : classification et prédiction. On se posera
donc le problème de la construction des modèles dans ce
cas.
Contenu du cours
1- Prédiction d'un état à partir de l'expression des gènes et de leurs interactions (ou : Régression sur un arbre hiérarchique de classification ).
- Mots-clefs : Classification hiérarchique, modèle linéaire avec interactions, validation croisée, information de Fisher, modèle logistique, modèle de survie.
2- Extraction de classe d'expressions homogènes (ou : Analyse en Composante Principale robuste).
-Mots-clefs : sélection de composante robuste, estimation optimale de l'effectif d'une classe, effet de groupage.
3- Sélection d'une classe prédictive d'expressions homogènes (ou : Régression sous contraintes L1/L2).
- Mots-clefs : sélection de variable, pénalisation, effet de groupage.
4- Prédiction d'un état et probabilité de classe (ou : Classification par régression logistique pénalisée).
- Mots-clefs : modèle logistique pénalisé versus SVM.
5-
Classification d'expression en situation de donnes non structures
(ou : Analyse discriminante fonctionnelle)
-Mots-clefs
: Représentation spline de profil d'expression et modèle
probabiliste, analyse de données fonctionnelle, données
manquantes et algorithme EM, alignement, information mutuelle,
validation croisée.
Il est
envisagé cette année, une introduction à
la protéomique au travers de l'analyse des données de
spectroscopie de masse LC-MS.
M.COTTRELL
«
Analyse de données et techniques neuronales »
Présentation
du cours :
L'objet de ce cours est de présenter
diverses méthodes d'analyses de données
classiques
et neuronales. Les méthodes classiques (Analyse en Composantes
Principales, des
Correspondances, Discriminante) sont
essentiellement linéaires et se révèlent
inadaptées dans certains
cas. Les méthodes
neuronales (ou connexionnistes) proposent une alternative très
intéressante aux
méthodes classiques. Elles sont
particulièrement utiles pour des données de grande
dimension, pour
séparer des classes non linéairement
séparables, étudier des variables dont les liaisons
sont complexes.
On étudiera dans le cours deux grands
types de modèles neuronaux : le Perceptron Multi-couches (le
plus utilisé jusqu'à maintenant) et les cartes de
Kohonen (qui ont fait la preuve de leur utilité pour
traiter
des données économiques et financières).
Le
cours comporte des parties théoriques et de nombreux exemples.
Les étudiants devront
réaliser plusieurs projets
qui peuvent être de différente nature :
-
programmation de certains algorithmes et application à des
données réelles
- lecture et analyse d'articles
publiés relatifs à des applications économiques
ou financières
Programme
du cours :
Début : février (date exacte à
préciser, en liaison avec Paris 7).
Les projets seront à
rendre au cours du semestre.
- Introduction aux réseaux de
neurones artificiels. Le perceptron simple, théorème de
convergence,
l'ADALINE.
- Introduction aux méthodes
d'apprentissage des réseaux de neurones. Méthode du
gradient et du
gradient stochastique.
- Le perceptron
multi-couches, l'algorithme de rétro-propagation du gradient,
application à la
régression non linéaire,
aux séries temporelles. Détermination de l'architecture
par des méthodes du
style stepwise descendant. Exemples.
- Analyse en composantes principales, analyse des
correspondances.
- Analyse canonique, analyse discriminante.
-
Introduction aux méthodes de classification classiques.
-
Algorithme de Kohonen, propriétés théoriques.
-
Méthodes neuronales pour la réduction de dimension,
alternative neuronale de l'analyse en
composantes principales,
visualisation de données multidimensionnelles.
- Analyse
d'un tableau de contingence ou d'une table de Burt, à l'aide
de l'algorithme de Kohonen.
Algorithmes KOUPLET et KACM. Etude
des variables qualitatives.
- Application des méthodes de
classification à la prévision de courbes de charges ou
de courbes
financières.
Lieu des
cours :
centre PMF, rue de Tolbiac, (en salle B-15-11, à
confirmer).
Livres
de références :
Pour l'analyse de données
classiques :
Lebart L., Morineau A., Fénelon J.P., (1979) Traitement des données statistiques - Dunod.
Saporta G., (1990) Probabilités, Analyse des données et Statistique, Technip.
Lebart L., Morineau A., Piron M., (1995) Statistique exploratoire multidimensionnelle, Dunod.
Pour les modèles neuronaux :
Blayo F., Verleysen M., (1996) Introduction aux réseaux de neurones artificiels, Col. Que-sais-je ?, PUF.
Haykin S., (1994) Neural Networks : A Comprehensive Foundation, Macmillan.
Hertz J., Krogh A., Palmer R.G., (1991) Introduction to the Theory of Neural Computation, Reading, MA :, Addison-Wesley.
Kohonen T., (1995, 1997) Self-Organizing Maps, Vol. 30, Springer.
Oja E., Kaski S., (Eds), (1999) Kohonen Maps, Elsevier
Deboeck G., Kohonen T., (1998) Visual Explorations in Finance with Self-organizing maps, Springer
Y. AMIT et D. GEMAN
«
Statistical Methods in Image Interpretation »
1-
Course Description :
Image interpretation, which is
effortless and instantaneous for human beings, is the grand challenge
of computer vision. The dream is to build a "description
machine" which produces a rich semantic description of the
underlying scene, including the names and poses of the objects that
are present, even "recognizing" other things, such as
actions and context. Mathematical frameworks are advanced from time
to time, but none is yet widely accepted, and none clearly points the
way to closing the gap with natural vision. This course focuses on
applications of statistical methodologies to image interpretation,
from feature selection, through shape and object recognition, to
detection and recognition of multiple objects in an image. In the
first half of the course we will provide an overview of some basic
statistical methodologies illustrated with some simple applications
in image analysis. In the second half, for validation of the course,
students are asked to prepare 1-2 page critical summaries of the
articles in part II that apply these methodologies to problems in
image interpretation, emphasizing the relation to the themes and
material developed in part I.
2
Course Plan :
The course will be composed of eight
sessions of 2.5 hours each. Students are expected to hand in their
summaries of each paper on the date it is shown in the syllabus
below.
Part I: Statistical background
Session
1. Jan. 16. Basic pattern recognition:
Bayes rule, generative
vs. discriminative, information measures, generalization error,
bias/variance.
Session
2. Jan. 17. Generative models:
Maximum likelihood, exponential
distributions, maximum entropy principle, LDA, QDA, Bayesian
methods, conjugate priors, hypothesis testing.
Session
3. Jan. 22. Unobserved data:
EM algorithm. Bayesian case. Simple
template estimation. Image features from mixture models [3].
Session
4. Jan. 24. Classifiers:
k-NN, decision trees, boosting,
cross-validation. Application to feature selection - mutual
information [6].
Session
6. Jan. 31. Dense deformable models:
Deformable models for
analyzing images with multiple objects. [1].
Session
7. Feb 5. Constellation models:
Sparse features and automatic
training [4].
Geometric
modeling and optimization of full model [5].
Session
8. Feb. 7. Coarse-to-fine detection:
Cascade method [9].
CTF
for tracking and the trace method [7].
An
alternative paper on this subject:[10]
(You can
choose to summarize either 7 or 10.)
References
[1]
Y. Amit and A. Trouvé.
Pop: Patchwork of parts models for object recognition. To appear in
IJCV, 2007.
[2]
S. Belongie, J. Malik, and S. Puzicha. Shape matching and object
recognition using shape context. IEEE PAMI, 24:509-523, 2002.
[3]
E. J. Bernstein and Y. Amit. Part-based models for object
classification and detection. In CVPR 200 (2), 2005.
[4]
L. Fei-Fei, R. Fergus, and P. Perona. One-shot learning of object
categories. IEEE PAMI, 2006. 28: 594-610
[5]
P.F. Felzenszwalb and D.P. Huttenlocher. Pictorial structures for
object recognition. IJCV,
61(1):55-79, January 2005.
[6]
F. Fleuret. Fast binary feature selection with conditional mutual
information. JMLR, 5:1531-1555, 2004.
[7]
S. Gangaputra and D. Geman. The trace model for object detection and
tracking. In Toward Category-Level Object Recognition, Lecture Notes
in Computer Science. Springer Verlag, 2006.
[8]
T. Hastie and P. Y. Simard. Metrics and models for handwritten
character recognition. Statistical Science, 13(1):54-65, 1998.
[9]
P. Viola and M. J. Jones. Robust real time face detection. IJCV,
57:137-154, 2004.
[10]
S. Gangaputra and D. Geman. S. A design principle for coarse to fine
classification. CVPR 2006.
M. DATCU
«
Information Theory Based Inference for Image Information Mining
»
Image information mining
(IIM) is a new field of study that has arisen to seek solutions to automating
the mining (extracting) of information from image archives that can
lead to knowledge discovery and the creation of actionable intelligence
(exploiting). Image information mining is more than just an extension
of data mining principles to images. Also, the mining of images in general,
as satellite or other natural landscape images for content information
is different from mining images of facial characteristics or of other
living things (e.g.,lions or tigers) due to the fact there are no features
(e.g., ears, stripes, or wings) that have known relationships to help
differentiate classes in a scene. Therefore, IIM is an interdisciplinary
approach to automating analysis that draws on signal/image pattern recognition,
artificial intelligence, machine learning, information theory, databases,
semantics, ontologies, and knowledge management.
IIM includes novel concepts
and methods to help humans to access and discover information in large
image archives, to rapidly gather information about courses of action.
Interesting applications involve complicated spatial, structural, and
temporal relationships among image
objects. Thus, new concepts have been introduced on the basis of intensive
preprocessing of images to extract relevant features, structures, and
objects and automatically record and analyze their interrelationships to learn their behavior
so as to be able to detect relevant information. The methods are integrated
in systems, which can be operated using intelligent interfaces able
to correlate the information content of the images with the relevant
goals of he application. The users have at their disposition tools for
the definition of specific goals using semantics. The problem of the
large dimensionality, which for computationally efficient data analysis
is of primary concern, is solved using preextracted representative features
instead of raw images. These are difficult tasks which require cooperative
solutions integrating a variety of methods of soft computing, information
semantics and the semantic web, advanced statistics, and probabilistic
reasoning. The goal is to have machines more closely interacting at
human conceptual levels (i.e., automate the human remote sensing analyst).
Unlike the respective hard computing methods, soft computing may cope
with problems that deal with imprecision, uncertainty, and learning,
and are better candidates to construct systems and models which are
simple, applicable, user-friendly, and fast.
Traditionally Information
Theory focused to applications in communications, it refers mainly to
coding, transmission, or compression of signals. However, implicitly,
from its very beginning, information theory closely related to statistics
and machine learning. Thus, many other fields like stochastic inference,
estimation and decision theory, optimization, communication or knowledge
representation benefit from basic results from information theory. The
goal of the course is to introduce new developments in information and
complexity theory relevant to inference, as well as general methods
for information processing and understanding. Among the topics envisaged
are: applications and extensions of Rate-Distortion theory, the methods
of information bottleneck, MDL and related methods, Shannon information
and/or Kolmogorov complexity based estimation, and inference, latent
semantic indexing, semantic image coding. The course will present specific
methods for: IIM, image understanding, image semantic coding, image
indexing and information mining. Examples and exercises are design and
applications of search engines for large satellite image archives.
Les cours sont en langue française.
O. FAUGERAS
«
Méthodes Mathématiques pour les Neurosciences
»/«Mathematical Methods for Neuroscience»
Nous présentons dans ce cours quelques outils mathématiques qui interviennent de manière systématique dans de nombreux problèmes de modélisation en neurosciences. Les prérequis sont une bonne connaissance du calcul différentiel et du calcul des probabilités dans le cadre de la théorie de la mesure. Sans trahir la rigueur mathématique, le cours s'efforcera de mettre en valeur l'applicabilité aux neurosciences des concepts présentés. Le cours sera complété par des séances d'exercices et de programmation sous Scilab, Matlab ou Maple.
We present a number of mathematical tools that are central to modeling in neuroscience. The prerequisites to the course are a good knowledge of differential calculus and probability theory from the viewpoint of measure theory. The thrust of the lectures is to show the applicability to neuroscience of the mathematical concepts without giving up mathematical rigor. The concepts presented in the lectures will be illustrated by exercise sessions and programming assignments in Scilab, Matlab, or Maple.
Electrophysiologie
des neurones : modèles à conductances et leurs
réductions, modèles intègre et
tire.
Electrophysiology of neurons: conductance models
and their reductions, integrate and fire models.
Introduction
aux systèmes dynamiques : orbites et portraits de phases,
variétés invariantes, équivalence de systèmes
dynamiques, classification topologique des équilibres,
bifurcations et leurs formes normales topologiques, stabilité
structurelle.
Introduction to dynamic systems: orbits
and phase portraits, invariant manifolds, equivalence of dynamic
systems, topological classification of equilibria, bifurcations and
their topological normal forms, structural stability.
Bifurcations
: déploiement universel et codimension, le pli, la
bifurcation de Hopf, la bifurcation pli d'un cycle limite, la
bifurcation de Bogdanov-Takens, la bifurcation de Bautin, la
fronce.
Bifurcations: universal unfolding and
codimension, the fold, Andronov-Hopf bifurcation, fold bifurcation
of limit cycles, Bogdanov-Takens bifurcation, the Bautin
bifurcation, the cusp.
Application
à l'excitabilité neuronale : neurones de classes
1, 2 et 3, neurones intégrateurs et neurones résonateurs,
modulation lente.
Application to neuronal excitability:
classes1, 2 and 3 of neurons, integrators versus resonators, slow
modulation.
Le
bruit blanc et le mouvement brownien : construction du mouvement
brownien, régularité des trajectoires, propriété
de Markov. Application à la modélisation du bruit
synaptique.
White noise and Brownian motion:
construction of the Brownian motion, regularity of the trajectories,
Markov property. Application to synaptic noise modeling.
Intégrale
stochastique : l'intégrale d'Itô, la formule d'Itô.
The stochastic integral: Itô integral, Itô's
formula.
Equations
différentielles stochastiques : définitions,
existence et unicité de la solution, équations
linéaires. Application aux modèles de neurones intègre
et tire.
Stochastic differential equations:
definitions, existence and uniqueness of the solution, linear
equations. Application to integrate and fire models.
Compléments
: temps d'arrêts et formules de Feynman-Kac, équation
de Fokker-Planck. Application à la description de
l'évolution du potentiel de membrane neuronal et des
statistiques de trains d'impulsions nerveuses.
Complements:
stopping times and Feynman-Kac formulae, Fokker-Planck equation.
Application to the time evolution of the membrane potential
and the statisctics of spike trains.
Bibliographie
sommaire : :
A few references :
Wulfram Gerstner et W. Kistler, Spiking neuron models, Cambridge University Press, 2002.
Yuri A. Kuznetsov, Elements of applied bifurcation theory.
Eugène Izhikevich, Dynamical systems in neuroscience: the geometry of excitability and bursting, MIT Press, 2006.
Jean-Pierre Françoise, Oscillations en biologie, Springer, 2000.
Lawrence C. Evans, An introduction to stochastic differential equations, http://math.berkeley.edu/~evans/SDE.course.pdf
Jean-François Le Gall, Mouvement brownien et calcul stochastique, http://www.dma.ens.fr/~legall/DEA96.pdf
J. LACAILLE (Pas de cours en 2007-2008)
«
Apprentissage et réseaux de neurones »
Ce cours constitue une introduction à l'utilisation numérique des réseaux de neurones. Le premier chapitre introduit brièvement la notion de neurone et celle de réseaux. On y rappelle aussi les quelques modèles classiques utilisés couramment par les numériciens et statisticiens. Le second chapitre présente des outils mathématiques permettant de mieux comrrendre la dynamique des réseaux. Il s'agit d'un début de théorie de l'apprentissage , mais appréhendée du point de vue de l'utilisation des réseaux de neurones. Le chapitre trois développe le thème des réseaux déterministes. On commence par une étude simple de perceptron, puis des réseaux feedforward multicouches. Pour finir on propose une méthode d'apprentissage des réseaux récurrents. Le chapitre quatre présente les réseaux stochastiques et les méthodes d'apprentissage adaptées aux machines de Boltzmann synchrones et multiconnectées. On étudie les convergences de ces algorithmes et les possibilités d'implémenter efficacement des modèles séquentiels en utilisant une méthodologie de parallélisme partiel. Alors que les trois chapitres précédents présentent des réseaux classiques mettant en ?uvre des méthodologies d'apprentissage supervisés les dernier chapitre traite de l'auto-organisation des réseaux de neurones ; On rappelle les découvertes de Linsker sur le système visuel et on donne la méthodologie de programmation d'une extraction de composantes principales d'un échantillon de données. Une annexe bibliographique permet à l'étudiant de mieux se repérer dans ses recherches.
R. MUNOS
«
Apprentissage par renforcement »
Ce cours porte sur l'acquisition automatisée de capacités pour la prise de décisions en milieu complexe et incertain. L'apprentissage par renforcement est un domaine de recherche récent né de l'interaction des disciplines intelligence artificielle, neuro-sciences, psychologie expérimentale, et mathématiques appliquées. Il s'agit d'apprendre une loi d'action "par l'expérience", c'est à dire à partir de l'observation des échecs ou succès résultants des prises de décision passées. Les applications sont très variées : robotique autonome, théorie des jeux, recherche opérationnelle, planification, ...
Nous aborderons les points suivants:
Introduction à l'apprentissage par renforcement,
Exemples, historique,
Lien avec les sciences cognitives.
Introduction à la programmation dynamique: le cas discret. Présentation des algorithmes de résolution :
Itération sur les valeurs, itération sur les politiques,
Algorithmes stochastiques, méthodes de Monte-Carlo,
Algorithmes d'apprentissage par renforcement: différences temporelles, Q-learning.
Approximation et apprentissage statistique.
Approximation linéaire, régression.
Méthode du gradient.
Approximation paramétrique, ex: réseaux de neurones.
Approximation non-paramétrique.
Programmation dynamique avec approximation:
Approximation de la fonction valeur.
Recherche directe de politique paramétrée.
Introduction au contrôle optimal: le cas continu.
Discrétisation des équations de Hamilton-Jacobi-Bellman.
La malédiction de la dimension.
Maillage adaptatif, grilles creuses, grilles aléatoires.
Méthodes d'approximation pour le contrôle optimal:
Paramétrisation de la fonction valeur.
Paramétrisation du contrôleur, gradient stochastique.
J.P. NADAL
«
Modélisation en neuroscience et ailleurs »
(Une
introduction à la modélisation des mécaniques
d'apprentissage et d'adaptation dans les systèmes
naturels
et artificiels)
Le cours a pour objectif de donner une
introduction à la modélisation des mécanismes
d'apprentissage et d'adaptation dans les systèmes naturels et
artificiels, en mettant l'accent sur les approches basées sur
la Physique Statistique (modélisation des phénomènes
collectifs), les Statistiques (bayésiennes) et la Théorie
de l'Information. Les concepts de ces disciplines utiles pour le
cours seront introduits au fur et à mesure des besoins. Les
thèmes principaux seront :
mémoire associative, apprentissage supervisé ;
modélisation du "codage neuronal", et applications au traitement du signal (analyse en composantes ndépendantes).
Quelques applications des mêmes outils et concepts à d'autres domaines (par exemple en sciences économiques et sociales, en optimisation combinatoire, en physique) seront évoquées.
P. ROUCHON
«
Dynamique, contrôle et robotique »
Nous exposons ici quelques méthodes mathématiques utiles pour la modélisation, l'analyse et le contrôle de systèmes mécaniques (holonomes et non holonomes) rencontrés en robotique. Le cours s'appuiera sur des exemples précis comme les robots complètement actionnés, certains robots mobiles, un prototype de robot marcheur. Quelques problèmes ouverts seront aussi discutés.Les notions abordées sont les suivantes:
N. VAYATIS
«
Méthodes régularisées en apprentissage »
Descriptif
:
Dans ce cours, on formule des principes concrets permettant
de contrôler la complexité dans les méthodes
d'apprentissage. On fera le lien avec les techniques de sélection
de modèles en statistique.
Thèmes
abordés:
- mesures de complexité
: VC dimension et complexités de Rademacher
- le problème de l'approximation de la règle de Bayes
- régularisation pour les problèmes inverses
- sélection de modèles en statistique : critères AIC, BIC, ...
- pénalisations L1 et L2 : Lasso et Ridge Regression
- méthodes d'apprentissage régularisées : boosting régularisé et régularisation dans les RKHS
- agrégation et représentations parcimonieuses
J.P. VERT
«
Méthodes à Noyau en Bio-Informatique »
Les méthodes à noyaux recouvrent un ensemble d'algorithmes pour l'analyse statistique de données, caractérisées par l'utilisation d'une fonction (appelée "noyau") permettant de mesurer la similarité entre les objets à analyser. En imaginant des fonctions noyaux pour des objets non vectoriels, tels des séquences, des graphes, des permutations ou des points sur des variétés différentielles, il est possibles d'appliquer à ces objets des méthodes puissantes d'analyse statistiques habituellement réservées à des données vectorielles, telles l'analyse en composantes principales, l'analyse de corrélations canoniques, ou les Support Vector Machines pour la classification et la régression. La bio-informatique vise à analyser des masses de données biologiques pour en extraire de l'information pertinente. Ces données sont typiquements des séquences (d'ADN, d'acides aminés, etc...), des graphes, des structures tridimensionnelles de molécules, ou des arbres phylogénétiques. A partir de problèmes réels, nous montrerons comment des noyaux peuvent être construits pour ces différents types d'objets, nous étudierons différentes méthodes à noyaux et leur lien avec la théorie de la régularisation, et nous approfondirons l'étude de l'espace des fonctions noyaux lui-même. Les exemples rééls qui motiveront ce cours seront notamment: " la prédiction de la fonction, localisation et structure des protéines " l'intégration de données hétérogènes en bio-informatique " le criblage virtuel de molécules dans la recherche pharmaceutique Il est fortement conseillé de suivre le cours de J;-Y. Audibert sur la théorie de l'apprentissage au premier trimestre en préparation de ce cours. Les élèves intéressés par les applications en bio-informatique peuvent également suivre le cours de B. Chalmond, "Traîtement de l'information en biotechnologie" qui présentera des outils complémentaires.