2002

Thèse

VRAC Mathieu

Analyse et modélisation de données probabilistes par décomposition de mélange de copules et application à une base de données probabiliste.

Directeurs.rices de thèses : Chédin A. & Scott N.

Date 2002-12-06
Diplôme U. Paris XI

Fiche

Composition du jury

Mme Lynne Billard Rapporteur
M Gérard Govaert Rapporteur
M Gérard Mégie Examinateur
M Georges Oppenheim Examinateur
M Gilbert Saporta Examinateur
M Berthold Schweizer Rapporteur
M Fabrice Rossi Examinateur

Résumé

Nous étendons les méthodes de décomposition de mélange de densités de probabilité au cas des données ‘fonctions de repartition’, permettant ainsi de classifier ces fonctions et de modéliser une loi pour ces données fonctionnelles particulières.
Cette loi est donnée par la notion de ‘fonctions de distribution de distributions’ (FDD), basée sur la définition d’une fonction de répartition pour des variables aléatoires à valeurs dans un espace probabiliste.
Les extensions sont effectuées en associant les FDD aux fonctions ‘copules’ par le théorème de Sklar. Les copules ‘couplent’ les fonctions de répartition à n dimensions (jointes) et à 1-dimension (marginales) d’un n-uplet de variables aléatoires. Nous regardons principalement une classe de copules paramétriques, les copules Archimédiennes, et proposons trois nouvelles méthodes d’estimation des paramètres dans le cas de copules multivariés : par coefficients de corrélation de Kendall, ou de Spearman, et par maximisation de la vraisemblance.
L’association des FDD et des copules caractérise l’évolution des données fonctionnelles (i.e. la forme de ces fonctions) entre différents points à l’intérieur des classes pour chaque variable, et donne une mesure de dépendance entre les variables utilisées.
Les méthodes sont tout d’abord développées pour une variable, puis diverses généralisations sont proposées pour n dimensions. Certains points théoriques sont ensuite discutés, tels que la convergence de l’algorithme et le fait que la méthode par copules est une généralisation du cas classique.
Une application de la méthode ‘approche classification’ par copules est réalisée
sur des données climatiques de l’atmosphère terrestre. Le but est la classification de ‘profils’ atmosphériques verticaux (température, humidité) et l’estimation de la loi sous-jacente des données. Les résultats sont comparés avec ceux de méthodes de classification ‘classiques’, prouvant ainsi les performances nettement supérieures de la méthode par décomposition de mélange de copules (DMC) et l’intérêt de l’utilisation des données probabilistes.

Commentaires

Aucun.