Mas 2012

Journées MAS 2012 Session: Application de la statistique semi-paramétrique aux sciences du vivant

Journées MAS 2012
Session: Application de la statistique semi-paramétrique
aux sciences du vivant

A. Chambaz
MAP5, Université Paris Descartes

Description de la session.

Les sciences du vivant sont une source intarissable de problèmes délicats que le statisticien peut aborder sous l’angle de la statistique semi-paramétrique. Ce paradigme d’étude repose notamment sur l’identification au sein de la loi de l’expérience observée d’une composante pertinente pour la question d’intérêt et d’une composante dite de nuisance, i.e. n’apportant aucune information pour la question d’intérêt, du moins au premier ordre. Quatre exposés viendront illustrer la pratique récente de la statistique semi-paramétrique appliquée aux sciences du vivant.

Référence :

Programme.
(MAP5, Université Paris Descartes)
“Inférence semi-paramétrique pour des événements récurrents en présence de censure et d’un événement terminal”

Dans un contexte de données censurées nous nous intéressons au processus de comptage des événements récurrents se produisant jusqu’à l’apparition d’un événement terminal. Dans un cadre médical par exemple, ces événements récurrents peuvent représenter les infections opportunistes répétées d’un patient atteint par le VIH.
Nous proposons d’étudier un modèle de régression portant sur ce processus de comptage. Pour pallier des problèmes de fléau de la dimension, nous utilisons un modèle semi-paramétrique appelé modèle à direction révélatrice unique. Des résultats de consistance et de normalité asymptotique sont énoncés pour l’estimateur de l’index de la régression et pour la fonction de régression. Nous illustrons enfin la performance de ces estimateurs sur un jeu de données simulées.

Référence :

(MAP5, Université Paris Descartes)
“Classification selon le style postural basée sur une modélisation par processus stochastique”

Notre travail contribue à l’étude du style postural et plus particulièrement du classement de patients en terme de maintien postural, en considérant le cas d’une population composée de deux classes. Chaque patient (enrôlé dans une cohorte de 54 participants) a suivi deux protocoles expérimentaux évaluant de potentiels déficits du maintien de la posture. Les déplacements des centres de pression maximale exercée par chaque pied ont été enregistrés au cours de ces protocoles.
La procédure de classification est une procédure en deux étapes. Dans une première étape, les données sont modélisées par un processus de diffusion paramétrique dont les paramètres peuvent changer à différents temps de rupture inconnus. Les paramètres et les temps de ruptures sont estimés à partir des données. Dans une seconde étape, on utilise les principe de validation croisée et d’agrégation pour construire deux classifieurs basés sur les estimateurs des paramètres et des temps de rupture. Nous obtenons un taux satisfaisant de 91% de bonne classification.

Références :

(Labo. Statistique et Génome, UMR CNRS 8071, USC INRA, Université d’Evry)
“Robust estimation of the relationship between DNA copy number and gene expression”

Looking for genes whose DNA copy number is “associated” with their expression level in a cancer study can help pinpoint candidates implied in the disease and improve on our understanding of its molecular bases. DNA methylation is an important player to account for in this setting, as it can down-regulate gene expression. We translate the biological question of interest into a well-defined statistical parameter whose relevance goes beyond the specific example considered here. We carry out its estimation following the targeted maximum likelihood estimation methodology. I will explain the method and describe its robustness properties. I will show the results of its application to a simulation study and a real dataset from the Cancer Genome Atlas (TCGA).

Référence :

(Université Paris Diderot)
Schémas adaptatifs pour des essais cliniques avec critère censuré

Les plan d’expérience flexibles (ou adaptatifs) pour les essais cliniques permettent notamment de ré-évaluer, lors d’une analyse intermédiaire, le nombre de sujets à inclure à partir d’une estimation d’un certain nombre de paramètres. Pour un critère de jugement censuré, le risque instantané peut alors être révisé, mais aussi le rapport des risques instantanés attendu sous l’hypothèse alternative.
Nous présenterons plusieurs méthodes permettant de ré-évaluer le nombre de sujets tout en préservant le risque d’erreur de première espèce. Les propriétés de ces méthodes, relevant du paradigme de la statistique semi-paramétrique, sont illustrées dans des situations pratiques à l’aide de simulations numériques et d’exemples.

Référence :