Les Infections des Voies Respiratoires Supérieures (IVRS) sont des affections aigues dues à une infection
virale ou bactérienne touchant les voies respiratoires supérieures : le nez, les sinus para-nasaux, le pharynx,
le larynx et l’oreille moyenne (Kaiser L., Humair J-P., 2013).
Les IVRS regroupent entre autres la toux, le rhume, le mal de gorge, la bronchite, la sinusite, la pneumonie.
La survenue de telles infections dépendrait du climat et ainsi de la période de l’année. Comment peut-on vérifier cette assertion au moyen des outils proposés par les data sciences ?
Pour les besoins d’une étude sur les IVRS, les données figurant au tableau 1 ont été collectées.
Il s’agit des effectifs de personnes atteintes de bronchite, sinusite, pneumonie et des autres IVRS au cours de deux années successives, soit les quatres trimestres de la première année (a1, a2, a3, a4) et le premier trimestre de la deuxième année (b1) .
Question : La période de l’année a-t-elle une influence significative sur la survenue des Infections des Voies Respiratoires Supérieures (IVRS) ?
Le test d’indépendance du Chi-deux peut nous permettre d’y répondre. En effet les variables en étude (la
période de l’année et les IVRS) sont qualitatives. Rappelons l’hypothèse nulle du test.
: Indépendance entre la période de l’année et la survenue des IVRS.
Une autre formulation est celle-ci :
: La survenue des IVRS ne dépend pas de la période de l’année.
L’utilisation du test d’indépendance du chi-deux nécessite que certaines conditions soient vérifiées. Soit (Eij )
le tableau des effectifs théoriques en cas d’indépendance c’est-à-dire les effectifs que devrait comporter le
tableau 1 si la survenue des IVRS ne dépendait pas de la période de l’année (c’est-à-dire en supposant
l’hypothèse ). Selon le critère de Cochran, appliquer le test d’indépendance du chi-deux suppose que :
— Toutes les classes (i, j) ont une valeur théorique non nulle
— 80% des classes doivent avoir une valeur théorique supérieure ou égale à 5
Nous appliquons donc le test d’indépendance du chi-deux.
Détecter une liaison significative, c’est bien. Comprendre la nature de la liaison, c’est encore mieux. La différence entre les effectifs observés et les effectifs théoriques permet de construire un indicateur : le résidu.
étant l’effectif théorique de la cellule (i, j) en cas d’indépendance.
Le signe du résidu indique le sens de l’association entre les caractères i et j : attraction (resij > 0) ou répulsion (resij < 0).
Les valeurs brutes des résidus ne sont pas directement exploitables. Il faut d’abord les normaliser par les effectifs théoriques afin de les mettre sur le même pied d’égalité : c’est le résidu standardisé dont voici la formule :
Sa distribution suit approximativement la loi normale centrée réduite. Le résidu standardisé est utilisé pour détecter le caractère significatif de l’écart à l’indépendance d’une cellule. Ainsi une cellule (i, j) s’écarte de l’indépendance lorsque |rstdij| > 2 au risque de 5%
— La prévalence de bronchite est significativement plus élevée au cours de la période a3 en témoigne le nombre de malades. En effet nous avons 118 cas de bronchite au cours du trimestre a3 contre un nombre moyen de 99 cas de bronchite sur les cinq périodes.
— La prévalence de sinusite est très significativement élevée durant le trimestre a1. En effet, il a été enregistré 99 cas de sinusite contre un effectif moyen de 55 cas de sinusites sur les cinq trimestes.
— La prévalence de sinusite est significativement plus faible durant le trimestre b1, soit 32 malades de sinusite contre une moyenne de 55 malades de sinusite sur les cinq trimestres.
Auteur : Amiel SOSSA, Data Scientist à LESCAL
Comments