Par José Pedro, méthodologiste, ESCC, juin 2009
1. Introduction
Ce document présente les résultats de l’étude de fiabilité des pèse-personnes utilisés pour la collecte de données du module sur la taille et le poids mesurés (TPM). Les mesures physiques de la taille et du poids ont été prises pour un sous-échantillon d’environ 5 000 répondants dans le cadre de l’Enquête sur la santé dans les collectivités canadiennes (ESCC) de 2008. La collecte de ces données est gérée dans 4 bureaux régionaux: Edmonton, Montréal, Halifax, et Toronto.
Dans un premier temps, nous décrirons brièvement le but de cette étude. Ensuite, nous discuterons de la méthodologie utilisée. Et pour finir nous présenterons les conclusions issues des tableaux présentant l’ensemble des statistiques utilisées pour mesurer la précision des pèse-personnes avant et après l’enquête.
2. Objectif de l’étude de fiabilité
Afin de nous assurer de la précision des données des mesures physiques, nous avons procédé à une étude de fiabilité des pèse-personnes qui sont utilisés dans le cadre de l’enquête. La collecte des données de cette étude de fiabilité s’est faite en 2 temps. Une première collecte de mesures a été faite avant le début de l’enquête (décembre 2007) pour déterminer le bon fonctionnement et la précision des pèse-personnes avant leur envoi dans les bureaux régionaux. Et une deuxième collecte a été réalisée après l’enquête (janvier 2008) afin de s’assurer de la précision des pèse-personnes utilisés sur le terrain.
3. Méthodologie
Pour pouvoir tester la précision des pèse-personnes, un échantillon de pèse-personnes a été sélectionné par bureau régional (le document Validation Instructions.doc décrit les détails de l’échantillonnage). Initialement 20 pèse-personnes ont été échantillonnés par bureau régional. Dans les cas où 2 pèse-personnes n’ont pas réussi à passer le processus de validation, un échantillon additionnel de 10 pèse-personnes a été sélectionné. Pour qu’un pèse-personne ne passe pas le processus de validation, il doit rencontrer au moins un des critères suivant: les piles du pèse-personnes sont hors fonction, le pèse-personne ne commence pas à 0, au moins une des 4 mesures de poids (40 Kg, 80 Kg, 120 Kg et 140 Kg) est hors de la plage de donnée acceptable qui est de 2%, le pèse-personne est brisé ou il ne fonctionne pas du tout.
Voici brièvement la procédure suivie pour la prise des mesures. À chaque bureau régional et pour chaque pèse-personne sélectionné, quelques caractéristiques descriptives ont été enregistrées dans une feuille Excel: le numéro de la boite dans laquelle le pèse personne a été tiré, le lieu où se trouve la boîte dans l’entrepôt et le numéro de série du pèse-personne. Pour l’étude avant l’enquête, le fonctionnement des piles a été testé aussi, mais pour l’étude après l’enquête, de nouvelles piles ont été utilisées pour chaque pèse-personne sélectionné. Ensuite les mesures ont été recueillies pour chacun des poids (40 Kg, 80 Kg, 120 Kg et 140 Kg) et la valeur indiquée par le pèse-personne a été enregistrée. Pour terminer, les valeurs obtenues ont été vérifiées pour s’assurer qu’elles ne sont pas hors de la plage de donnée acceptable de 2%.
Il est à noter qu’aucun échantillon additionnel n’a dû être sélectionné puisque les échantillons initiaux ont respecté les procédures de validation.
Une fois les mesures prises, nous avons évalué la précision des pèse-personnes en étudiant l’association entre la valeur du poids mesurée et la vraie valeur du poids à partir d’un test d’hypothèse de Student (TEST-T). Cette méthode permet de déterminer s’il y a une différence significative ou pas entre la moyenne des mesures prises avec les pèse-personnes échantillonnés et la valeur de référence. Le test–t a été appliqué pour chacun des poids testés à 40, 80, 120 et 140. La valeur p1 ainsi que les bornes inférieure et supérieure de l’intervalle de confiance du test–t ont été calculé pour l’ensemble des régions et pour chaque région. Le niveau de signification qui a été utilisé est de 5%. Cela veut donc dire que si nous trouvons une valeur p supérieur à 5%, il n’y a pas de différence significative entre la moyenne observée et la valeur du poids de référence. Dans le cas contraire, on dira qu’il y a une différence significative entre la moyenne et le poids de référence.
Pour pouvoir réaliser nos analyses et nos tableaux, nous avons utilisé les logiciels SAS 9.0 et Excel 2002.
4. Analyse - Statistiques descriptives et test–t
4.1 Analyse avant enquête
Avant l’enquête, la précision de chacun des 80 pèse-personnes (20 pour chacun des 4 bureaux régionaux) a été testée. Les tests ont été faits sur des poids de référence de 40 Kg, 80 Kg, 120 Kg et 140 Kg. Lorsqu’on observe le tableau I.1 en ce qui concerne tous les bureaux régionaux, on note que le minimum et le maximum à chacun des poids de référence se trouvent dans la plage de données acceptable qui a été établi à 2% au moment des mesures prises avec les poids calibrés. Pour le poids de 40 Kg, le minimum et le maximum sont atteints à 39,80 et 40,70 respectivement, et demeure dans la plage de données acceptable qui est (39,2 ; 40,8). Pour le poids de 80 Kg, le minimum et le maximum sont atteint à 79,65 et 80,70 et demeure dans la plage de données acceptable de (78,4 ; 81,6). Pour le poids de 120 Kg, le minimum et le maximum sont atteint à 119,85 et 120,90 et sont dans la plage de données acceptable de (117,6 ; 122,4). Finalement, pour le poids de 140 Kg, le minimum et le maximum sont atteints à 139,85 et 141,50 et sont également dans la plage de données acceptable de (137,2 ; 142,8).
Lorsqu’on observe la valeur p du test–t à chacun des poids de référence (40, 80, 120 et 140 Kg), on note une différence significative entre la moyenne de l’échantillon et le poids de référence (p<5%). Cependant en regardant les bornes inférieures et supérieures des intervalles de confiance, on peut noter que même si 40, 80 120 et 140 ne se trouvent pas dans leurs intervalles de confiance respectifs, les valeurs des bornes inférieures et supérieures sont visiblement toujours très proche des valeurs de référence, soient (40,1;40,06), (80,03;80,1), (120,1;120,17) et (140,12;140,23) respectivement. On considère donc que les pèse-personnes sont suffisamment précis.
Par la suite, des analyses semblables ont été faites pour chacun des bureaux régionaux avec un échantillon de 20 pèse-personnes par région. Les résultats doivent être utilisés avec précaution puisqu’ils s‘appliquent à un échantillon de moins de 30 unités. Dans le cas d’Edmonton et de Toronto, les minimums et les maximums se trouvent tous également dans les plages de données acceptables de 2%. On note une valeur P supérieure à 5% pour les mesures testées à 40, ce qui signifie qu’il n’y a pas de différence significative entre la moyenne et la valeur de référence 40 Kg. Pour les autres mesures c'est-à-dire à 80, 120 et 140 Kg, la valeur P est inférieure à 5 % et donc significativement différentes des poids de référence. Encore une fois, les bornes inférieures et supérieures étant toujours très proches des valeurs de référence, on peut établir que les pèse-personnes sont suffisamment précis.
Dans le cas d’Halifax et Montréal, les minimums et les maximums se trouvent tous dans les plages de données acceptables. On note une valeur P supérieure à 5% pour les mesures testées à 40 et 80 Kg, ce qui signifie qu’il n’y a pas de différence significative entre la moyenne à 40 Kg et la valeur de référence, ainsi qu’entre la moyenne à 80 Kg et la valeur de référence et ceci pour chacune des 2 régions. Pour les tests à 120 et 140 Kg, les valeurs P sont inférieures à 5 % mais les intervalles de confiances sont tels que les conclusions sont identiques aux analyses précédentes.
Bureau régional /Statistique | Tester à 40 Kg | Tester à 80 Kg | Tester à 120 Kg | Tester à 140 Kg |
---|---|---|---|---|
Tous les bureaux régionaux | ||||
Maximum | 40,7 | 80,7 | 120,9 | 141,5 |
Moyenne | 40,03 | 80,07 | 120,14 | 140,17 |
Minimum | 39,8 | 79,65 | 119,85 | 139,85 |
Nombre | 80 | 80 | 80 | 80 |
Écart type | 0,11 | 0,16 | 0,16 | 0,25 |
Borne inférieur de l'intervalle de confiance | 40,01 | 80,03 | 120,1 | 140,12 |
Borne supérieur de l'intervalle de confiance | 40,06 | 80,1 | 120,17 | 140,23 |
Erreur standard | 0,01 | 0,02 | 0,02 | 0,03 |
Valeur P | 0,0127 | 0,0003 | <,0001 | <0,0001 |
Edmonton | ||||
Maximum | 40,1 | 80,15 | 120,25 | 140,35 |
Moyenne | 40,02 | 80,04 | 120,07 | 140,11 |
Minimum | 39,9 | 79,9 | 119,85 | 139,95 |
Nombre | 20 | 20 | 20 | 20 |
Écart type | 0,07 | 0,07 | 0,09 | 0,12 |
Borne inférieur de l'intervalle de confiance | 39,99 | 80,01 | 120,02 | 140,06 |
Borne supérieur de l'intervalle de confiance | 40,05 | 80,07 | 120,11 | 140,17 |
Erreur standard | 0,01 | 0,02 | 0,02 | 0,03 |
Valeur P | 0,3157 | 0,011 | 0,0044 | 0,0004 |
Halifax | ||||
Maximum | 40,1 | 80,2 | 120,35 | 140,3 |
Moyenne | 40,02 | 80,03 | 120,11 | 140,12 |
Minimum | 39,95 | 79,85 | 119,95 | 139,9 |
Nombre | 20 | 20 | 20 | 20 |
Écart type | 0,06 | 0,1 | 0,11 | 0,11 |
Borne inférieur de l'intervalle de confiance | 39,99 | 79,98 | 120,05 | 140,07 |
Borne supérieur de l'intervalle de confiance | 40,05 | 80,08 | 120,16 | 140,17 |
Erreur standard | 0,01 | 0,02 | 0,03 | 0,02 |
Valeur P | 0,1485 | 0,1864 | 0,0006 | <0,0001 |
Montréal | ||||
Maximum | 40,25 | 80,7 | 120,9 | 141,1 |
Moyenne | 40,02 | 80,1 | 120,2 | 140,19 |
Minimum | 39,8 | 79,65 | 119,9 | 139,85 |
Nombre | 20 | 20 | 20 | 20 |
Écart type | 0,09 | 0,25 | 0,2 | 0,28 |
Borne inférieur de l'intervalle de confiance | 39,98 | 79,98 | 120,1 | 140,06 |
Borne supérieur de l'intervalle de confiance | 40,06 | 80,21 | 120,29 | 140,33 |
Erreur standard | 0,02 | 0,06 | 0,05 | 0,06 |
Valeur P | 0,3915 | 0,1031 | 0,0004 | 0,0069 |
Toronto | ||||
Maximum | 40,7 | 80,45 | 120,65 | 141,5 |
Moyenne | 40,08 | 80,1 | 120,19 | 140,27 |
Minimum | 39,9 | 79,85 | 120,05 | 139,95 |
Nombre | 20 | 20 | 20 | 20 |
Écart type | 0,19 | 0,16 | 0,17 | 0,37 |
Borne inférieur de l'intervalle de confiance | 39,99 | 80,02 | 120,11 | 140,1 |
Borne supérieur de l'intervalle de confiance | 40,17 | 80,18 | 120,27 | 140,44 |
Erreur standard | 0,04 | 0,04 | 0,04 | 0,08 |
Valeur P | 0,0811 | 0,0129 | <0,0001 | 0,0041 |
4.2 Analyse après l’enquête
Après l’enquête, la précision de chacun des 91 pèse-personnes (20 à Edmonton et à Halifax, 21 à Montréal, et 30 à Toronto) a été testée. Les mesures des tests ont été utilisées pour 87 des 91 pèse-personnes parce qu’on a trouvé 4 pèse-personnes défectueux. Un des pèse-personnes se trouve à Montréal et les 3 autres à Toronto. Les pèse-personnes brisés représentent 4,4% de tous les pèse-personnes testés dans cette étude. Lors de l’analyse, nous avons noté que 2 de ces pèses personnes défectueux ont été utilisés lors de la collecte pour 14 mesures. Ces 14 cas ne constituent que 0,28% des 5 000 cas du module de TPM. Ces cas ont été exclus de l’étude.
Encore une fois, les tests ont été faits sur des poids de référence de 40 Kg, 80 Kg, 120 Kg et 140 Kg pour les 87 pèse-personnes fonctionnels et les résultats sont similaires aux résultats précédent l’enquête. En voici le détail.
On remarque dans le Tableau 4,2 que le minimum et le maximum à chacun des poids de référence se trouvent dans la plage de données acceptable qui a été établie à 2%. Pour le poids de 40 Kg, le minimum et le maximum sont atteints à 39,90 et 40,50 et sont dans la plage de données acceptable de (39,2 ; 40,8). Pour le poids de 80 Kg, le minimum et le maximum sont atteints à 79,70 et 80,50 et sont dans la plage de données acceptable de (78,4 ; 81,6). Pour le poids de 120 Kg, le minimum et le maximum sont atteints à 119,95 et 120,65 et sont dans la plage de données acceptable de (117,6 ; 122,4). Finalement, pour le poids de 140 Kg, le minimum et le maximum sont atteints à 139,95 et 140,40 et sont dans la plage de données acceptable de (137,2 ; 142,8).
Lorsqu’on observe la valeur p du test–t à chacun des poids de référence (40, 80, 120 et 140 Kg), on note une différence significative entre la moyenne de l’échantillon et le poids de référence. On arrive aux mêmes conclusions faites lors de l’analyse avant l’enquête à savoir que les bornes inférieures et supérieures sont très proches des valeurs de référence soient (40,04;40,07), (80,07;80,11), (120,11;120,16) et (140,13;140,17) respectivement. On peut donc considérer que les pèse-personnes sont suffisamment précis.
Par la suite, des analyses semblables ont été faites par bureau régional. Encore une fois, les résultats doivent être utilisés avec précaution puisqu’ils s‘appliquent à un échantillon de moins de 30 unités. Pour chacun des bureaux régionaux et pour chaque valeur de poids, on note une valeur P inférieur à 5%, ce qui signifie qu’il y a des différences significatives entre la moyenne et la valeur de référence. Encore une fois, les bornes inférieures et supérieures étant toujours très proches des valeurs de référence, on peut établir que les pèse-personnes sont suffisamment précis.
Bureau régional/Statistique | Tester à 40 Kg | Tester à 80 Kg | Tester à 120 Kg | Tester à 140 Kg |
---|---|---|---|---|
Tous les bureaux régionaux | ||||
Maximum | 40,5 | 80,5 | 120,65 | 140,4 |
Moyenne | 40,06 | 80,09 | 120,14 | 140,15 |
Minimum | 39,9 | 79,7 | 119,95 | 139,95 |
Nombre | 87 | 87 | 87 | 87 |
Écart type | 0,06 | 0,09 | 0,11 | 0,09 |
Borne inférieur de l'intervalle de confiance | 40,04 | 80,07 | 120,11 | 140,13 |
Borne supérieur de l'intervalle de confiance | 40,07 | 80,11 | 120,16 | 140,17 |
Erreur standard | 0,01 | 0,01 | 0,01 | 0,01 |
Valeur P | <0,0001 | <0,0001 | <0,0001 | <0,0001 |
Edmonton | ||||
Maximum | 40,1 | 80,2 | 120,25 | 140,25 |
Moyenne | 40,06 | 80,09 | 120,13 | 140,13 |
Minimum | 40 | 79,95 | 120 | 140 |
Nombre | 20 | 20 | 20 | 20 |
Écart type | 0,03 | 0,06 | 0,06 | 0,06 |
Borne inférieur de l'intervalle de confiance | 40,04 | 80,06 | 120,1 | 140,1 |
Borne supérieur de l'intervalle de confiance | 40,08 | 80,12 | 120,16 | 140,16 |
Erreur standard | 0,01 | 0,01 | 0,01 | 0,01 |
Valeur P | <0,0001 | <0,0001 | <0,0001 | <0,0001 |
Halifax | ||||
Maximum | 40,1 | 80,5 | 120,5 | 140,4 |
Moyenne | 40,05 | 80,13 | 120,18 | 140,2 |
Minimum | 40 | 80 | 120 | 140,05 |
Nombre | 20 | 20 | 20 | 20 |
Écart type | 0,03 | 0,11 | 0,12 | 0,09 |
Borne inférieur de l'intervalle de confiance | 40,04 | 80,08 | 120,12 | 140,16 |
Borne supérieur de l'intervalle de confiance | 40,07 | 80,18 | 120,23 | 140,24 |
Erreur standard | 0,01 | 0,03 | 0,03 | 0,02 |
P_value | <0,0001 | <0,0001 | <0,0001 | <0,0001 |
Montréal | ||||
Maximum | 40,1 | 80,2 | 120,65 | 140,3 |
Moyenne | 40,04 | 80,08 | 120,14 | 140,12 |
Minimum | 39,95 | 80 | 120 | 140 |
Nombre | 20 | 20 | 20 | 20 |
Écart type | 0,04 | 0,06 | 0,15 | 0,07 |
Borne inférieur de l'intervalle de confiance | 40,03 | 80,06 | 120,07 | 140,09 |
Borne supérieur de l'intervalle de confiance | 40,06 | 80,11 | 120,21 | 140,16 |
Erreur standard | 0,01 | 0,01 | 0,03 | 0,02 |
Valeur P | <0,0001 | <0,0001 | 0,0005 | <0,0001 |
Toronto | ||||
Maximum | 40,5 | 80,2 | 120,25 | 140,3 |
Moyenne | 40,06 | 80,06 | 120,11 | 140,14 |
Minimum | 39,9 | 79,7 | 119,95 | 139,95 |
Nombre | 27 | 27 | 27 | 27 |
Écart type | 0,11 | 0,1 | 0,08 | 0,1 |
Borne inférieur de l'intervalle de confiance | 40,02 | 80,02 | 120,08 | 140,1 |
Borne supérieur de l'intervalle de confiance | 40,11 | 80,1 | 120,14 | 140,18 |
Erreur standard | 0,02 | 0,02 | 0,02 | 0,02 |
Valeur P | 0,0037 | 0,0036 | <0,0001 | <0,0001 |
5. Conclusion
L’analyse de fiabilité des pèse-personnes permet de conclure que les pèse-personnes sont suffisamment précis. Même si nous notons des différences significatives entre les moyennes et les valeurs de références, les bornes inférieures et supérieures des intervalles de confiance sont très proches de la valeur du poids de référence. Cette conclusion est valable pour les données avant l’enquêteetaprès l’enquête.
Nota
1. La valeur p d’un test d’hypothèse statistique est la probabilité de rejeter à tort l’hypothèse de base alors qu’elle est vraie. Ainsi, plus la valeur de p est petite, plus la probabilité de rejeter à tort l’hypothèse de base sachant qu’elle est vraie est petite. On acceptera alors que l’hypothèse de base est fausse. Une valeur limite de p de 5% est couramment utilisée dans les tests d’hypothèse.