Bonjour Syrine,
Dans vos différentes tables, le nombre d'observations est assez faible, donc des tests non-paramétriques sont recommandés, car ils ne reposent pas sur des hypothèses de distributions normales de vos réponses. En effet, étant donné que le nombre d'observations est faible voire très faible, nous n'avons aucune certitude sur la représentativité des observations mesurées, et qu'en réalisant d'autres tests, ces derniers se retrouveraient autours des premières valeurs trouvées en suivant une distribution normale. A noter que la plupart des conclusions/interprétations ci-dessous sont déjà perceptibles graphiquement.
Je suis parti du principe que vous vouliez détecter si vous avez une différence significative entre vos groupes de nature chimique différente. Après avoir regardé vos différentes tables, voici quelques pistes et suggestions pour l'analyse :
- Table "Différence volume" : Pour cette table, vous avez 5 observations pour chaque groupe (3 groupes).
En utilisant la plateforme "Ajuster Y en fonction de X", vous pouvez tester que la variance entre chaque groupe est similaire (triangle rouge, option "Variances inégales"). Ici, pas de p-value < 0,05 donc pas de raison de penser qu'il y ait une différence statistiquement significative d'une différence de variance entre les 3 groupes.
On peut continuer l'analyse et tester via le test non-paramétrique Steel-Dwass (triangle rouge, "Non paramétrique", "Comparaisons multiples non paramétriques", "Steel-Dwass toutes les paires") qui protège contre le risque d'erreur de type I en cas de comparaisons multiples :
Aucune différence statistiquement significative n'est détectée, et on obtient le même résultat avec un test paramétrique Tukey-Kramer (qui lui aussi protège contre le risque d'erreur de type I en cas de comparaisons multiples, contrairement au test (paramétrique) de Student) que l'on peut visualiser facilement :
Ici le nombre d'observations est réduit, mais en utilisant la plateforme Distributions et en affichant le graphique des quantiles normaux, on peut voir qu'il n'y a pas de déviation importante par rapport à la droite de Henry, donc on peut supposer une quasi-normalité des données, suffisante pour utiliser un test paramétrique comme Tukey-Kramer et comparer les résultats des deux tests (Steel-Dwass non paramétrique avec Tukey-Kramer paramétrique).
Conclusion sur ce jeu de données : Malgré un nombre d'observations faibles, il semble ne pas y avoir de différence statistiquement significative entre les groupes de nature chimique différentes sur la réponse volume. Cette conclusion doit être nuancée car il n'y a aucune certitude que les observations soient représentatives de futurs résultats selon la nature chimique, donc c'est une conclusion à "l'instant présent" avec les données disponibles.
- Table "différence aw et HR" : Pour cette table, vous avez 3 observations pour chaque groupe (2 groupes). L'analyse des variances comme vu précédemment ne va pas donner grand chose vu le faible nombre de points (pas de différence significative entre les variances des deux groupes). Le jeu de données est extrêmement petit, donc on ne partira que sur des tests non-paramétriques, et comme il n'y a que deux groupes, celà permet de réaliser des tests exacts (triangle rouge, Non paramétrique, Test Exact). Par défaut, j'ai réalisé le test exact de Wilcoxon, mais vous pouvez tester les autres tests exacts non-paramétriques, vous verrez qu'ils s'accordent tous :
- Pour aw en fonction de Nature : Les tests ressortent avec une p-value égale à 0,05. Cette différence est déjà visible graphiquement, donc pas de surprises sur ce diagnostic. Il semblerait donc bien y avoir une différence statistiquement significative.
- Pour HR en fonction de Nature : Les tests ressortent tous avec une p-value supérieure à 0,05 ce qui n'est pas étonnant vu la répartition des points, visible graphiquement.
Pour la dernière table, "différence retroextrusion" je ne suis pas entièrement sûr de quelle est la réponse (premier t de repos ?): le groupe semble être le même que précédemment (avec la colonne 4), mais que représente la colonne "temps", un autre groupe possible pour étudier des différences selon le temps 1 ou 2 ou une réponse ?
Avec la démarche vue précédemment sur les deux tables (que je vous attache ici avec les scripts des analyses effctuées), je pense que vous aurez des pistes pour mener à bien votre analyse sur cette dernière table.
Victor GUILLER
L'Oréal Data & Analytics
"It is not unusual for a well-designed experiment to analyze itself" (Box, Hunter and Hunter)