Έλεγχος Τ-τεστ για Ανεξάρτητα Δείγματα [T-test Independent Samples]
Εισαγωγή
Το t-test ανεξάρτητων δειγμάτων χρησιμοποιείται για να γίνει έλεγχος της ύπαρξης στατιστικά σημαντικής διαφοράς ανάμεσα στη μέση τιμή δύο ασυσχέτιστων πληθυσμών.
Υποθέσεις Εφαρμογής του t-test
- Η εξαρτημένη μεταβλητή ελέγχου θα πρέπει να προσεγγίζει την κανονική κατανομή. Ο έλεγχος κανονικότητας μπορεί να γίνει ποιοτικά με τη μελέτη των Q-Q plots και P-P plots ή ποσοτικά με χρήση του Kolmogorov-Smirnov test ή του Shapiro-Wilk test.
- Έλεγχος ύπαρξης ακραίων τιμών (outliers). Θα πρέπει το ποσοστό των ακραίων τιμών σε καθένα από τα δύο δείγματα να μη ξεπερνά το 10%. Ο έλεγχος για ακραίες τιμές μπορεί να πραγματοποιηθεί με τη δημιουργία του θηκογράμματος (boxplot)
- Τα στοιχεία του δείγματος θα πρέπει να είναι ανεξάρτητα (μη συσχετιζόμενα), το οποίο σημαίνει ότι δεν υπάρχει σχέση μεταξύ των παρατηρήσεων. Η παραβίαση αυτής της παραδοχής συνήθως έχει να κάνει με λανθασμένη σχεδίαση της μελέτης.
- Η εξαρτημένη μεταβλητή ελέγχου πρέπει να είναι ποσοτική μεταβλητή, είτε διαστήματος (interval) είτε αναλογίας (ratio).
- Οι παρατηρήσεις πρέπει να είναι ανεξάρτητες, δηλαδή θα πρέπει να έχει εξασφαλιστεί πως μια παρατήρηση από το ένα δείγμα δεν πρόκειται να ανήκει και στο άλλο.
- Οι τιμές των μεταβλητών θα πρέπει να χαρακτηρίζονται από ομοιογένεια, δηλαδή οι διακυμάνσεις των δύο ομάδων θα πρέπει να είναι ίσες. Ο έλεγχος της ομοιογένειας θα γίνεται με το test Levene.
Υλοποίηση του t-test
Για να μπορέσει να χρησιμοποιηθεί το t-test χρειαζόμαστε τα παρακάτω:
- Μία ανεξάρτητη, κατηγορική μεταβλητή δύο επιπέδων/ομάδων
- Μία εξαρτημένη, συνεχή μεταβλητή
Ανεξάρτητα δείγματα
Με τον όρο ανεξάρτητα δείγματα ορίζουμε δύο ή και περισσότερες ομάδες των οποίων τα χαρακτηριστικά διαφέρουν. Η διερεύνηση που γίνεται στα δείγματα αφορά κυρίως άτομα, πράγμα που σημαίνει ότι όταν συγκρίνουμε δύο δείγματα δε μπορεί ένα άτομο να ανήκει και στα δύο ταυτόχρονα. Για παράδειγμα, για τη σύγκριση του φύλου των ατόμων, δε μπορεί ένα άτομο να καταταχθεί στα αρσενικά και ταυτόχρονα και στα θηλυκά.
Μηδενική και εναλλακτική υπόθεση t-test
Έστω ένα τυχαίο δείγμα X1, X2,…, Xn μεγέθους n από έναν πληθυσμό με μέση τιμή μ1 και διακύμανση σ1, άγνωστη, και ένα επίσης τυχαίο δείγμα Y1, Y2,…, Ym μεγέθους m από έναν πληθυσμό με μέση τιμή μ2 και διακύμανση σ22, άγνωστη. Στη μηδενική υπόθεση ισχυριζόμαστε ότι οι μέσες τιμές των δύο δειγμάτων είναι ίσες, δηλαδή: H0: μ1 = μ2.
Τις περισσότερες φορές θέλουμε να ελέγξουμε εάν απορρίπτεται η μηδενική υπόθεση και γίνεται δεκτή η εναλλακτική, σύμφωνα με την οποία οι μέσες τιμές των δειγμάτων διαφέρουν, δηλαδή: HA: μ1 ≠ μ2. Για να μπορέσει να γίνει αυτό θα πρέπει να ορίσουμε ένα νέο επίπεδο σημαντικότητας α, το οποίο θα μας επιτρέπει είτε να απορρίψουμε είτε να δεχτούμε την εναλλακτική υπόθεση. Το επίπεδο σημαντικότητας τις περισσότερες φορές ισούται με 0.05.
Υπόθεση κανονικότητας για την εξαρτημένη μεταβλητή
Για να μπορέσει να πραγματοποιηθεί t-test ανεξάρτητων δειγμάτων απαιτείται η εξαρτημένη μεταβλητή να ακολουθεί κανονική κατανομή. Η υπόθεση της κανονικότητας δεν επηρεάζει σε μεγάλο βαθμό τη χρήση του t-test, δηλαδή μία απόκλιση μακριά από την κανονικότητα δεν επιδρά σε μεγάλο βαθμό στα ποσοστά σφάλματος τύπου I. Ωστόσο, έχει μεγάλη επιρροή όταν η αναλογία του μικρότερου πληθυσμού δείγματος προς τον μεγαλύτερο είναι μεγαλύτερη του 1,5.
Σε περίπτωση που τα χαρακτηριστικά τουλάχιστον ενός από τους δύο πληθυσμούς δεν περιγράφονται ικανοποιητικά από την κανονική κατανομή και τα μεγέθη των δειγμάτων έχουν μεγάλη διαφορά, υπάρχουν δύο τρόποι επίλυσης του προβλήματος. Ο πρώτος τρόπος είναι ο μετασχηματισμός, δηλαδή να χρησιμοποιήσετε τον κατάλληλο μετασχηματισμό έτσι ώστε τα δεδομένα να ακολουθούν κανονική κατανομή. Και ο δεύτερος τρόπος αφορά το τεστ Mann-Whitney U. Πρόκειται για μη παραμετρικό έλεγχο ο οποίος δεν απαιτεί την κανονικότητα των πληθυσμών.
Υπόθεση ομοιογένειας διακύμανσης
Η υπόθεση ομοιογένειας της διακύμανσης ελέγχεται ως επί το πλείστων με το test Levene, το οποίο πραγματοποιείται επίσης στο πρόγραμμα SPSS. Με αυτό τον έλεγχο προκύπτουν δύο τιμές, η F-statistic και η p-value. Η τιμή που δίνουμε περισσότερη σημασία είναι η p-value και συγκεκριμένα, εάν p<0.05 οι διακυμάνσεις των πληθυσμών είναι άνισες, οπότε παραβιάζεται η υπόθεση ομοιογένειάς τους.
Στην περίπτωση που από το test Levene διαπιστώσετε ότι παραβιάζεται η υπόθεση της ομοιογένειας, μπορεί να διορθωθεί χρησιμοποιώντας την συγκεντρωτική εκτίμηση για την τιμή t-statistic, αλλά αντί για την προσαρμογή των βαθμών ελευθερίας, θα χρησιμοποιηθεί η μέθοδος Welch-Satterthwaite. Τα αποτελέσματα του test Levene για την υπόθεση ομοιογένειας της διακύμανσης οδηγούν σε συμπεράσματα για την απόρριψη της μηδενικής υπόθεσης, όπου δεν υπάρχουν διαφορές ανάμεσα στα δείγματα, και την αποδοχή της εναλλακτικής, όπου υπάρχουν στατιστικά σημαντικές διαφορές.
Πλήρης αναφορά αποτελεσμάτων
Στην αναφορά των αποτελεσμάτων πρέπει να καταγράφονται η τιμή t-statistic, οι βαθμοί ελευθερίας (df) και η p-τιμή, με την παρακάτω μορφή: t(df) = t-statistic, p = p-τιμή. Για παράδειγμα: t(0.05) = 2.233, p = 0.061.
Για να μπορεί αυτός που διαβάζει την αναφορά των αποτελεσμάτων να έχει μία ξεκάθαρη εικόνα για τα αποτελέσματα, είναι απαραίτητο να συμπεριληφθούν τα αποτελέσματα από τον έλεγχο κανονικότητας, το test Levene για την ισότητα των διακυμάνσεων, τις μέσες τιμές και τις τυπικές αποκλίσεις των δύο δειγμάτων, το αποτέλεσμα της t-statistic, την κατεύθυνση της διαφοράς (εφόσον υπάρχει) και τη διαφορά των δύο δειγμάτων μαζί με ένα διάστημα εμπιστοσύνης 95%.
Βιβλιογραφία
Ελληνόγλωσση
Προμπονάς, A. (2016). ΣΤΑΤΙΣΤΙΚΗ ΑΞΙΟΛΟΓΗΣΗ ΔΥΟ ΜΕΣΩΝ ΤΙΜΩΝ.
Ξενόγλωσση
Allen, P., Bennett, K., & Heritage, B. (2014). SPSS statistics version 22: A practical guide. Cengage Learning Australia.
Sedgwick, P. (2010). Independent samples t test. BMJ, 340.
Statistics, L. (2015). One-sample t-test using SPSS Statistics. Statistical tutorials and software guides.