14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

45
Έλεγχος Χ 2 Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 471 14. Έλεγχος Χ 2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Από διασταύρωση ορισμένου είδους πειραματόζωων προκύπτουν τρεις τύποι απογόνων, Α, Β και Γ. Στο πλαίσιο ενός πειράματος, από μια τέτοια διασταύρωση, προέκυψαν 64 απόγονοι από τους οποίους 34 βρέθηκαν να είναι τύπου Α, 10 τύπου Β και 20 τύπου Γ. Σύμφωνα με ένα μοντέλο κληρονομικότητας, οι τρεις τύποι απογόνων πρέπει να βρίσκονται σε αναλογία 9:3:4, αντίστοιχα. Στο Παράδειγμα 6.2.1, είδαμε ότι αν δεχθούμε ότι το συγκεκριμένο μοντέλο κληρονομικότητας πράγματι περιγράφει την αναλογία απογόνων από μια τέτοια διασταύρωση, τότε από 64 απογόνους αναμένουμε τύπου Α να είναι οι 36, τύπου Β οι 12 και τύπου Γ οι 16. Παρατηρείστε ότι οι αναμενόμενες (με βάση το μοντέλο κληρονομικότητας) συχνότητες εμφάνισης των τριών τύπων απογόνων (36, 12 και 16, αντίστοιχα) διαφέρουν από τις αντίστοιχες συχνότητες που παρατηρήσαμε στο πείραμα (34, 10 και 20, αντίστοιχα). Άραγε, αυτές οι διαφορές μεταξύ παρατηρηθέντων και αναμενόμενων συχνοτήτων, είναι στατιστικά σημαντικές; Μας δίνουν δηλαδή στατιστικά σημαντικές αποδείξεις ότι το μοντέλο κληρονομικότητας δεν περιγράφει ικανοποιητικά την αναλογία των απογόνων που προκύπτουν από μια τέτοια διασταύρωση; H ταξινόμηση ενός απογόνου σε (ακριβώς) έναν από τρεις τύπους απογόνων (τύπος Α, τύπος Β, τύπος Γ) είναι μια πολυωνυμική δοκιμή με 3 = k δυνατά αποτελέσματα και επομένως πρόκειται για ένα πείραμα 64 = ν ανεξάρτητων πολυωνυμικών δοκιμών. Το πρόβλημα που τίθεται είναι προφανώς ένα πρόβλημα στατιστικού ελέγχου υποθέσεων για τις πιθανότητες (ποσοστά) εμφάνισης των τιμών μιας ποιοτικής τυχαίας μεταβλητής (είδος απογόνου). Ανάλογες περιπτώσεις στατιστικών ελέγχων που ήδη γνωρίσαμε (θυμηθείτε τον έλεγχο για διωνυμικό ποσοστό), αναφέρονται βέβαια σε ποιοτικές μεταβλητές, αλλά με δύο μόνο δυνατές τιμές, επιτυχία/αποτυχία, (περιγράφουν δοκιμές Bernoulli), όπως «συμφωνία με συγκεκριμένη άποψη» με τιμές, ναι, όχι «φύλο ασθενούς» με τιμές, άνδρας, γυναίκα «αποτέλεσμα διαγνωστικού test» με τιμές, θετικό, αρνητικό «ποιότητα προϊόντος» με τιμές, αποδεκτό, ελαττωματικό «αποτέλεσμα θεραπευτικής αγωγής» με τιμές, θεραπεύθηκε, δε θεραπεύθηκε «τύπος απογόνου από ορισμένη διασταύρωση» με τιμές, τύπου Α, όχι τύπου Α «γονότυπος παιδιού» με τιμές, Αα, όχι Αα «ποσότητα φυτικών ινών ανά μερίδα δημητριακών» με τιμές, gr 5 < , gr 5 . Σε αυτή την ενότητα, θα γνωρίσουμε τους ελέγχους Χ 2 που όπως θα διαπιστώσουμε, μας επιτρέπουν να κάνουμε στατιστικούς ελέγχους που αφορούν πειράματα επαναλαμβανόμενων ανεξάρτητων πολυωνυμικών δοκιμών. Έτσι, θα μπορούμε πλέον να αποφασίζουμε για τη στατιστική σημαντικότητα πειραματικών ή δειγματοληπτικών δεδομένων που αναφέρονται σε ποιοτικές μεταβλητές όπως «ομάδα αίματος ασθενούς» με τιμές, Α, Β, ΑΒ, Ο «γονότυπος παιδιού» με τιμές, ΑΑ, Αα, αα «αποτέλεσμα φαρμακευτικής αγωγής» με τιμές, θετικό, θετικό με παρενέργειες, αρνητικό «στάση απέναντι στην απαγόρευση του καπνίσματος σε δημόσιους χώρους» με τιμές, πολύ αρνητική, αρνητική, αδιάφορη, θετική, πολύ θετική «οικογενειακή κατάσταση» με τιμές, παντρεμένος/η, άγαμος/η, διαζευγμένος/η, χήρος/α

Transcript of 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Page 1: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 471

14. Έλεγχος Χ2 (καλής προσαρμογής, ανεξαρτησίας και ομογένειας) Από διασταύρωση ορισμένου είδους πειραματόζωων προκύπτουν τρεις τύποι απογόνων, Α, Β και Γ. Στο πλαίσιο ενός πειράματος, από μια τέτοια διασταύρωση, προέκυψαν 64 απόγονοι από τους οποίους 34 βρέθηκαν να είναι τύπου Α, 10 τύπου Β και 20 τύπου Γ. Σύμφωνα με ένα μοντέλο κληρονομικότητας, οι τρεις τύποι απογόνων πρέπει να βρίσκονται σε αναλογία 9:3:4, αντίστοιχα. Στο Παράδειγμα 6.2.1, είδαμε ότι αν δεχθούμε ότι το συγκεκριμένο μοντέλο κληρονομικότητας πράγματι περιγράφει την αναλογία απογόνων από μια τέτοια διασταύρωση, τότε από 64 απογόνους αναμένουμε τύπου Α να είναι οι 36, τύπου Β οι 12 και τύπου Γ οι 16. Παρατηρείστε ότι οι αναμενόμενες (με βάση το μοντέλο κληρονομικότητας) συχνότητες εμφάνισης των τριών τύπων απογόνων (36, 12 και 16, αντίστοιχα) διαφέρουν από τις αντίστοιχες συχνότητες που παρατηρήσαμε στο πείραμα (34, 10 και 20, αντίστοιχα). Άραγε, αυτές οι διαφορές μεταξύ παρατηρηθέντων και αναμενόμενων συχνοτήτων, είναι στατιστικά σημαντικές; Μας δίνουν δηλαδή στατιστικά σημαντικές αποδείξεις ότι το μοντέλο κληρονομικότητας δεν περιγράφει ικανοποιητικά την αναλογία των απογόνων που προκύπτουν από μια τέτοια διασταύρωση; H ταξινόμηση ενός απογόνου σε (ακριβώς) έναν από τρεις τύπους απογόνων (τύπος Α, τύπος Β, τύπος Γ) είναι μια πολυωνυμική δοκιμή με 3=k δυνατά αποτελέσματα και επομένως πρόκειται για ένα πείραμα 64=ν ανεξάρτητων πολυωνυμικών δοκιμών. Το πρόβλημα που τίθεται είναι προφανώς ένα πρόβλημα στατιστικού ελέγχου υποθέσεων για τις πιθανότητες (ποσοστά) εμφάνισης των τιμών μιας ποιοτικής τυχαίας μεταβλητής (είδος απογόνου). Ανάλογες περιπτώσεις στατιστικών ελέγχων που ήδη γνωρίσαμε (θυμηθείτε τον έλεγχο για διωνυμικό ποσοστό), αναφέρονται βέβαια σε ποιοτικές μεταβλητές, αλλά με δύο μόνο δυνατές τιμές, επιτυχία/αποτυχία, (περιγράφουν δοκιμές Bernoulli), όπως

• «συμφωνία με συγκεκριμένη άποψη» με τιμές, ναι, όχι • «φύλο ασθενούς» με τιμές, άνδρας, γυναίκα • «αποτέλεσμα διαγνωστικού test» με τιμές, θετικό, αρνητικό • «ποιότητα προϊόντος» με τιμές, αποδεκτό, ελαττωματικό • «αποτέλεσμα θεραπευτικής αγωγής» με τιμές, θεραπεύθηκε, δε θεραπεύθηκε • «τύπος απογόνου από ορισμένη διασταύρωση» με τιμές, τύπου Α, όχι τύπου Α • «γονότυπος παιδιού» με τιμές, Αα, όχι Αα • «ποσότητα φυτικών ινών ανά μερίδα δημητριακών» με τιμές, gr5< , gr5≥ .

Σε αυτή την ενότητα, θα γνωρίσουμε τους ελέγχους Χ2 που όπως θα διαπιστώσουμε, μας επιτρέπουν να κάνουμε στατιστικούς ελέγχους που αφορούν πειράματα επαναλαμβανόμενων ανεξάρτητων πολυωνυμικών δοκιμών. Έτσι, θα μπορούμε πλέον να αποφασίζουμε για τη στατιστική σημαντικότητα πειραματικών ή δειγματοληπτικών δεδομένων που αναφέρονται σε ποιοτικές μεταβλητές όπως

• «ομάδα αίματος ασθενούς» με τιμές, Α, Β, ΑΒ, Ο • «γονότυπος παιδιού» με τιμές, ΑΑ, Αα, αα • «αποτέλεσμα φαρμακευτικής αγωγής» με τιμές, θετικό, θετικό με παρενέργειες,

αρνητικό • «στάση απέναντι στην απαγόρευση του καπνίσματος σε δημόσιους χώρους» με

τιμές, πολύ αρνητική, αρνητική, αδιάφορη, θετική, πολύ θετική • «οικογενειακή κατάσταση» με τιμές, παντρεμένος/η, άγαμος/η, διαζευγμένος/η,

χήρος/α

Page 2: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 472

• «προτίμηση μεταξύ τριών υποψηφίων» με τιμές, υποψήφιος-α, υποψήφιος-β, υποψήφιος-γ, λευκό, άκυρο, αποχή

• «απάντηση σε αίτηση» με τιμές, θετική, θετική υπό προϋποθέσεις, αρνητική • «αντίδραση πειραματόζωου σε συγκεκριμένο ερέθισμα» με τιμές, πολύ επιθετική

συμπεριφορά, επιθετική συμπεριφορά, αδιάφορο • «ποιότητα παραγόμενου προϊόντος» με τιμές, αποδεκτό, β΄ διαλογής,

ελαττωματικό • «γραμμή παραγωγής προϊόντος» με τιμές, Γραμμή-1, Γραμμή-2, Γραμμή-3,

Γραμμή-4 ή σε ποσοτικές μεταβλητές των οποίων οι τιμές έχουν ταξινομηθεί σε κατηγορίες/κλάσεις, όπως

• «συστολική πίεση» με τιμές, χαμηλή, φυσιολογική, υψηλή • «δείκτης μάζας σώματος» με τιμές, λιποβαρής, φυσιολογικό βάρος,

υπέρβαρος/η, παχύσαρκος/η • «διάμετρος διατομής σωλήνα» με τιμές, εντός προδιαγραφών, μικρότερη από

την κατώτερη αποδεκτή τιμή, μεγαλύτερη από την ανώτερη αποδεκτή τιμή • «βαθμός πτυχίου» με τιμές, καλώς, λίαν καλώς, άριστα

ή σε διακριτές ποσοτικές μεταβλητές, όπως • «αριθμός παιδιών οικογένειας» με τιμές, 0, 1, 2, …, ν • «αριθμός βακτηριδίων ανά cm2 μιας πλάκας Petri» με τιμές, 0, 1, 2, …, ν • «αριθμός ελαττωματικών προϊόντων ανά παρτίδα» με τιμές, 0, 1, 2, …, ν • «αριθμός δόσεων αντιγριπικού εμβολίου που έκανε ένα άτομο» με τιμές, 0, 1, 2.

Τα δεδομένα που προκύπτουν από επαναλαμβανόμενες πολυωνυμικές δοκιμές συνοψίζονται και παρουσιάζονται σε ένα πίνακα κατανομής συχνοτήτων. Έτσι, στο παράδειγμά μας δίνεται ότι στις 64=ν επαναλήψεις, η συχνότητα εμφάνισης της τιμής τύπος Α είναι 341 =ν , η συχνότητα εμφάνισης της τιμής τύπος Β είναι

102 =ν και η συχνότητα εμφάνισης της τιμής Γ είναι 203 =ν .

Τύπος απογόνου Α Β Γ Παρατηρηθείσα

συχνότητα 34 10 20 Το ζητούμενο είναι να ελέγξουμε αν αυτές οι συχνότητες που παρατηρήθηκαν στο δείγμα, συμφωνούν με το θεωρητικό μοντέλο κληρονομικότητας, δηλαδή, αν συμφωνούν με τις αναμενόμενες, με βάση το θεωρητικό μοντέλο, συχνότητες,

361 =E , 122 =E , 163 =E , αντίστοιχα.

Αν 1p η πιθανότητα ένας απόγονος από μια τέτοια διασταύρωση να είναι τύπου Α,

2p η πιθανότητα ένας απόγονος να είναι τύπου Β και 3p η πιθανότητα ένας απόγονος να είναι τύπου Γ, τότε, σύμφωνα με το μοντέλο κληρονομικότητας, είναι

1691 =p , 1632 =p και 1643 =p . Είναι προφανές, ότι πρέπει να κάνουμε τον έλεγχο της μηδενικής υπόθεσης

169: 10 =pH και 1632 =p και 1643 =p έναντι της εναλλακτικής,

169: 11 ≠pH ή 1632 ≠p ή 1643 ≠p .

Page 3: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 473

Πρέπει, δηλαδή, να ελέγξουμε αν τα συγκεκριμένα πειραματικά δεδομένα συμφωνούν με το μοντέλο κληρονομικότητας, ή αλλιώς, αν η εμπειρική κατανομή συχνοτήτων

341 =ν , 102 =ν , 203 =ν προσαρμόζεται στη θεωρητική κατανομή συχνοτήτων

361 =E , 122 =E , 163 =E που αναμένεται/προκύπτει από την υποθετική/θεωρητική κατανομή πιθανοτήτων (θεωρητικό μοντέλο κληρονομικότητας),

1691 =p , 1632 =p , 1643 =p . Ο έλεγχος 2X με τον οποίο κάνουμε έναν τέτοιο έλεγχο υποθέσεων, ονομάζεται έλεγχος Χ2 καλής προσαρμογής. Στην ενότητα αυτή θα γνωρίσουμε, επίσης, τον έλεγχο Χ2 ανεξαρτησίας, που μας επιτρέπει να απαντάμε σε προβλήματα όπως το ακόλουθο, που αφορούν στον έλεγχο της ανεξαρτησίας δύο χαρακτηριστικών/μεταβλητών. Στο πλαίσιο της έρευνας που γίνεται για την πρόληψη της γρίπης, έγινε μια μελέτη για να ελεγχθεί η αποτελεσματικότητα ενός νέου αντιγριπικού εμβολίου το οποίο χορηγείται σε δύο δόσεις. Σε χίλιους τυχαία επιλεγμένους κατοίκους μιας περιοχής δόθηκε η δυνατότητα να κάνουν το εμβόλιο δωρεάν και εθελοντικά. Για κάθε κάτοικο, η ερευνητική ομάδα κατέγραψε πόσες δόσεις του εμβολίου έκανε (καμία, μία ή δύο) και αν αρρώστησε ή όχι από τη γρίπη.

Αριθμός δόσεων 0 1 2

Αρρώστησε 24 9 13 Ανθεκτικότητα Δεν αρρώστησε 289 100 565 Αυτά τα δεδομένα, δίνουν άραγε στατιστικά σημαντικές αποδείξεις ότι η ανθεκτικότητα των κατοίκων στον ιό της γρίπης εξαρτάται από τον αριθμό των δόσεων αντιγριπικού εμβολίου που έκαναν; Τέλος, θα δούμε πώς μπορούμε να διατυπώσουμε και να κάνουμε έναν έλεγχο Χ2 ομογένειας για να ελέγξουμε αν δύο ή περισσότεροι πληθυσμοί είναι ομογενείς ως προς κάποιο χαρακτηριστικό/μεταβλητή. Ας δούμε ένα παράδειγμα. Ταξινομήσαμε τους ενήλικες κατοίκους ( 18≥ ετών) μιας περιοχής σε πέντε ηλικιακές ομάδες, 18-24, 25-34, 35-49, 50-64 και 65≥ , και από κάθε ομάδα επιλέξαμε (με βάση ένα σχέδιο τυχαίας δειγματοληψίας), 90, 200, 310, 230 και 170 κατοίκους, αντίστοιχα. Ρωτήσαμε καθέναν από τους κατοίκους που επιλέξαμε πόσους καφέδες καταναλώνει ημερησίως, και τις απαντήσεις που πήραμε τις ταξινομήσαμε σε τρεις κατηγορίες: λιγότερους από τρεις, ακριβώς τρεις, περισσότερους από τρεις. Τα δεδομένα που προέκυψαν από τις απαντήσεις που πήραμε, φαίνονται στον πίνακα που ακολουθεί.

Ηλικιακή ομάδα 1 2 3 4 5 18-24 25-34 35-49 50-64 65≥

Λιγότερους από 3 18 50 100 60 90 Ακριβώς 3 45 80 180 100 40

Ημερήσια κατανάλωση

καφέ Περισσότερους από 3 27 70 30 70 40 90 200 310 230 170

Page 4: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 474

Με βάση τα συγκεκριμένα δεδομένα, να ελέγξετε αν οι πέντε ηλικιακές ομάδες είναι ομογενείς ως προς την ημερήσια κατανάλωση καφέ, δηλαδή, αν το ποσοστό των ενηλίκων που πίνουν λιγότερους από τρεις καφέδες ημερησίως, και αντίστοιχα, το ποσοστό των ενηλίκων που πίνουν τρεις καφέδες ημερησίως και το ποσοστό των ενηλίκων που πίνουν περισσότερους από τρεις καφέδες ημερησίως, είναι ίδιο στις πέντε ηλικιακές ομάδες. Όπως θα διαπιστώσουμε στη συνέχεια, αυτό που ελέγχεται και στις τρεις περιπτώσεις ελέγχων 2X , είναι η στατιστική σημαντικότητα των αποκλίσεων (διαφορών) μεταξύ συχνοτήτων που παρατηρήθηκαν στο δείγμα και συχνοτήτων που αναμένονται με βάση τη μηδενική υπόθεση. Δηλαδή, και στις τρεις περιπτώσεις, η λογική του ελέγχου 2X είναι ίδια. Ας δούμε όμως τώρα με μεγαλύτερη λεπτομέρεια αυτούς τους πράγματι ενδιαφέροντες, και με πολλές εφαρμογές, ελέγχους.

14.1 Έλεγχος Χ2 καλής προσαρμογής (chi-square goodness-of-fit test) Συχνά μας ενδιαφέρει να ελέγξουμε αν τα δεδομένα μας συμφωνούν ή όχι με κάποιο μοντέλο πιθανοτήτων. Για παράδειγμα,

• Τα πειραματικά δεδομένα που έχουμε στη διάθεσή μας για τέσσερα είδη απογόνων που προέκυψαν από μια διασταύρωση φυτών, συμφωνούν άραγε με το μοντέλο κληρονομικότητας του Mendel, δηλαδή, υποστηρίζουν ότι η αναλογία των τεσσάρων ειδών απογόνων είναι 9:3:3:1, ή αλλιώς, υποστηρίζουν ότι τα ποσοστά των τεσσάρων ειδών απογόνων, αντίστοιχα, είναι

1691 =p , 1632 =p , 1633 =p , 1614 =p ; • Με βάση τα δεδομένα που προέκυψαν από μια έρευνα γνώμης, οι καταναλωτές

δείχνουν την ίδια προτίμηση για τα πέντε υποψήφια ονόματα ενός νέου προϊόντος ή οι προτιμήσεις τους διαφέρουν. Δηλαδή, οι πιθανότητες με τις οποίες επιλέγονται από τους καταναλωτές τα 5 υποψήφια ονόματα περιγράφονται από το μοντέλο πιθανοτήτων

5154321 ===== ppppp ; • Τα εργαστηριακά δεδομένα που έχουμε στη διάθεσή μας για τον αριθμό

βακτηριδίων ανά cm2 μιας πλάκας Petri, υποστηρίζουν άραγε ότι ο αριθμός των βακτηριδίων ανά cm2 ακολουθεί μια κατανομή Poisson με μέσο 2 βακτηρίδια ανά cm2;

• Το τυχαίο δείγμα 28 τιμών συγκέντρωσης υδραργύρου στο συκώτι αρσενικών δελφινιών, με βάση το οποίο θέλουμε να κατασκευάσουμε ένα διάστημα εμπιστοσύνης για τη μέση συγκέντρωση υδραργύρου στο συκώτι αρσενικών δελφινιών, προέρχεται άραγε από κάποια κανονική κατανομή ή μήπως δε μπορούμε να κάνουμε μια τέτοια υπόθεση/παραδοχή;

Οι στατιστικοί έλεγχοι υποθέσεων που βοηθούν να δώσουμε μια απάντηση σε τέτοια ερωτήματα, ονομάζονται έλεγχοι καλής προσαρμογής (goodness-of-fit tests). Δηλαδή, οι έλεγχοι καλής προσαρμογής μας δίνουν τη δυνατότητα να ελέγξουμε αν μια κατανομή πιθανοτήτων συμφωνεί/προσαρμόζεται σε ένα δείγμα. Από τους πλέον γνωστούς και ευρέως χρησιμοποιούμενους είναι ο έλεγχος Χ2 καλής προσαρμογής (chi-square goodness-of-fit test) τον οποίο παρουσιάζουμε στη συνέχεια1.

1 Ένας ακόμη πολύ γνωστός και ευρέως χρησιμοποιούμενος έλεγχος καλής προσαρμογής είναι ο έλεγχος Kolmogorov-Smirnov.

Page 5: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 475

Από πιθανοθεωρητική σκοπιά, όλες οι προηγούμενες περιπτώσεις μεταβλητών,

• ποιοτικές, όπως «είδος απογόνου» ή «προτίμηση ονόματος προϊόντος», • διακριτές, όπως «αριθμός βακτηριδίων ανά cm2 μιας πλάκας Petri» και • ποσοτικές των οποίων οι τιμές ταξινομούνται σε κλάσεις, όπως «συγκέντρωση

υδραργύρου στο συκώτι δελφινιών» με τιμές που ταξινομούνται, για παράδειγμα, στις κλάσεις 180< , )270,180[ , )360,270[ και 360≥ ,

αντιμετωπίζονται με ενιαίο τρόπο ως μεταβλητές που περιγράφουν πολυωνυμικές δοκιμές με 2≥k , αμοιβαίως αποκλειόμενα, δυνατά αποτελέσματα. Επίσης, προβλήματα όπως τα προηγούμενα, που αναφέρονται σε πειραματικά δεδομένα2 τα οποία ταξινομούνται σε 2≥k ξένες μεταξύ τους κατηγορίες, krrr ,,, 21 K , είναι προφανώς προβλήματα ανεξάρτητων επαναλήψεων μιας πολυωνυμικής δοκιμής.

Ας συμβολίσουμε με ip , ki ,,2,1 K= την πιθανότητα μια παρατήρηση κατά την εκτέλεση μιας πολυωνυμικής δοκιμής να ταξινομηθεί στην κατηγορία ir . Αν οι πιθανότητες αυτές μας είναι γνωστές, τότε, όπως είδαμε στο Α΄ Μέρος, η πιθανότητα, σε ν ανεξάρτητες πολυωνυμικές δοκιμές να εμφανισθούν 1ν αποτελέσματα 1r , 2ν αποτελέσματα 2r , … και kν αποτελέσματα kr , ή αλλιώς, η πιθανότητα τα αποτελέσματα krrr ,,, 21 K να εμφανισθούν με συχνότητες kννν ,,, 21 K αντίστοιχα, μας είναι γνωστή και ίση με

kk

k

ppp ννν

νννν

KK

2121

21 !!!!⋅⋅⋅

.

Θυμηθείτε ότι αν iX ( ki ,,2,1 K= ) τυχαία μεταβλητή που εκφράζει τη συχνότητα εμφάνισης του αποτελέσματος ir σε ν ανεξάρτητες επαναλήψεις μιας πολυωνυμικής δοκιμής που έχει 2≥k δυνατά αποτελέσματα, τότε το μοντέλο πιθανοτήτων που ακολουθεί η τυχαία μεταβλητή ),,,( 21 kXXX K μας είναι γνωστό, ονομάζεται πολυωνυμική κατανομή με παραμέτρους ν , K,, 21 pp , kp και ισχύει ότι

kk

kkk pppXXXP ννν

ννννννν KK

K 2121

212211 !!!

!),,,(⋅⋅⋅

====

με νν =∑=

k

ii

1 και 1

1=∑

=

k

iip .

Ισχύει επίσης, ότι για κάθε αποτέλεσμα (ή κατηγορία) ir , η αναμενόμενη συχνότητα εμφάνισής του σε ν δοκιμές είναι iii pEXE ν==)( .

Επομένως, από τη σκοπιά της Θεωρίας Πιθανοτήτων, αν οι πιθανότητες kppp ,,, 21 K μας είναι γνωστές, τότε η πιθανότητα, σε ν ανεξάρτητες πολυωνυμικές δοκιμές να εμφανισθεί η κατανομή συχνοτήτων

),,,( 21 kννν K μας είναι γνωστή3.

2 ή δειγματοληπτικά και δημοσκοπικά δεδομένα. 3 παρότι προκύπτουν προφανείς υπολογιστικές δυσκολίες

Page 6: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 476

Από τη σκοπιά της Στατιστικής, όπου αφετηρία μας είναι το δείγμα, το αντίστοιχο ζητούμενο είναι ο έλεγχος των παραμέτρων kppp ,,, 21 K (μιας πολυωνυμικής κατανομής) με βάση ένα δείγμα που έχουμε στη διάθεσή μας. Έστω λοιπόν ότι έχουμε στη διάθεσή μας ένα δείγμα ν παρατηρήσεων από τις οποίες

1ν ταξινομούνται στην κατηγορία 1r , 2ν στην κατηγορία 2r , …, και kν στην κατηγορία kr , ή αλλιώς, έστω ότι σε ν ανεξάρτητες επαναλήψεις μιας πολυωνυμικής δοκιμής, παρατηρήσαμε ότι τα αποτελέσματα krrr ,,, 21 K εμφανίσθηκαν με συχνότητες kννν ,,, 21 K , αντίστοιχα. Τι μπορούμε άραγε να πούμε, με βάση αυτή την εμπειρική κατανομή συχνοτήτων, για τις πιθανότητες kppp ,,, 21 K εμφάνισης των αποτελεσμάτων krrr ,,, 21 K , αντίστοιχα. Προκύπτουν από κάποιο μοντέλο (κατανομή πιθανοτήτων) που υποθέτουμε (και θέτουμε ως μηδενική υπόθεση) ή μήπως ακολουθούν κάποιο άλλο μοντέλο; Το υποθετικό μοντέλο πιθανοτήτων (η κατανομή πιθανοτήτων) που θέτουμε ως μηδενική υπόθεση και θέλουμε να ελέγξουμε αν συμφωνεί/προσαρμόζεται στα πειραματικά δεδομένα που έχουμε στη διάθεσή μας, μπορεί να είναι τελείως ορισμένο, δηλαδή μπορεί να μην υπάρχουν άγνωστες παράμετροι, όπως στο παράδειγμα προηγουμένως που αναφέρεται στο μοντέλο κληρονομικότητας του Mendel όπου

1691 =p , 1632 =p , 1633 =p , 1614 =p , ή όπως στο παράδειγμα που αναφέρεται στην προτίμηση ονόματος νέου προϊόντος όπου

5154321 ===== ppppp , ή όπως στο παράδειγμα που αναφέρεται στον αριθμό βακτηριδίων (ανά cm2 μια πλάκας Petri) όπου

1353.0!0

202

1 == −ep , 2706.0!1

212

2 == −ep , 2706.0!2

222

3 == −ep , κ.ο.κ.,

όμως, μπορεί να υπάρχουν κάποιες άγνωστες παράμετροι που πρέπει να εκτιμηθούν, όπως στο παράδειγμα με τη συγκέντρωση υδραργύρου στο συκώτι δελφινιών. Στο παράδειγμα αυτό, ως μηδενική υπόθεση θέτουμε ότι η συγκέντρωση υδραργύρου ακολουθεί μια κανονική κατανομή χωρίς όμως να προσδιορίζονται οι παράμετροι της, μ και σ . Είναι προφανές, ότι για να υπολογίσουμε, υπό τη μηδενική υπόθεση, τις πιθανότητες 4321 ,,, pppp , δηλαδή, για να υπολογίσουμε τις πιθανότητες μια τιμή της συγκέντρωσης υδραργύρου να ανήκει αντίστοιχα στην κλάση 180< , )270,180[ ,

)360,270[ και 360≥ υπό την προϋπόθεση ότι η συγκέντρωση υδραργύρου ακολουθεί κανονική κατανομή, πρέπει να γνωρίζουμε τις παραμέτρους της, μ και σ . Ας διακρίνουμε λοιπόν αυτές τις δύο περιπτώσεις.

14.1.1 Δεν υπάρχουν άγνωστες παράμετροι Στην περίπτωση που δεν υπάρχουν άγνωστες παράμετροι, οι πιθανότητες

kppp ,,, 21 K εμφάνισης των αποτελεσμάτων krrr ,,, 21 K αντίστοιχα, μπορούν να προσδιορισθούν. Έτσι, κάνουμε τον έλεγχο της μηδενικής υπόθεσης

1010 : ppH = , 202 pp = , …, 0kk pp = έναντι της εναλλακτικής,

Page 7: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 477

01 : ii ppH ≠ για ένα τουλάχιστον i, ki ,,2,1 K= όπου 02010 ,,, kppp K είναι γνωστές πιθανότητες (γνωστοί αριθμοί, με 00 ≥ip για

κάθε ki ,,2,1 K= , και 11

0 =∑=

k

iip ).

Ως στατιστική συνάρτηση ελέγχου (ελεγχοσυνάρτηση) χρησιμοποιείται η στατιστική συνάρτηση Χ2 (Pearson’s chi-square test statistic) που προτάθηκε από τον Κarl Pearson το 1900, και ορίζεται από τον τύπο

∑=

−=

k

i i

ii

EEO

X1

22 )(

όπου, kOOO ,,, 21 K είναι οι παρατηρηθείσες συχνότητες (observed frequencies) των αποτελεσμάτων krrr ,,, 21 K αντίστοιχα, και kEEE ,,, 21 K είναι οι αντίστοιχες αναμενόμενες συχνότητες (expected frequencies) με βάση τη μηδενική υπόθεση, ή αλλιώς, υπό την προϋπόθεση ότι η μηδενική υπόθεση είναι αληθής, δηλαδή,

0ii pE ν= . Με την παραδοχή ότι η μηδενική υπόθεση είναι αληθής, αποδεικνύεται (δες και Παρατήρηση 14.1.2) ότι η τυχαία μεταβλητή 2X , για μεγάλα ν ακολουθεί μια 2χ κατανομή με 1−k βαθμούς ελευθερίας, δηλαδή, για μεγάλα ν , κατά προσέγγιση έχουμε

21

2 ~ −kX χ . Για να διασφαλίζεται ότι το μέγεθος του δείγματος ν (ο αριθμός επαναλήψεων) είναι αρκετά μεγάλο ώστε η προσέγγιση αυτή να είναι ικανοποιητική, πρέπει όλες οι αναμενόμενες συχνότητες να είναι μεγαλύτερες ή ίσες του 5, δηλαδή, πρέπει

50 ≥= ii pE ν , για κάθε ki ,,2,1 K= . Ο κανόνας αυτός είναι αρκετά συντηρητικός/αυστηρός, με την έννοια ότι έχει προταθεί και ο εξής λιγότερο αυστηρός4: η προσέγγιση της 2X από την 2

1−kχ μπορεί να θεωρηθεί ικανοποιητική αν όλες οι αναμενόμενες συχνότητες είναι μεγαλύτερες του 1, δηλαδή, αν 10 >= ii pE ν για κάθε ki ,,2,1 K= , και μικρότερες του 5 είναι το πολύ 20% από αυτές. Για τη συνέχεια, προκειμένου να υπάρχει μεγαλύτερη ασφάλεια στη χρήση αυτής της προσέγγισης, υιοθετούμε τον πρώτο κανόνα/περιορισμό, δηλαδή απαιτούμε

50 ≥= ii pE ν για κάθε i.

Παρατηρείστε ότι η ελεγχοσυνάρτηση 2X , ποσοτικοποιεί (με ορισμένο τρόπο) τις αποκλίσεις (διαφορές) μεταξύ παρατηρηθέντων και αναμενόμενων συχνοτήτων. Όταν οι αποκλίσεις αυτές (ή κάποιες από αυτές) είναι μεγάλες, τότε και η 2X παίρνει μεγάλες τιμές. Έτσι, είναι λογικό, η μηδενική υπόθεση να απορρίπτεται για μεγάλες τιμές της 2X . Πράγματι, σύμφωνα με τον έλεγχο 2X καλής προσαρμογής, έχουμε:

4 Προτάθηκε από τον Cochran.

Page 8: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 478

Σε επίπεδο σημαντικότητας α , η μηδενική υπόθεση 1010 : ppH = , 202 pp = , …, 0kk pp =

απορρίπτεται έναντι της εναλλακτικής 01 : ii ppH ≠ για ένα τουλάχιστον i, ki ,,2,1 K=

αν 2

;11

22 )(

αχ −=

≥−

=∑ k

k

i i

ii

EEO

X

και εφόσον 50 ≥= ii pE ν , για κάθε ki ,,2,1 K= .

Η κρίσιμη τιμή, 2;1 αχ −k , του ελέγχου, είναι το άνω α -ποσοστιαίο σημείο της 2χ

κατανομής με 1−k βαθμούς ελευθερίας, δηλαδή, με τόσους βαθμούς ελευθερίας, όσες οι διαφορετικές κατηγορίες μειωμένες κατά 1. Αν δεν είναι όλες οι αναμενόμενες συχνότητες μεγαλύτερες ή ίσες του 5, δηλαδή, αν για κάποιο ή κάποια i, είναι 50 <= ii pE ν , τότε κάνουμε κατάλληλη σύμπτυξη των κατηγοριών.

Σημείωση 14.1.1: Είναι προφανές ότι iiO ν≡ . Δηλαδή, μια συγκεκριμένη πραγματοποίηση της τυχαίας μεταβλητής iX (που εκφράζει τη συχνότητα εμφάνισης του αποτελέσματος ir σε ν ανεξάρτητες επαναλήψεις), στο εξής θα τη συμβολίζουμε με

iO . Έτσι, τις παρατηρηθείσες συχνότητες, αντί με kννν ,,, 21 K που τις συμβολίζαμε μέχρι τώρα, στο εξής (για να αντιδιαστέλλονται καλύτερα από τις αναμενόμενες), θα τις συμβολίζουμε με kOOO ,,, 21 K . Στην ελληνική βιβλιογραφία, πολύ συχνά οι παρατηρηθείσες συχνότητες συμβολίζονται με iπ και οι αναμενόμενες με iθ , όμως προτιμήσαμε τον επικρατέστερο διεθνή συμβολισμό που είναι iO και iE , αντίστοιχα.

Επίσης, διευκρινίζουμε ότι λέγοντας τυχαία μεταβλητή 2X , εννοούμε την τυχαία μεταβλητή

( )∑=

−=

k

i i

ii

ppX

X1

22

νν

.

Η ποσότητα

∑=

−k

i i

ii

EEO

1

2)(

συνηθίζεται, βέβαια, να συμβολίζεται επίσης με 2X , όμως δεν είναι τυχαία μεταβλητή αλλά συγκεκριμένη πραγματοποίηση της

( )∑=

−k

i i

ii

ppX

1

2

νν

.

Ας δούμε τώρα πάλι το πρώτο εισαγωγικό παράδειγμα. Παράδειγμα 14.1: Σύμφωνα με ένα μοντέλο κληρονομικότητας, οι τρεις τύποι απογόνων, Α, Β και Γ, που προκύπτουν από διασταύρωση ορισμένου είδους πειραματόζωων, πρέπει να βρίσκονται σε αναλογία 9:3:4, αντίστοιχα. Σε ένα σχετικό πείραμα, από 64 απογόνους που προέκυψαν, 34 βρέθηκαν να είναι τύπου A, 10 τύπου

Page 9: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 479

B, τα 20 τύπου Γ. Σε επίπεδο σημαντικότητας 1%, αυτά τα πειραματικά δεδομένα δίνουν άραγε σημαντικές αποδείξεις εναντίον του μοντέλου κληρονομικότητας;

Απάντηση: Όπως εξηγήσαμε στα προηγούμενα, αν 1p η πιθανότητα ο απόγονος να είναι τύπου Α, 2p η πιθανότητα να είναι «τύπος Β» και 3p να είναι «τύπος Γ» πρέπει, με βάση τα συγκεκριμένα πειραματικά δεδομένα, να ελέγξουμε σε επίπεδο σημαντικότητας 01.0=α , τη μηδενική υπόθεση,

169: 10 =pH και 1632 =p και 1643 =p έναντι της εναλλακτικής,

169: 11 ≠pH ή 1632 ≠p ή 1643 ≠p . Στον πίνακα που ακολουθεί, φαίνεται για κάθε τύπο απογόνου η παρατηρηθείσα συχνότητα, iO , δηλαδή, πόσες φορές σε 64 επαναλήψεις, εμφανίσθηκε καθένας από τους τρεις τύπους, καθώς και η αντίστοιχη αναμενόμενη συχνότητα

3,2,1,64 0 =⋅= ipE ii δηλαδή, πόσες φορές αναμένεται να εμφανισθεί σε 64 επαναλήψεις καθένας από του τρεις τύπους απογόνων αν θεωρήσουμε ότι η 0H είναι αληθής.

Τύπος απογόνου Α Β Γ Σύνολα iO 34 10 20 64

0ip 9/16 3/16 4/16 1.00

064 ii pE ⋅= 36 12 16 64

Επειδή για καθένα από τα τρία δυνατά αποτελέσματα, δηλαδή, για κάθε 3,2,1=i είναι 564 0 ≥⋅= ii pE , μπορούμε να κάνουμε έλεγχο 2X καλής προσαρμογής. Έτσι, έχουμε

=−

= ∑=

3

1

22 )(

i i

ii

EEO

X 44.116

)1620(12

)1210(36

)3634( 222

=−

+−

+− .

Η απορριπτική περιοχή του ελέγχου ορίζεται από την ανισότητα

201.0;13

3

1

22 )(

−=

>−

= ∑ χi i

ii

EEO

X ή 21.9)(3

1

22 >

−= ∑

=i i

ii

EEO

X

και επειδή η τιμή της στατιστικής συνάρτησης ελέγχου δεν ανήκει σε αυτήν, δηλαδή η τιμή 1.44 δεν είναι μεγαλύτερη της κρίσιμης τιμής 21.92

01.0;2 =χ (που παίρνουμε

από τον πίνακα της 2χ κατανομής για 2131 =−=−k βαθμούς ελευθερίας και 01.0=α ), η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 0.01 δεν απορρίπτεται

και επομένως τα (συγκεκριμένα) πειραματικά δεδομένα, σε επίπεδο σημαντικότητας 0.01, δε δίνουν στατιστικά σημαντικές αποδείξεις εναντίον του μοντέλου κληρονομικότητας. Ας δούμε ένα ακόμη παράδειγμα. Παράδειγμα 14.2: Ένα νέο φάρμακο για την αντιμετώπιση της υπέρτασης δίνεται πειραματικά σε 200 άτομα που πάσχουν από υπέρταση. Το αποτέλεσμα της φαρμακευτικής αγωγής για κάθε ασθενή ταξινομείται σε μια από τέσσερις κατηγορίες:

Α: Βαθμιαία μείωση Β: Μέτρια μείωση Γ: Μικρή μείωση Δ: Μικρή αύξηση.

Page 10: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 480

Οι συχνότητες των τεσσάρων κατηγοριών αποτελεσμάτων που παρατηρήθηκαν στα 200 άτομα φαίνονται στον πίνακα που ακολουθεί.

Αποτέλεσμα Α Β Γ Δ Παρατηρηθείσα Συχνότητα 120 50 20 10

Από σχετικές μελέτες είναι γνωστό ότι ένα αντίστοιχο φάρμακο που ήδη κυκλοφορεί και χρησιμοποιείται, δίνει τα εξής (ανά κατηγορία) αποτελέσματα: Α:50%, Β:30%, Γ:19% και Δ:1%. Σε επίπεδο σημαντικότητας 0.05, δίνουν αυτά τα πειραματικά δεδομένα στατιστικά σημαντικές αποδείξεις ότι το νέο φάρμακο διαφέρει ως προς την αποτελεσματικότητά του από το φάρμακο που ήδη κυκλοφορεί; Απάντηση: Για κάθε ασθενή, το αποτέλεσμα της θεραπευτικής αγωγής ταξινομείται σε (ακριβώς) μια από τις τέσσερις κατηγορίες Α, Β, Γ, Δ. Πρόκειται επομένως για ένα πείραμα 200=ν ανεξάρτητων πολυωνυμικών δοκιμών με 4=k δυνατά αποτελέσματα η καθεμία. Έστω 1p η πιθανότητα το αποτέλεσμα να είναι Α, 2p να είναι Β, 3p να είναι Γ και 4p να είναι Δ. Με βάση τα (συγκεκριμένα) πειραματικά δεδομένα, θα ελέγξουμε σε επίπεδο σημαντικότητας 05.0=α , τη μηδενική υπόθεση,

50.0: 10 =pH και 30.02 =p και 19.03 =p και 01.04 =p έναντι της εναλλακτικής

:1H 05.01 ≠p ή 30.02 ≠p ή 19.03 ≠p ή 01.04 ≠p . Στον πίνακα που ακολουθεί φαίνεται για κάθε κατηγορία αποτελεσμάτων η παρατηρηθείσα συχνότητα, iO , δηλαδή, πόσες φορές στις 200 επαναλήψεις, εμφανίσθηκε κάθε μια από τις τέσσερις κατηγορίες, καθώς και η αντίστοιχη αναμενόμενη συχνότητα

4,3,2,1,200 0 =⋅= ipE ii δηλαδή, πόσες φορές αναμένεται να εμφανισθεί σε 200 επαναλήψεις κάθε μια από τις τέσσερις κατηγορίες αποτελεσμάτων αν θεωρήσουμε ότι η 0H είναι αληθής.

Αποτέλεσμα της φαρμακευτικής αγωγής Α Β Γ Δ Σύνολα

iO 120 50 20 10 200

0ip 0.50 0.30 0.19 0.01 1.00

0200 ii pE ⋅= 100 60 38 2 200

Επειδή 5201.02004 <=⋅=E , συμπτύσσουμε την κατηγορία «Δ» με την κατηγορία «Γ» σε μια, στην κατηγορία «Γ ή Δ» με 3010203 =+=O και 402383 =+=E .

Αποτέλεσμα της φαρμακευτικής αγωγής Α Β Γ ή Δ Σύνολα

iO 120 50 30 200

0200 ii pE ⋅= 100 60 40 200

Page 11: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 481

Επειδή πλέον για κάθε κατηγορία 3,2,1=i είναι 5≥iE , μπορούμε να κάνουμε έλεγχο 2X καλής προσαρμογής. Έτσι, έχουμε

( ) ( ) ( ) ( ) 17.840

403060

6050100

100120 2224

1

22 =

−+

−+

−=

−= ∑

=i i

ii

EEOX .

Η απορριπτική περιοχή του ελέγχου ορίζεται από την ανισότητα ( ) 99.52

05.0;13

4

1

22 =>

−= −

=∑ χi i

ii

EEOX

και επειδή 99.517.8 > , δηλαδή, επειδή η τιμή της στατιστικής συνάρτησης ελέγχου ανήκει στην απορριπτική περιοχή, η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 0.05 απορρίπτεται. Επομένως, τα συγκεκριμένα πειραματικά δεδομένα, δίνουν στατιστικά σημαντικές αποδείξεις ότι η αποτελεσματικότητα του νέου φαρμάκου διαφέρει από την αποτελεσματικότητα του φαρμάκου που ήδη κυκλοφορεί. Η πιθανότητα το συμπέρασμα αυτό να είναι λάθος, είναι το πολύ 0.05.

Επισήμανση: Οι βαθμοί ελευθερίας της κρίσιμης τιμής, 205.0;2χ , είναι 213 =− γιατί

μετά τη σύμπτυξη οι κατηγορίες πλέον είναι 3 και όχι 4 που ήταν πριν τη σύμπτυξη. Παρατήρηση 14.1.1: Εύκολα αποδεικνύεται ότι

( )ν−=

−= ∑∑

==

k

i i

ik

i i

ii

EO

EEO

X1

2

1

22 .

Πράγματι, ( )

=+−=+−

=−

= ∑∑∑∑∑=====

k

ii

k

ii

k

i i

ik

i i

iiiik

i i

ii EOEO

EEEOO

EEO

X111

2

1

22

1

22 2

2

ννν −=+−= ∑∑==

k

i i

ik

i i

i

EO

EO

1

2

1

2

2 .

Έτσι, για τα δεδομένα του Παραδείγματος 14.1 έχουμε

44.1641620

1210

3634 222

1

22 =−++=−= ∑

=

νk

i i

i

EO

X .

Αρκετά συχνά, αυτή η έκφραση προτιμάται ως πιο εύχρηστη. Παράδειγμα 14.3: (Συνέχεια του Σχολίου 5.3.1). Από τα αρχεία της Επιθεώρησης Εργασίας καταγράφηκε ο αριθμός εργατικών ατυχημάτων που συνέβησαν ανά ημέρα σε μια (συγκεκριμένη) βιομηχανική ζώνη τα έξι περίπου τελευταία χρόνια (1500 εργάσιμες ημέρες). Τα αποτελέσματα αυτής της καταγραφής φαίνονται στον πίνακα που ακολουθεί. Αριθμός ατυχημάτων σε μια ημέρα 0 1 2 3 4 5

Παρατηρηθείσα συχνότητα 549 555 273 93 24 6 1500 Έστω Υ η τυχαία μεταβλητή που εκφράζει τον αριθμό εργατικών ατυχημάτων που συμβαίνουν σε μια ημέρα στη συγκεκριμένη βιομηχανική ζώνη. Στο Σχόλιο 5.3.1, είχαμε ισχυρισθεί ότι οι πιθανότητες που προκύπτουν για της τιμές της Υ από τα παραπάνω δεδομένα, περιγράφονται πολύ ικανοποιητικά από την κατανομή Poisson με 1=λ . Ας δούμε τώρα πώς μπορούμε να ελέγξουμε αυτόν τον ισχυρισμό.

Page 12: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 482

Θα κάνουμε, σε επίπεδο σημαντικότητας 05.0=α τον έλεγχο της μηδενικής υπόθεσης

:0H Η τυχαία μεταβλητή Υ ακολουθεί την κατανομή Poisson με 1=λ έναντι της εναλλακτικής,

:1H Η τυχαία μεταβλητή Υ δεν ακολουθεί την κατανομή Poisson με 1=λ . Παρότι η Υ είναι ποσοτική/διακριτή και όχι ποιοτική/κατηγορίας, εντούτοις μπορούμε να εφαρμόσουμε έλεγχο 2X καλής προσαρμογής αν δούμε τις τιμές της ως διαφορετικές «κατηγορίες». Πράγματι, για κάθε τιμή της Υ που εμφανίσθηκε στις 1500 επαναλήψεις, γνωρίζουμε την παρατηρηθείσα συχνότητά της, iO , δηλαδή, γνωρίζουμε πόσες φορές εμφανίσθηκε και επίσης, μπορούμε να υπολογίσουμε τις αντίστοιχες αναμενόμενες συχνότητες

6,5,4,3,2,1,1500 0 =⋅= ipE ii δηλαδή, πόσες φορές αναμένεται να εμφανισθεί σε 1500 επαναλήψεις κάθε μια από τις τιμές 0, 1, 2, 3, 4 και 5 της Υ, αν θεωρήσουμε ότι η Υ ακολουθεί την κατανομή Poisson με 1=λ . Έτσι, αν θεωρήσουμε ότι η Υ ακολουθεί την κατανομή Poisson με 1=λ , έχουμε

3679.0!0

1)0(0

110 ==== −eYPp , 3679.0

!11)1(

11

20 ==== −eYPp

1839.0!2

1)2(2

130 ==== −eYPp , 0613.0

!31)3(

31

40 ==== −eYPp

0153.0!4

1)4(4

150 ==== −eYPp , 0031.0

!51)5(

51

60 ==== −eYPp . Στον πίνακα που ακολουθεί φαίνεται για κάθε τιμή της Υ η παρατηρηθείσα συχνότητα iO (που καταγράφηκε από τα αρχεία) και η αναμενόμενη συχνότητα iE (που υπολογίσαμε με την υπόθεση ότι η 0H είναι αληθής). Επίσης, στον πίνακα φαίνεται και μια έβδομη «κατηγορία» που δημιουργήσαμε, η οποία περιλαμβάνει τις μεγαλύτερες του 5 τιμές της Υ. Η κατηγορία αυτή έχει παρατηρηθείσα συχνότητα

07 =O (αφού στις 1500 επαναλήψεις δεν εμφανίσθηκε τιμή της Υ μεγαλύτερη του 5) και 0006.0)5(1)5(70 =≤−=>= YPYPp .

0 1 2 3 4 5 5> Σύνολα

iO 549 555 273 93 24 6 0 1500

0ip 0.3679 0.3679 0.1839 0.0613 0.0153 0.0031 0.0006 1.0000

01500 ii pE ⋅= 551.85 551.85 275.85 91.95 22.95 4.65 0.9 1500 Επειδή για την τιμή 5 και για τις τιμές που είναι μεγαλύτερες του 5, η αναμενόμενη συχνότητα αντίστοιχα είναι 565.46 <=E και 59.07 <=E , συμπτύσσουμε τις αντίστοιχες «κατηγορίες» σε μία με 6066 =+=O και 55.59.065.46 =+=E .

0 1 2 3 4 5≥ Σύνολα

iO 549 555 273 93 24 6 1500

01500 ii pE ⋅= 551.85 551.85 275.85 91.95 22.95 5.55 1500

Page 13: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 483

Επειδή πλέον για κάθε κατηγορία 6,5,4,3,2,1=i είναι 5≥iE μπορούμε να κάνουμε έλεγχο 2X καλής προσαρμογής. Έτσι, έχουμε

( ) ( ) ( ) ( ) 16.055.555.56

85.55185.551555

85.55185.551549 2226

1

22 =

−++

−+

−=

−= ∑

=

Ki i

ii

EEO

X .

Η απορριπτική περιοχή του ελέγχου ορίζεται από την ανισότητα

( )07.112

05.0;16

6

1

22 =>

−= −

=∑ χi i

ii

EEO

X

και επειδή η τιμή της στατιστικής συνάρτησης ελέγχου δεν ανήκει σε αυτήν, δηλαδή επειδή η τιμή 0.16 δεν είναι μεγαλύτερη της κρίσιμης τιμής 07.112

05.0;5 =χ (που

παίρνουμε από τον πίνακα της 2χ κατανομής για 5161 =−=−k βαθμούς ελευθερίας και 05.0=α ), η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 0.05 δεν απορρίπτεται και επομένως τα (συγκεκριμένα) δεδομένα, σε επίπεδο σημαντικότητας 0.05, δε δίνουν στατιστικά σημαντικές αποδείξεις ότι πρέπει να απορριφθεί η ιδέα ότι η τυχαία μεταβλητή Υ ακολουθεί την κατανομή Poisson με 1=λ , ή αλλιώς, σε επίπεδο σημαντικότητας 0.05, δεν απορρίπτεται η ιδέα ότι η κατανομή Poisson με

1=λ προσαρμόζεται στα συγκεκριμένα δεδομένα. 14.1.2 Υπάρχουν άγνωστες παράμετροι Στα προηγούμενα θεωρήσαμε ότι οι πιθανότητες υπό τη μηδενική υπόθεση (δηλαδή, οι 0ip , ki ,,2,1 K= ), είναι όλες γνωστές (δίνονται ή υπολογίζονται), και έτσι μπορούμε να υπολογίσουμε τις αναμενόμενες (υπό τη μηδενική υπόθεση) συχνότητες

0ii pE ν= . Μπορεί όμως, για την υποθετική θεωρητική κατανομή που ελέγχουμε, κάποιες παράμετροι να μας είναι άγνωστες. Δηλαδή, για παράδειγμα, μπορεί να ελέγχουμε την υπόθεση ότι τα δεδομένα προέρχονται από κάποια κατανομή Poisson με παράμετρο λ άγνωστη ή ότι προέρχονται από κάποια κανονική κατανομή με τις παραμέτρους μ και σ άγνωστες (ή με μία από τις δύο άγνωστες). Στην περίπτωση αυτή, πρώτα εκτιμάμε τις άγνωστες παραμέτρους από το δείγμα και στη συνέχεια εκτιμάμε τις 0ip , ki ,,2,1 K= , με τις 0ˆ ip που υπολογίζουμε χρησιμοποιώντας τις εκτιμήσεις των παραμέτρων. Έτσι, για κάθε ki ,,2,1 K= , μπορούμε να εκτιμήσουμε την αναμενόμενη συχνότητα με την

0ˆ ii pE ν=)

. Εύλογα, ως στατιστική συνάρτηση ελέγχου χρησιμοποιούμε πλέον την

( )∑=

−=

4

1

22

ˆˆ

i i

ii

EEO

X .

Αποδεικνύεται ότι η τυχαία μεταβλητή 2X , για μεγάλα ν , ακολουθεί μια 2χ κατανομή με mk −−1 βαθμούς ελευθερίας, δηλαδή, για μεγάλα ν , κατά προσέγγιση έχουμε

21

2 ~ mkX −−χ , όπου m, o αριθμός των εκτιμώμενων παραμέτρων. Η προσέγγιση αυτή είναι ικανοποιητική αν 5ˆˆ

0 ≥= ii pE ν , για κάθε ki ,,2,1 K= . Έτσι:

Page 14: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 484

Σε επίπεδο σημαντικότητας α , η απορριπτική περιοχή της μηδενικής υπόθεσης τώρα ορίζεται από την ανισότητα

2;1

1

22

ˆ)ˆ(

αχ mk

k

i i

ii

EEO

X −−=

≥−

= ∑

και εφόσον, 5ˆˆ0 ≥= ii pE ν , για κάθε ki ,,2,1 K= .

Αν παραβιάζεται αυτός ο περιορισμός, δηλαδή αν τουλάχιστον μία από τις αναμενόμενες συχνότητες έχει τιμή μικρότερη του 5, τότε κάνουμε όπως και στα προηγούμενα, κατάλληλη σύμπτυξη των αρχικών κατηγοριών. Ας δούμε όμως με ένα παράδειγμα, πώς εφαρμόζονται όλα αυτά. Έτσι θα αποσαφηνισθούν και θα διευκρινισθούν καλύτερα. Παράδειγμα 14.4: Στη στατιστική συμπερασματολογία, όπως ήδη διαπιστώσαμε όταν μιλήσαμε για την κατασκευή διαστημάτων εμπιστοσύνης και για τους στατιστικούς ελέγχους υποθέσεων, μας ενδιαφέρει να μπορούμε να αποφασίσουμε αν ένα δείγμα προέρχεται από κανονικό πληθυσμό. Ας δούμε πώς μπορούμε να εφαρμόσουμε τον έλεγχο 2X καλής προσαρμογής για το σκοπό αυτό. Θα χρησιμοποιήσουμε τα δεδομένα του Προβλήματος 9.18 (από την Περιγραφική Στατιστική). Δίνεται ένα τυχαίο δείγμα 28 μετρήσεων της συγκέντρωσης υδραργύρου στο συκώτι αρσενικών δελφινιών (σε microgr/gr).

1.70 101 168 481 252 278 397 1.72 85.40 218 485 329 286 209 8.80 118 180 221 316 315 314 5.90 183 264 406 445 241 318

Μπορούμε άραγε να ισχυρισθούμε ότι το δείγμα αυτό προέρχεται από κάποια κανονική κατανομή; Απάντηση: Έστω Υ τυχαία μεταβλητή που εκφράζει τη συγκέντρωση υδραργύρου στο συκώτι αρσενικών δελφινιών. Παρότι η Υ είναι ποσοτική και όχι ποιοτική/κατηγορίας μεταβλητή, εντούτοις μπορούμε να εφαρμόσουμε έλεγχο 2X καλής προσαρμογής αν ταξινομήσουμε τις τιμές της σε έναν αριθμό κλάσεων που ορίζουμε. Στον πίνακα που ακολουθεί φαίνονται 6 κλάσεις πλάτους 90microgr/gr η κάθε μια (εκτός από την πρώτη και την τελευταία που εκτείνονται έως το ∞ ) στις οποίες έχουν ταξινομηθεί οι 28 τιμές της Υ. Επίσης φαίνεται η παρατηρηθείσα συχνότητα iO κάθε κλάσης, δηλαδή πόσες τιμές ταξινομήθηκαν σε κάθε κλάση.

x )90,(−∞ )180,90[ )270,180[ )360,270[ )450,360[ ),450[ ∞+ Σύνολο

iO 5 3 8 7 3 2 28

Θα κάνουμε, σε επίπεδο σημαντικότητας 05.0=α , τον έλεγχο της μηδενικής υπόθεσης

:0H Η τυχαία μεταβλητή Υ ακολουθεί μια κανονική κατανομή έναντι της εναλλακτικής,

:1H Η τυχαία μεταβλητή Υ δεν ακολουθεί κάποια κανονική κατανομή.

Για να υπολογίσουμε για κάθε κλάση τιμών 6,5,4,3,2,1=i , την αναμενόμενη συχνότητα 028 ii pE ⋅= , πρέπει, για κάθε κλάση i, να υπολογίσουμε την αντίστοιχη

Page 15: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 485

πιθανότητα να πάρει η Υ τιμή στην κλάση i, με την υπόθεση ότι η 0H είναι αληθής, δηλαδή με την υπόθεση ότι ),(~ 2σμNY . Όμως, δε γνωρίζουμε τις τιμές των παραμέτρων μ και σ γι’ αυτό θα τις εκτιμήσουμε από το δείγμα.

Από τα δεδομένα του δείγματος, εύκολα βρίσκουμε ότι 7.236=y microgr/gr και 6.141=s microgr/gr.

Έτσι, υποθέτοντας ότι )6.141,7.236(~ 2NY , μπορούμε πλέον να εκτιμήσουμε τις πιθανότητες 0ip . Πράγματι έχουμε

1492.0)04.1()04.1()6.141

7.236906.141

7.236()90(10 =−Φ=−<=−

<−

=<= ZPYPYPp)

1954.0)6.141

7.2361806.141

7.2366.141

7.23690()18090(20 ==−

<−

≤−

=<≤= K) YPYPp

2502.0)6.141

7.2362706.141

7.2366.141

7.236180()270180(30 ==−

<−

≤−

=<≤= K) YPYPp

2130.0)6.141

7.2363606.141

7.2366.141

7.236270()360270(40 ==−

<−

≤−

=<≤= K) YPYPp

1267.0)6.141

7.2364506.141

7.2366.141

7.236360()450360(50 ==−

<−

≤−

=<≤= K) YPYPp

=++++−=<−=≥= )(1)450(1)450( 504030201060 pppppyPYPp ))))))

0655.09345.01 =−= . Στον πίνακα που ακολουθεί για κάθε κλάση i φαίνονται η παρατηρηθείσα συχνότητα

iO και η αντίστοιχη εκτιμώμενη αναμενόμενη συχνότητα 0ˆ28 ii pE ⋅=)

.

y )90,(−∞ )180,90[ )270,180[ )360,270[ )450,360[ ),450[ ∞+ Σύνολα

iO 5 3 8 7 3 2 28

0ip) 0.1492 0.1954 0.2502 0.2130 0.1267 0.0655 1.00

0ˆ28 ii pE ⋅=)

4.1776 5.4712 7.0056 5.9640 3.5476 1.8340 28

Επειδή για την κλάση )90,(−∞ η (εκτιμώμενη) αναμενόμενη συχνότητα είναι 51776.4ˆ

1 <=E , τη συμπτύσσουμε με τη γειτονική της )180,90[ σε μία, την )180,(−∞ , με 8351 =+=O και 6488.94712.51776.4ˆ

1 =+=E . Επίσης, επειδή για την κλάση )450,360[ και την κλάση ),450[ ∞+ η (εκτιμώμενη) αναμενόμενη συχνότητα αντίστοιχα είναι 5546.3ˆ

5 <=E και 58340.1ˆ6 <=E , τις συμπτύσσουμε

επίσης σε μία, την ),360[ ∞+ , με 5234 =+=O και 3816.58340.1546.3ˆ4 =+=E .

y )180,(−∞ )270,180[ )360,270[ ),360[ ∞+ Σύνολα

iO 8 8 7 5 28

iE)

9.6488 7.0056 5.9640 5.3816 28

Επειδή πλέον για κάθε κατηγορία 4,3,2,1=i είναι 5ˆ ≥iE μπορούμε να κάνουμε έλεγχο 2X καλής προσαρμογής. Έτσι, έχουμε

Page 16: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 486

( )=

−= ∑

=

4

1

22

ˆˆ

i i

ii

EEO

X

( ) ( ) ( ) ( ) 6299.03816.53816.55

9640.59640.57

0056.70056.78

6488.96488.98 2222

=−

+−

+−

+−

= . Η απορριπτική περιοχή του ελέγχου ορίζεται από την ανισότητα

( )84.3ˆ

ˆ2

05.0;214

4

1

22 =>

−= −−

=∑ χi i

ii

EEO

X

και επειδή η τιμή της στατιστικής συνάρτησης ελέγχου δεν ανήκει σε αυτήν, δηλαδή επειδή η τιμή 0.6299 δεν είναι μεγαλύτερη της κρίσιμης τιμής 84.32

05.0;1 =χ (που

παίρνουμε από τον πίνακα της 2χ κατανομής για 12141 =−−=−− mk βαθμό ελευθερίας και 05.0=α ), η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 0.05 δεν απορρίπτεται και επομένως τα (συγκεκριμένα) δεδομένα, σε επίπεδο σημαντικότητας 0.05, δε δίνουν στατιστικά σημαντικές αποδείξεις ότι πρέπει να απορριφθεί η ιδέα ότι

)6.141,7.236(~ 2NY , ή αλλιώς, σε επίπεδο σημαντικότητας 0.05, δεν απορρίπτεται η ιδέα ότι η )6.141,7.236( 2N προσαρμόζεται στα δεδομένα.

Σημείωση 14.1.1: Παρότι, όπως ήδη διαπιστώσαμε, ο έλεγχος 2X καλής προσαρμογής εφαρμόζεται και για συνεχείς τυχαίες μεταβλητές, εντούτοις, στην περίπτωση συνεχών μεταβλητών συνήθως προτιμάται ο έλεγχος Kolmogorov-Smirnov. Αυτό συμβαίνει γιατί για να εφαρμοσθεί ο έλεγχος 2X σε συνεχείς μεταβλητές, απαιτείται όπως είδαμε η ομαδοποίηση των δεδομένων με συνέπεια να χάνεται πληροφορία, ενώ στον έλεγχο Kolmogorov-Smirnov στη σύγκριση συμμετέχουν αυτά καθαυτά τα δεδομένα και όχι κλάσεις στις οποίες κατανέμονται. Επίσης, όταν το δείγμα είναι μικρό, ο έλεγχος 2X ενδεχομένως και να μην μπορεί να εφαρμοσθεί, ενώ ο έλεγχος Kolmogorov-Smirnov σε αυτές τις περιπτώσεις είναι πιο ισχυρός έλεγχος.

Παρατήρηση 14.1.2: Ας δούμε πώς μπορούμε, για 2=k , να αποδείξουμε ότι για μεγάλα ν , κατά προσέγγιση

( ) 21

1

22 ~ −

=∑ −

= k

k

i i

ii

ppX

X χνν

.

Θα διαπιστώσουμε ότι πρόκειται για μια απλή απόδειξη5.

Υπενθυμίζουμε ότι με iX έχουμε συμβολίσει την τυχαία μεταβλητή που εκφράζει τη συχνότητα εμφάνισης του αποτελέσματος ir σε ν ανεξάρτητες επαναλήψεις μιας πολυωνυμικής δοκιμής με 2≥k δυνατά αποτελέσματα6 και με ip την πιθανότητα το αποτέλεσμα σε μια δοκιμή να είναι ir , ki ,,2,1 K= . Αν 2=k , τα δυνατά αποτελέσματα σε κάθε δοκιμή είναι δύο (πρόκειται για δοκιμές Bernoulli). Έτσι, ν=+ 21 XX και επομένως 12 XX −=ν . Επίσης, 12 1 pp −= . Έτσι, έχουμε

5 Για 2>k δε θα κάνουμε την απόδειξη. Σκοπός μας είναι, από την απόδειξη αυτή να πάρουμε μόνο μια «γεύση» ώστε να μη φαντάζουν ... «βουνό» οι αποδείξεις θεωρητικών αποτελεσμάτων! 6 Μια συγκεκριμένη πραγματοποίηση της τυχαίας μεταβλητής iX , τη συμβολίζουμε με iO .

Page 17: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 487

( )=

−+

−=

−= ∑

= 2

222

1

211

2

1

22 )()(

ppX

ppX

ppX

Xi i

ii

νν

νν

νν

=−

−−−+

−=

)1()]1([)(

1

211

1

211

ppX

ppX

ννν

νν

=−

+−+−−=

)1()()1()(

11

12

1112

11

ppppXppX

ννν

2

11

11

11

211

)1()1()(

⎟⎟⎠

⎞⎜⎜⎝

−=

−−

=pp

pXpp

pXν

νν

ν .

Επειδή προφανώς, ),(~ 11 pBX ν , από το οριακό θεώρημα De Moivre-Laplace για μεγάλα ν , κατά προσέγγιση, έχουμε

)1,0(~)1( 11

11 Npp

pX−

νν

.

Δείξαμε δηλαδή, ότι για μεγάλα ν , κατά προσέγγιση είναι

2

2

11

112

)1(Z

pppXX =⎟

⎟⎠

⎞⎜⎜⎝

−=

νν

και επομένως, 21

22 ~ χZX = . (Θυμηθείτε ότι η χι-τετράγωνο κατανομή με n βαθμούς ελευθερίας ορίζεται ως άθροισμα τετραγώνων n ανεξάρτητων τυποποιημένων κανονικών κατανομών, δηλαδή, αν niNZi ,,2,1),1,0(~ K= τότε 222

22

1 ~ nnZZZ χK++ ). Παρατήρηση 14.1.3: Στην περίπτωση που το πείραμα που μελετάμε αποτελείται από ν ανεξάρτητες πολυωνυμικές δοκιμές με 2=k δυνατά αποτελέσματα η κάθε μια, τότε ο έλεγχος της μηδενικής υπόθεσης

1010 : ppH = και 202 pp = έναντι της εναλλακτικής

1011 : ppH ≠ ή 202 pp ≠ είναι προφανώς ένας έλεγχος διωνυμικού ποσοστού

010 : ppH =

011 : ppH ≠ που γνωρίσαμε στην Ενότητα 12. Έτσι, αν λάβουμε υπόψη και την απόδειξη που δώσαμε στην Παρατήρηση 14.1.2 (όπου δείξαμε ότι για μεγάλα ν , κατά προσέγγιση είναι 22 ZX = ) είναι λογικό να περιμένουμε ότι στην περίπτωση που είναι 2=k , ο έλεγχος 2X καλής προσαρμογής είναι ισοδύναμος με τον Ζ έλεγχο για διωνυμικό ποσοστό, δηλαδή περιμένουμε οι δύο αυτοί έλεγχοι να δίνουν ίδια αποτελέσματα. Πράγματι έτσι είναι. Ας δούμε ένα σχετικό παράδειγμα. Παράδειγμα 14.5: Η αποτελεσματικότητα του φυτοφαρμάκου που χρησιμοποιεί ένας αγρότης για την αντιμετώπιση κάποιας συγκεκριμένης ασθένειας είναι γνωστό ότι είναι 60%, δηλαδή το 60% των άρρωστων φυτών στα οποία χορηγείται το εν λόγω φάρμακο θεραπεύονται. Για να ελέγξει την αποτελεσματικότητα ενός νέου φαρμάκου που καταπολεμά την ίδια ασθένεια, ο αγρότης χορήγησε αυτό το νέο φάρμακο σε 150 άρρωστα φυτά και από αυτά θεραπεύθηκαν τα 120. Σε επίπεδο σημαντικότητας 5%,

Page 18: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 488

υποστηρίζουν αυτά τα πειραματικά δεδομένα ότι η αποτελεσματικότητα του νέου φαρμάκου είναι διαφορετική (από αυτήν του φαρμάκου που χρησιμοποιεί); Απάντηση: Για κάθε άρρωστο φυτό, το αποτέλεσμα της φαρμακευτικής αγωγής ταξινομείται σε (ακριβώς) μια από δύο κατηγορίες: θεραπεύθηκε, δε θεραπεύθηκε. Πρόκειται επομένως για ένα πείραμα 150=ν ανεξάρτητων πολυωνυμικών δοκιμών με 2=k δυνατά αποτελέσματα η καθεμία, συνεπώς πρόκειται για ένα πείραμα

150=ν ανεξάρτητων δοκιμών Bernoulli και το πρόβλημα που τίθεται είναι πρόβλημα ελέγχου ενός διωνυμικού ποσοστού, του ποσοστού των άρρωστων φυτών που θεραπεύονται με το νέο φάρμακο. Θα κάνουμε το ζητούμενο έλεγχο με δύο τρόπους 1ος τρόπος: Έστω p το ποσοστό των άρρωστων φυτών που θεραπεύονται με το νέο φάρμακο, ή αλλιώς, έστω p η πιθανότητα ένα άρρωστο φυτό να θεραπευθεί με το νέο φάρμακο. Σε επίπεδο σημαντικότητας 05.0=α , πρέπει να κάνουμε τον έλεγχο της μηδενικής υπόθεσης

60.0:0 =pH έναντι της εναλλακτικής

60.0:1 ≠pH . Επειδή 59060.0150 >=⋅ και 560)60.01(150 >=−⋅ , μπορούμε να εφαρμόσουμε Ζ έλεγχο με απορριπτική περιοχή

96.1)60.01(60.0

15060.0ˆ025.0 =≥

−= z

pz

όπου, 80.0150120ˆ ==p το δειγματικό ποσοστό, δηλαδή, το ποσοστό των άρρωστων

φυτών που θεραπεύθηκαν με το νέο φάρμακο στο δείγμα των 150 άρρωστων φυτών. Έτσι, επειδή

96.15)60.01(60.0

15060.08.0≥=

−=z

η μηδενική υπόθεση σε επίπεδο σημαντικότητας 0.05 απορρίπτεται και επομένως τα πειραματικά δεδομένα δίνουν στατιστικά σημαντικές αποδείξεις ότι η αποτελεσματικότητα του νέου φάρμακου δεν είναι 60%. Η πιθανότητα το συμπέρασμα αυτό να είναι λάθος, είναι το πολύ 0.05.

2ος τρόπος: Έστω 1p η πιθανότητα για ένα άρρωστο φυτό το αποτέλεσμα της φαρμακευτικής αγωγής να ταξινομηθεί στην κατηγορία «θεραπεύθηκε» και 2p η πιθανότητα το αποτέλεσμα να ταξινομηθεί στην κατηγορία «δε θεραπεύθηκε». Με βάση τα (συγκεκριμένα) πειραματικά δεδομένα, θα ελέγξουμε σε επίπεδο σημαντικότητας 05.0=α , τη μηδενική υπόθεση,

60.0: 10 =pH και 40.02 =p έναντι της εναλλακτικής

:1H 60.01 ≠p ή 40.02 ≠p ή ισοδύναμα (σκεφθείτε γιατί), τη μηδενική υπόθεση,

60.0: 10 =pH έναντι της εναλλακτικής

Page 19: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 489

:1H 60.01 ≠p . Στον πίνακα που ακολουθεί φαίνεται για κάθε κατηγορία αποτελεσμάτων η παρατηρηθείσα συχνότητα, iO , δηλαδή, πόσες φορές σε 150 επαναλήψεις, εμφανίσθηκε κάθε μια από τις δύο κατηγορίες, καθώς και η αντίστοιχη αναμενόμενη συχνότητα

2,1,150 0 =⋅= ipE ii δηλαδή, πόσες φορές αναμένεται να εμφανισθεί σε 150 επαναλήψεις κάθε μια από τις δύο κατηγορίες αποτελεσμάτων αν θεωρήσουμε ότι η 0H είναι αληθής.

Αποτέλεσμα Θεραπεύθηκε Δε Θεραπεύθηκε Σύνολα

iO 120 30 150

0ip 0.60 0.40 1.00

0150 ii pE ⋅= 90 60 150

Επειδή για κάθε κατηγορία 2,1=i είναι 5≥iE , μπορούμε να κάνουμε έλεγχο 2X καλής προσαρμογής. Έτσι, έχουμε

( ) ( ) ( ) 2560

603090

90120 222

1

22 =

−+

−=

−= ∑

=i i

ii

EEO

X .

Η απορριπτική περιοχή του ελέγχου ορίζεται από την ανισότητα ( )

84.3205.0;12

2

1

22 =>

−= −

=∑ χi i

ii

EEO

X

και επειδή 84.325 > , η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 0.05 απορρίπτεται. Επομένως, τα συγκεκριμένα πειραματικά δεδομένα, δίνουν στατιστικά σημαντικές αποδείξεις ότι η αποτελεσματικότητα του νέου φαρμάκου δεν είναι 60%. Η πιθανότητα το συμπέρασμα αυτό να είναι λάθος, είναι το πολύ 0.05. Πράγματι λοιπόν, το συμπέρασμα και με τους δύο ελέγχους είναι το ίδιο. Παρατηρείστε τις τιμές της στατιστικής συνάρτησης ελέγχου στις δύο περιπτώσεις. Είναι 5=z και 252 =X αντίστοιχα, δηλαδή πράγματι 222 255 Xz === . Παρατηρείστε επίσης, ότι για τις κρίσιμες τιμές των δύο ελέγχων είναι

205.0;1

22025.0 84.396.1)( χ=≈=z .

Ερώτηση: Έστω ότι το ερώτημα στο προηγούμενο πρόβλημα είναι «σε επίπεδο σημαντικότητας 5%, υποστηρίζουν αυτά τα πειραματικά δεδομένα ότι η αποτελεσματικότητα του νέου φαρμάκου δεν είναι 60% αλλά μεγαλύτερη;». Τι έλεγχο πρέπει τώρα να κάνουμε;

Σημείωση 14.1.2: Επειδή ο έλεγχος 2X βασίζεται όπως είδαμε στην προσέγγιση της 2X που είναι διακριτή7 από μια συνεχή κατανομή που είναι η 2χ , προτείνεται, στην

7 Αν προβληματίζεσθε γιατί η 2X είναι διακριτή, σκεφθείτε το εξής απλό: στο παράδειγμα 14.5 η τιμή της 2X βρέθηκε 25. Αν θεωρήσουμε ότι αντί για 120 θεραπεύθηκαν 121 και αντίστοιχα δε θεραπεύθηκαν 29 (αντί 30), τότε η τιμή της 2X γίνεται 26.694. Επομένως, είναι προφανές ότι δε μπορεί η 2X να πάρει κάποια ενδιάμεση τιμή, δηλαδή κάποια τιμή μεταξύ 25 και 26.694. Είναι, δηλαδή, ασυνεχής.

Page 20: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 490

περίπτωση που οι βαθμοί ελευθερίας είναι μόνο ένας (όπως στο Παράδειγμα 14.5), να γίνεται «διόρθωση συνέχειας» ώστε να βελτιώνεται η προσέγγιση και να διασφαλίζεται ότι ο έλεγχος γίνεται πράγματι σε επίπεδο σημαντικότητας α και όχι σε μεγαλύτερο. Συγκεκριμένα, στην περίπτωση που οι βαθμοί ελευθερίας είναι μόνο ένας, προτείνεται ως στατιστική συνάρτηση ελέγχου να χρησιμοποιείται η 2

cX , όπου

( )∑=

−−=

2

1

22 5.0||

i i

iic E

EOX .

Η διόρθωση αυτή είναι γνωστή στη βιβλιογραφία ως διόρθωση συνέχειας του Yates (Yates correction for continuity). Βέβαια, παρότι χρησιμοποιείται ευρέως, έχει δεχθεί κριτική ότι κάνει τον έλεγχο (υπερ)συντηρητικό, δηλαδή, ότι αυξάνει αρκετά την πιθανότητα σφάλματος τύπου ΙΙ. Βέβαια, αν το ν είναι πολύ μεγάλο οι επιπτώσεις της ασυνέχειας (ακόμη και για ένα βαθμό ελευθερίας) είναι μικρές και η αλλαγή στην τιμή της 2X λόγω της διόρθωσης είναι επίσης μικρή. 14.2 Έλεγχος Χ2 ανεξαρτησίας (chi-square test of independence) Πολύ συχνά, σε πειραματικές ή δειγματοληπτικές έρευνες, μια πειραματική/ δειγματοληπτική μονάδα ταξινομείται όχι μόνο ως προς ένα χαρακτηριστικό αλλά και ως προς ένα δεύτερο. Έτσι, προκύπτουν διδιάστατα δεδομένα (bivariate data) τα οποία παρουσιάζονται σε διδιάστατους πίνακες συχνοτήτων που ονομάζονται πίνακες συνάφειας. Για παράδειγμα, για κάθε άτομο που συμμετέχει σε μια έρευνα για την πρόληψη της γρίπης, καταγράφουμε αν αρρώστησε ή όχι από γρίπη καθώς και τον αριθμό δόσεων αντιγριπικού εμβολίου που είχε κάνει. Έτσι, για κάθε άτομο τα δυνατά αποτελέσματα είναι τα έξι ζεύγη τιμών

(αρρώστησε, 0), (αρρώστησε, 1), (αρρώστησε, 2) , (δεν αρρώστησε, 0), (δεν αρρώστησε, 1), (δεν αρρώστησε, 2)

όπου, η πρώτη τιμή αντιστοιχεί στη δίτιμη ποιοτική μεταβλητή «ανθεκτικότητα στον ιό της γρίπης» με τιμές αρρώστησε, δεν αρρώστησε, και η δεύτερη στη διακριτή ποσοτική μεταβλητή «αριθμός δόσεων εμβολίου» με τιμές 0, 1, 2. Έτσι, κάθε πειραματική μονάδα ταξινομείται σε (ακριβώς) μία από 632 =⋅ διαφορετικές κατηγορίες8. Στον πίνακα που ακολουθεί φαίνεται πώς ταξινομήθηκαν στις 6 αυτές κατηγορίες 1000 άτομα που συμμετείχαν σε μια τέτοια έρευνα.

Αριθμός δόσεων 0 1 2

Αρρώστησε 24 9 13 Ανθεκτικότητα Δεν αρρώστησε 289 100 565 Παρατηρείστε ότι από τα 1000 άτομα, 24 αρρώστησαν και δεν είχαν κάνει εμβόλιο και έτσι ταξινομήθηκαν στην κατηγορία (αρρώστησε, 0), ή αλλιώς, η συχνότητα της κατηγορίας (αρρώστησε, 0) είναι 24. Ομοίως, η συχνότητα της κατηγορίας (αρρώστησε, 1) είναι 9, της κατηγορίας (αρρώστησε, 2) είναι 13 κ.ο.κ. Γενικά, έστω ν πειραματικές μονάδες κάθε μια από τις οποίες ταξινομείται ως προς δύο χαρακτηριστικά (τυχαίες μεταβλητές) Α και Β, από τα οποία, το Α μπορεί να πάρει 2≥r διαφορετικές τιμές (κατηγορίες), rAAA ,,, 21 K , και το Β μπορεί να πάρει

2≥c διαφορετικές τιμές (κατηγορίες), cBBB ,,, 21 K . Προκύπτουν έτσι, cr ⋅

8 θυμηθείτε την πολλαπλασιαστική αρχή

Page 21: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 491

διαφορετικές κατηγορίες/διαφορετικά ζεύγη τιμών, ),( ji BA . Ας συμβολίσουμε με

ijO τον αριθμό των πειραματικών μονάδων (από τις ν ) που ταξινομήθηκαν στην κατηγορία ),( ji BA , ή αλλιώς, έστω ijO η συχνότητα της κατηγορίας ),( ji BA . Ο Πίνακας 14.2.1, οι γραμμές του οποίου ορίζονται από τις r κατηγορίες rAAA ,,, 21 K του χαρακτηριστικού Α και οι στήλες του από τις c κατηγορίες cBBB ,,, 21 K του χαρακτηριστικού Β, και ο οποίος, ως στοιχείο στη θέση ),( ji (δηλαδή στο κελί που ορίζεται από τη γραμμή i και τη στήλη j) έχει τη συχνότητα ijO της αντίστοιχης κατηγορίας, δηλαδή τη συχνότητα της κατηγορίας ),( ji BA , είναι ένας cxr διδιάστατος πίνακας συχνοτήτων που ονομάζεται πίνακας συνάφειας (contingency table).

Χαρακτηριστικό Β 1B 2B L cB Σύνολα γραμμών

1A 11Q 12Q L cQ1 1R

2A 21Q 22Q L cQ2

2R

M M M M M Χαρακτηριστικό Α

rA 1rQ 2rQ L rcQ rR

Σύνολα στηλών 1C 2C L cC ν Πίνακας 14.2.1

Ένας τέτοιος πίνακας συχνοτήτων ονομάζεται πίνακας συνάφειας γιατί μέσω της διδιάστατης κατανομής συχνοτήτων που αναπαριστά/περιγράφει, ελέγχουμε αν τα δύο χαρακτηριστικά που ορίζουν τις διαστάσεις του έχουν κάποια συνάφεια/εξάρτηση ή αν είναι ανεξάρτητα. Γι’ αυτό εξάλλου γίνεται (συνήθως) μια τέτοια ταξινόμηση. Για να ελέγξουμε αν δύο χαρακτηριστικά (μεταβλητές) των οποίων οι τιμές ταξινομούνται σε κατηγορίες, είναι ανεξάρτητα ή μήπως παρουσιάζουν κάποια συνάφεια/εξάρτηση. Να ελέγξουμε, για παράδειγμα, αν η ανθεκτικότητα ενός ατόμου στον ιό της γρίπης (αρρώστησε, δεν αρρώστησε) εξαρτάται από τον αριθμό των δόσεων αντιγριπικού εμβολίου που έκανε (0, 1, 2) ή αν υπάρχει συνάφεια/εξάρτηση μεταξύ φύλου (άντρας, γυναίκα) και συνήθειας καπνίσματος (μη καπνιστής, πρώην καπνιστής, περιστασιακός καπνιστής, καπνιστής) ή αν ο τρόπος μετάβασης των φοιτητών/τριών στο πανεπιστήμιο (με τα πόδια, με ποδήλατο, με ΙΧ αυτοκίνητο ή μοτοσυκλέτα, με τα δημόσια μέσα συγκοινωνίας, με ταξί) είναι ανεξάρτητος από το φύλο (φοιτητής, φοιτήτρια) ή αν η ανθεκτικότητα ενός φυτού σε μια συγκεκριμένη ασθένεια (αρρώστησε, δεν αρρώστησε) εξαρτάται από το μέγεθός του (μεγάλο, μικρό). Ας δούμε λοιπόν πώς μπορούμε να κάνουμε έναν τέτοιο έλεγχο ανεξαρτησίας.

Έστω ένα τυχαίο δείγμα ν παρατηρήσεων ),( ji BA που προέκυψαν από την ταξινόμηση ν πειραματικών/δειγματοληπτικών μονάδων ως προς δύο χαρακτηριστικά Α και Β, από τα οποία, το Α μπορεί να πάρει 2≥r διαφορετικές τιμές (κατηγορίες), rAAA ,,, 21 K , και το Β μπορεί να πάρει 2≥c διαφορετικές τιμές (κατηγορίες), cBBB ,,, 21 K . Είναι λογικό/εύλογο η ανεξαρτησία των Α και Β να ορίζεται μέσω της έννοιας της ανεξαρτησίας ενδεχομένων. Πράγματι, έτσι είναι. Αν θεωρήσουμε τα ενδεχόμενα

iA : μια πειραματική μονάδα ταξινομείται στην κατηγορία iA του χαρακτηριστικού Α

Page 22: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 492

jB : μια πειραματική μονάδα ταξινομείται στην κατηγορία jB του χαρακτηριστικού Β τότε, τα χαρακτηριστικά Α και Β είναι ανεξάρτητα αν τα ενδεχόμενα iA και jB είναι ανεξάρτητα για κάθε ri ,,2,1 K= και cj ,,2,1 K= , δηλαδή, αν

)()()( jiji BPAPBAP =∩ , για όλα τα i και j ή ισοδύναμα, αν

)()|( iji APBAP = , για όλα τα i και j. Αυτό σημαίνει ότι τα χαρακτηριστικά Α και Β είναι ανεξάρτητα αν, για όλα τα i και j, η πιθανότητα μια παρατήρηση να ανήκει στην κατηγορία iA του χαρακτηριστικού Α δεν εξαρτάται/δεν επηρεάζεται από την κατηγορία jB του χαρακτηριστικού Β στην οποία ανήκει, ή ισοδύναμα, αν, για όλα τα i και j, η πιθανότητα μια παρατήρηση να ανήκει στην κατηγορία jB του χαρακτηριστικού Β δεν εξαρτάται/δεν επηρεάζεται από την κατηγορία iA του χαρακτηριστικού Α στην οποία ανήκει, αφού ισοδύναμη με τις παραπάνω σχέσεις (όπως είδαμε στο Α΄ Μέρος) είναι επίσης η σχέση

)()|( jij BPABP = .

Παρατήρηση 14.2.1: Παρατηρείστε ότι τα ενδεχόμενα rAAA ,,, 21 K αποτελούν μια διαμέριση του δειγματικού χώρου του πειράματος αφού κάθε πειραματική μονάδα ταξινομείται σε μια από τις κατηγορίες iA και μάλιστα ακριβώς σε μία και έτσι

Ω==U

r

iiA

1

και ∅=∩ ji AA για κάθε ji ≠ . Αντίστοιχα, τα cBBB ,,, 21 K αποτελούν

επίσης μια άλλη διαμέριση του δειγματικού χώρου του πειράματος. Ας συμβολίσουμε με ip την πιθανότητα )( iAP μια πειραματική μονάδα να ταξινομηθεί στην κατηγορία iA του χαρακτηριστικού Α και με jq την πιθανότητα

)( jBP μια πειραματική μονάδα να ταξινομηθεί στην κατηγορία jB του χαρακτηριστικού Β. Έστω δηλαδή,

)( ii APp = και )( jj BPq = . Έστω, επίσης

)( jiij BAPp ∩= η πιθανότητα μια πειραματική μονάδα να ταξινομηθεί στην κατηγορία iA του χαρακτηριστικού Α και (συγχρόνως) στην κατηγορία jB του χαρακτηριστικού Β. Για να ελέγξουμε αν τα χαρακτηριστικά Α και Β είναι ανεξάρτητα, πρέπει προφανώς, να κάνουμε τον έλεγχο της μηδενικής υπόθεσης

jiij qppH ⋅=:0 , για κάθε i και j έναντι της εναλλακτικής,

,:1 jiij qppH ⋅≠ για τουλάχιστον ένα i και j .

Αν ijX , ri ,,2,1 K= , cj ,,2,1 K= τυχαίες μεταβλητές που η κάθε μια εκφράζει τον αριθμό των παρατηρήσεων που ανήκουν στην αντίστοιχη κατηγορία ),( ji BA , είναι προφανές ότι έχουν από κοινού κατανομή μια πολυωνυμική κατανομή με

Page 23: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 493

παραμέτρους ν και )( jiij BAPp ∩= , ri ,,2,1 K= , cj ,,2,1 K= . Αυτό σημαίνει ότι ο έλεγχος της μηδενικής υπόθεσης

jiij qppH ⋅=:0 , για κάθε i και j είναι ένας έλεγχος των παραμέτρων ijp μιας πολυωνυμικής κατανομής.

Μπορούμε επομένως να εργασθούμε όπως στον έλεγχο 2X καλής προσαρμογής, με τις αποκλίσεις μεταξύ παρατηρηθέντων και αναμενόμενων (με βάση τη μηδενική υπόθεση) συχνοτήτων.

Για κάθε δυνατή κατηγορία ),( ji BA , η παρατηρηθείσα συχνότητα, ijO (η τιμή της

ijX στο δείγμα), μας είναι γνωστή. Η αντίστοιχη, με βάση τη μηδενική υπόθεση, αναμενόμενη συχνότητα ijE προφανώς είναι

jiijij pppE νν == . Επειδή, κατά κανόνα, οι πιθανότητες ip , ri ,,2,1 K= και jq , cj ,,2,1 K= δεν είναι γνωστές, τις εκτιμάμε με τα δειγματικά ποσοστά

νi

iR

p =ˆ και ν

jj

Cp =ˆ

όπου, iR το άθροισμα των στοιχείων της γραμμής i του πίνακα συνάφειας, jC το άθροισμα των στοιχείων της στήλης j του πίνακα συνάφειας και ν το μέγεθος του δείγματος. Έτσι, οι εκτιμώμενες αναμενόμενες συχνότητες είναι

ννννν jiji

jiij

CRCRppE =⋅⋅== ˆˆˆ .

Ως στατιστική συνάρτηση ελέγχου (εύλογα) χρησιμοποιούμε τη στατιστική συνάρτηση 2X με

∑∀

−=

ji ij

ijij

E

EOX

,

22

ˆ)ˆ(

.

Με την παραδοχή ότι η μηδενική υπόθεση είναι αληθής, αποδεικνύεται ότι η τυχαία μεταβλητή 2X , για μεγάλα ν ακολουθεί μια 2χ κατανομή με )1)(1( −− cr βαθμούς ελευθερίας. Η προσέγγιση αυτή είναι ικανοποιητική αν όλες οι (εκτιμώμενες) αναμενόμενες συχνότητες είναι μεγαλύτερες ή ίσες του 5, δηλαδή, αν,

5ˆˆˆ ≥= jiij ppE ν για όλα τα i και j . Έτσι, προκύπτει ο ακόλουθος έλεγχος 2X ο οποίος ονομάζεται έλεγχος Χ2 ανεξαρτησίας (chi-square test of independence).

Σε επίπεδο σημαντικότητας α , η μηδενική υπόθεση jiij qppH ⋅=:0 , για κάθε i και j

απορρίπτεται έναντι της εναλλακτικής, ,:1 jiij qppH ⋅≠ για τουλάχιστον ένα i και j ,

αν

2);1)(1(

,

22

ˆ)ˆ(

αχ −−∀

>−

= ∑ crji ij

ijij

E

EOX

και εφόσον 5ˆˆˆ ≥= jiij ppE ν για όλα τα i και j .

Page 24: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 494

Αν ο περιορισμός 5ˆˆˆ ≥= jiij ppE ν παραβιάζεται για τουλάχιστον μία από τις εκτιμώμενες αναμενόμενες συχνότητες, κάνουμε κατάλληλη σύμπτυξη των αρχικών κατηγοριών.

Σχόλιο 14.2.1: Ας δούμε γιατί οι βαθμοί ελευθερίας της 2χ κατανομής που χρησιμοποιείται στον έλεγχο 2X ανεξαρτησίας είναι )1)(1( −− cr .

Γενικά, οι βαθμοί ελευθερίας (β.ε) σε έναν έλεγχο 2X είναι

β.ε. = αριθμός διαφορετικών κατηγοριών −−1 αριθμός εκτιμώμενων παραμέτρων.

Στον έλεγχο 2X ανεξαρτησίας, όπως είδαμε, οι διαφορετικές κατηγορίες είναι cr ⋅ και οι παράμετροι που χρειάζεται να εκτιμηθούν, όταν μας είναι άγνωστες, είναι οι πιθανότητες ip και jq . Συνολικά, ο αριθμός των ip και jq που πρέπει να εκτιμηθούν είναι 11 −+− cr (και όχι cr + ) αφού ισχύουν οι σχέσεις

121 =+++ rppp K και 121 =+++ rqqq K . Έτσι, έχουμε

)1()1(1)11(1. −⋅−=+−−⋅=−+−−−⋅= crcrcrcrcrεβ Αν οι παράμετροι ip και jq είναι όλες γνωστές, τότε οι βαθμοί ελευθερίας προφανώς είναι 101 −⋅=−−⋅ crcr . Aς ολοκληρώσουμε τώρα το εισαγωγικό μας παράδειγμα που αναφέρεται στην αποτελεσματικότητα του αντιγριπικού εμβολίου. Παράδειγμα 14.6: Στο πλαίσιο της έρευνας που γίνεται για την πρόληψη την γρίπης, έγινε μια μελέτη για να ελεγχθεί η αποτελεσματικότητα ενός νέου αντιγριπικού εμβολίου το οποίο χορηγείται σε δύο δόσεις. Σε χίλιους τυχαία επιλεγμένους κατοίκους μιας περιοχής δόθηκε η δυνατότητα να κάνουν το εμβόλιο δωρεάν και εθελοντικά. Για κάθε κάτοικο, η ερευνητική ομάδα κατέγραψε πόσες δόσεις του εμβολίου έκανε (καμία, μία ή δύο) και αν αρρώστησε ή όχι από τη γρίπη.

Αριθμός δόσεων 0 1 2

Αρρώστησε 24 9 13 Ανθεκτικότητα Δεν αρρώστησε 289 100 565 Σε επίπεδο σημαντικότητας 5%, δίνουν αυτά τα δεδομένα σημαντικές αποδείξεις ότι η ανθεκτικότητα των κατοίκων στον ιό της γρίπης εξαρτάται από τον αριθμό των δόσεων αντιγριπικού εμβολίου που έκαναν; Απάντηση: Ζητείται να ελέγξουμε, με βάση τα συγκεκριμένα πειραματικά δεδομένα, αν το χαρακτηριστικό (τυχαία μεταβλητή) Α: ανθεκτικότητα στον ιό της γρίπης, με τιμές αρρώστησε, δεν αρρώστησε και το χαρακτηριστικό (τυχαία μεταβλητή) Β: αριθμός δόσεων εμβολίου, με τιμές 0, 1, 2 είναι ανεξάρτητα ή εξαρτημένα. Ας θεωρήσουμε τα ενδεχόμενα,

1A : ο κάτοικος αρρώστησε, 2A : ο κάτοικος δεν αρρώστησε

1B : ο κάτοικος έκανε μηδέν δόσεις, 2B : ο κάτοικος έκανε μια δόση,

Page 25: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 495

3B : ο κάτοικος έκανε δύο δόσεις, και έστω )( 11 APp = , )( 22 APp = , )( 11 BPq = , )( 22 BPq = και )( 33 BPq = .

Έστω επίσης, 2,1),( =∩= iBAPp jiij και 2,1,0=j . Σε επίπεδο σημαντικότητας 05.0=α , θα ελέγξουμε τη μηδενική υπόθεση,

jiij qppH ⋅=:0 , για κάθε i και j έναντι της εναλλακτικής,

,:1 jiij qppH ⋅≠ για τουλάχιστον ένα i και j ή αλλιώς, θα ελέγξουμε τη μηδενική υπόθεση,

:0H Η ανθεκτικότητα στον ιό της γρίπης είναι ανεξάρτητη από τον αριθμό των δόσεων εμβολίου, έναντι της εναλλακτικής,

:1H Η ανθεκτικότητα στον ιό της γρίπης εξαρτάται (επηρεάζεται) από τον αριθμό των δόσεων εμβολίου.

Αν δεχθούμε ότι η 0H είναι αληθής, δηλαδή, αν δεχθούμε ότι τα ενδεχόμενα iA και

jB είναι για κάθε i και j ανεξάρτητα, τότε η εκτιμώμενη αναμενόμενη συχνότητα

ijE της αντίστοιχης κατηγορίας είναι

νji

ij

CRE =ˆ

όπου, iR το άθροισμα των στοιχείων της γραμμής i του πίνακα συνάφειας, jC το άθροισμα των στοιχείων της στήλης j του πίνακα συνάφειας και ν το μέγεθος του δείγματος. Έτσι έχουμε:

4.141000

31346ˆ11 =

⋅=E , 5

100010946ˆ

12 =⋅

=E , 6.261000

57846ˆ13 =

⋅=E

6.2981000

313954ˆ21 =

⋅=E , 104

1000109954ˆ

22 =⋅

=E , 4.5511000

578954ˆ11 =

⋅=E .

Στον πίνακα συνάφειας που ακολουθεί, για κάθε i και j , εκτός από την παρατηρηθείσα συχνότητα ijO , μέσα σε παρένθεση φαίνεται και η αντίστοιχη ijE .

Αριθμός δόσεων

0 1 2 Σύνολα γραμμών

( iR )

Αρρώστησε 24 (14.4)

9 (5)

13 (26.6) 46

Ανθεκτικότητα Δεν αρρώστησε 289

(298.6) 100

(104) 565

(551.4) 954

Σύνολα στηλών

( jC ) 313 109 578 1000

Page 26: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 496

Επειδή για κάθε i και j είναι 5ˆˆˆ ≥⋅= jiij qpE ν , μπορούμε να κάνουμε έλεγχο 2X ανεξαρτησίας. Έτσι, έχουμε

35.174.551

)4.551565(...4.14

)4.1424( 222 =

−++

−=X .

Η απορριπτική περιοχή του ελέγχου είναι

205.0);13)(12(

,

22

ˆ)ˆ(

−−∀

>−

= ∑ χji ij

ijij

E

EOX ή 991.5ˆ

)ˆ(

,

22 >

−= ∑

∀ ji ij

ijij

E

EOX

και επειδή 991.535.17 > , δηλαδή, επειδή η τιμή 17.35 της στατιστικής συνάρτησης ελέγχου είναι μεγαλύτερη της κρίσιμης τιμής 991.52

05.0;2 =χ (που παίρνουμε από τον

πίνακα της 2χ κατανομής για 2)13)(12( =−− βαθμούς ελευθερίας και 05.0=α ), η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 5%, απορρίπτεται και επομένως τα συγκεκριμένα πειραματικά δεδομένα, σε επίπεδο σημαντικότητας 5%, δίνουν στατιστικά σημαντικές αποδείξεις ότι η ανθεκτικότητα στον ιό της γρίπης δεν είναι ανεξάρτητη από τον αριθμό των δόσεων εμβολίου. Η πιθανότητα το συμπέρασμα αυτό να είναι λάθος, είναι το πολύ 0.05. Σχόλιο 14.2.2: Ας δούμε, με ένα παράδειγμα, πώς μπορούμε να υπολογίζουμε τις εκτιμώμενες αναμενόμενες συχνότητες ijE σκεπτόμενοι με βάση το νόημα της ανεξαρτησίας (και την κοινή λογική), χωρίς δηλαδή, να χρειάζεται να καταφύγουμε στον τύπο νjiij CRE =ˆ . Πιστεύουμε ότι αυτό θα βοηθήσει στην καλύτερη κατανόηση του νοήματος της ανεξαρτησίας και της διαδικασίας που εφαρμόσαμε. Θα χρησιμοποιήσουμε το Παράδειγμα 14.6. Από τα 1000 άτομα αρρώστησαν 46, δηλαδή, σε όλο το δείγμα το ποσοστό αυτών που αρρώστησαν είναι 046.0100046 = ή 4.6%. Εφόσον υποθέτουμε ότι το αν θα αρρωστήσει ή όχι κάποιος κάτοικος δεν εξαρτάται από τον αριθμό των δόσεων εμβολίου που έκανε, τότε πρέπει να περιμένουμε ότι και από αυτούς που έκαναν 0 δόσεις, και από αυτούς που έκαναν 1 δόση, και από αυτούς που έκαναν 2 δόσεις, θα αρρωστήσει ίδιο ποσοστό, ίσο με 4.6% (όσο στο γενικό σύνολο). Έτσι, από τους 313 κατοίκους που έκαναν 0 δόσεις περιμένουμε να αρρωστήσουν 4.14313046.0 =⋅ κάτοικοι, από τους 109 κατοίκους που έκαναν 1 δόση περιμένουμε να αρρωστήσουν

5109046.0 =⋅ κάτοικοι και από τους 578 κατοίκους που έκαναν 2 δόσεις περιμένουμε να αρρωστήσουν 6.26578046.0 =⋅ κάτοικοι. Επίσης, το ποσοστό των ατόμων σε όλο το δείγμα που δεν αρρώστησαν είναι

954.01000954 = ή 95.4%. Σκεπτόμενοι όπως προηγουμένως, περιμένουμε το ποσοστό αυτό να είναι το ίδιο και στις τρεις περιπτώσεις δόσεων εμβολίου. Έτσι, από τους 313 κατοίκους που έκαναν 0 δόσεις περιμένουμε να μην αρρωστήσουν

6.298313954.0 =⋅ κάτοικοι, από τους 109 κατοίκους που έκαναν 1 δόση περιμένουμε να μην αρρωστήσουν 104109954.0 =⋅ κάτοικοι και από τους 578 κατοίκους που έκαναν 2 δόσεις περιμένουμε να μην αρρωστήσουν 4.551578954.0 =⋅ κάτοικοι. Παρατηρείστε ότι

4.141000

313463131000

46313046.0 11 ==⋅

=⋅=⋅νCR ,

Page 27: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 497

51000

109461091000

46109046.0 21 ==⋅

=⋅=⋅νCR , κ.ο.κ.

Φυσικά, κάτι τέτοιο δεν μας εκπλήσσει γιατί αυτό που ουσιαστικά κάναμε είναι να ερμηνεύσουμε την ανεξαρτησία ενδεχομένων μέσω της έννοιας της δεσμευμένης πιθανότητας, δηλαδή, μέσω των σχέσεων )()|( iji APBAP = που είναι ισοδύναμες με τις σχέσεις )()()( jiji BPAPBAP =∩ που χρησιμοποιήσαμε για να αποδείξουμε τον

τύπο νjiij CRE =ˆ . (Θυμηθείτε και όσα είχαμε πει για την ερμηνεία της δεσμευμένης πιθανότητας με όρους ποσοστών και ξαναδείτε π.χ. το Παράδειγμα 4.4).

Ερώτηση: Μόλις ολοκληρώσαμε την παρουσίαση του ελέγχου 2X ανεξαρτησίας. Τι λέτε, μήπως τελικά πρόκειται για έναν έλεγχο 2X καλής προσαρμογής;

14.3 Έλεγχος Χ2 ομογένειας (chi-square test of homogeneity)

Ένας cxr πίνακας συνάφειας, γενικά, προκύπτει όπως είδαμε όταν ν πειραματικές9 μονάδες (και αντίστοιχα ν παρατηρήσεις) ταξινομούνται ταυτόχρονα ως προς δύο χαρακτηριστικά σε cr ⋅ κατηγορίες σύμφωνα με ένα τυχαίο πείραμα (ν επαναλήψεις μιας πολυωνυμικής δοκιμής με cr ⋅ διαφορετικά αποτελέσματα/κατηγορίες). Αυτό σημαίνει ότι κάθε πειραματική μονάδα μπορεί να ταξινομηθεί σε οποιαδήποτε από τις

cr ⋅ κατηγορίες και επομένως, πόσες πειραματικές μονάδες ταξινομούνται ανά γραμμή και πόσες ανά στήλη του πίνακα, δηλαδή, τα αθροίσματα ανά στήλη και ανά γραμμή δεν είναι προκαθορισμένοι αριθμοί αλλά τυχαίες μεταβλητές. Σε έναν τέτοιο πειραματικό σχεδιασμό, προκαθορισμένος είναι μόνο ο αριθμός επαναλήψεων ν , δηλαδή, το μέγεθος του δείγματος ν . Για παράδειγμα, στην έρευνα για την πρόληψη της γρίπης που είδαμε στο Παράδειγμα 14.6, οι ερευνητές καθόρισαν το μέγεθος,

1000=ν , του τυχαίου δείγματος που πήραν, όμως πόσοι κάτοικοι πήραν μηδέν δόσεις και πόσοι πήραν δύο ή μία, δηλαδή, το άθροισμα κάθε στήλης του πίνακα συνάφειας (όπως και το άθροισμα κάθε γραμμής) δεν προκαθορίσθηκε από τους ερευνητές αλλά προέκυψε ως αποτέλεσμα του τυχαίου πολυωνυμικού πειράματος. Υπάρχουν όμως περιπτώσεις όπου ο πειραματικός σχεδιασμός που επιλέξαμε οδηγεί σε πίνακα συνάφειας με αθροίσματα γραμμών ή στηλών προκαθορισμένα. Για παράδειγμα, στην έρευνα για την πρόληψη της γρίπης, οι ερευνητές θα μπορούσαν, με βάση τον αριθμό των δόσεων, να ορίσουν τρεις ομάδες/υποπληθυσμούς και να προκαθορίσουν πόσοι κάτοικοι θα κάνουν μηδέν δόσεις του εμβολίου, πόσοι θα κάνουν μία και πόσοι δύο, δηλαδή, να πάρουν τρία δείγματα προκαθορισμένου μεγέθους (ένα από κάθε υποπληθυσμό) και στη συνέχεια κάθε δείγμα να ταξινομηθεί ως προς το χαρακτηριστικό «ανθεκτικότητα στον ιό» σε δύο κατηγορίες «αρρώστησε», «δεν αρρώστησε». Σε αυτή την περίπτωση, τα αθροίσματα των τριών στηλών του πίνακα συνάφειας θα ήταν σταθεροί προκαθορισμένοι αριθμοί και όχι αποτέλεσμα τυχαίας διαδικασίας. Ένας τέτοιος πίνακας ονομάζεται πίνακας συνάφειας με καθορισμένα αθροίσματα στηλών. Όπως θα δούμε στη συνέχεια, με έναν τέτοιο πίνακα συνάφειας (και σχεδιασμό) μπορούμε να ελέγξουμε την ομογένεια υποπληθυσμών ως προς ένα χαρακτηριστικό. Έτσι, στο παράδειγμα μας, μπορούμε να ελέγξουμε αν οι τρεις υποπληθυσμοί που ορίσαμε είναι ομογενείς ως προς την ανθεκτικότητα στον ιό, ή αλλιώς, να ελέγξουμε αν το ποσοστό/αναλογία όσων

9 ή δειγματοληπτικές

Page 28: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 498

αρρωσταίνουν (και αντίστοιχα όσων δεν αρρωσταίνουν) είναι το ίδιο στους τρεις υποπληθυσμούς (σε αυτούς που κάνουν 0 δόσεις, σε αυτούς που κάνουν μία και σε αυτούς που κάνουν δύο). Γενικά, ένας πίνακας συνάφειας με καθορισμένα αθροίσματα γραμμών ή στηλών (Contingency table with fixed row or column totals), όπως ο Πίνακας 14.3.1, προκύπτει όταν από c υποπληθυσμούς παίρνουμε c τυχαία δείγματα μεγέθους

cννν ,,, 21 K αντίστοιχα, για να ελέγξουμε αν οι c υποπληθυσμοί είναι ομογενείς ως προς ένα πολυωνυμικό χαρακτηριστικό Α με r κατηγορίες rAAA ,,, 21 K . Δηλαδή, για να ελέγξουμε αν η αναλογία κάθε κατηγορίας iA , είναι ίδια στους c υποπληθυσμούς.

Δείγμα-j (από τον υποπληθυσμό-j)

1 2 L c Σύνολα γραμμών

1A 11Q 12Q L cQ1 1R

2A 21Q 22Q L cQ2

2R

M M M M M Χαρακτηριστικό Α

rA 1rQ 2rQ L rcQ rR

1ν 2ν L cν ν Πίνακας 14.3.1

Σε έναν τέτοιο σχεδιασμό, προφανώς έχουμε c πολυωνυμικά πειράματα με r διαφορετικά αποτελέσματα/κατηγορίες το καθένα (αντί για ένα πολυωνυμικό πείραμα με cr ⋅ διαφορετικά αποτελέσματα/κατηγορίες). Σημειώνουμε ότι μπορούμε να θεωρήσουμε ότι οι c υποπληθυσμοί ορίζονται μέσω των c διαφορετικών κατηγοριών cBBB ,,, 21 K ενός χαρακτηριστικού Β. Όμως, επισημαίνουμε ότι τυχαία μεταβλητή είναι μόνο το χαρακτηριστικό Α και όχι το Β, αφού το πόσες παρατηρήσεις ταξινομούνται σε κάθε κατηγορία του Β, ή αλλιώς, το μέγεθος του δείγματος από κάθε υποπληθυσμό προκαθορίζεται από τον ερευνητή. Ας δούμε όμως ένα παράδειγμα. Χρειάζεται! Παράδειγμα 14.7: Ταξινομήσαμε τους ενήλικες κατοίκους ( 18≥ ετών) μιας περιοχής σε πέντε ηλικιακές ομάδες, 18-24, 25-34, 35-49, 50-64 και 65≥ , και από κάθε ομάδα επιλέξαμε (με βάση ένα σχέδιο τυχαίας δειγματοληψίας), 90, 200, 310, 230 και 170 κατοίκους, αντίστοιχα. Ρωτήσαμε καθέναν από τους κατοίκους που επιλέξαμε πόσους καφέδες καταναλώνει ημερησίως, και τις απαντήσεις που πήραμε τις ταξινομήσαμε σε τρεις κατηγορίες: λιγότερους από τρεις, ακριβώς τρεις, περισσότερους από τρεις. Τα δεδομένα που προέκυψαν από τις απαντήσεις που πήραμε, φαίνονται στον πίνακα που ακολουθεί.

Ηλικιακή ομάδα 1 2 3 4 5 18-24 25-34 35-49 50-64 65≥

Λιγότερους από 3 18 50 100 60 90 Ακριβώς 3 45 80 180 100 40

Ημερήσια κατανάλωση

καφέ Περισσότερους από 3 27 70 30 70 40 90 200 310 230 170

Page 29: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 499

Να ελέγξετε, με βάση τα συγκεκριμένα δεδομένα, και σε επίπεδο σημαντικότητας 05.0=α , αν οι πέντε ηλικιακές ομάδες είναι ομογενείς ως προς την ημερήσια

κατανάλωση καφέ, δηλαδή, αν το ποσοστό των ενηλίκων που πίνουν λιγότερους από τρεις καφέδες ημερησίως, και αντίστοιχα, το ποσοστό των ενηλίκων που πίνουν τρεις καφέδες ημερησίως και το ποσοστό των ενηλίκων που πίνουν περισσότερους από τρεις καφέδες ημερησίως, είναι ίδιο στις πέντε ηλικιακές ομάδες; Απάντηση: Από τις 5=c κατηγορίες του χαρακτηριστικού «ηλικιακή ομάδα» ορίζονται 5 υποπληθυσμοί και από καθέναν παίρνουμε ένα τυχαίο δείγμα μεγέθους, αντίστοιχα, 901 =ν , 2002 =ν , 3103 =ν , 2304 =ν και 1705 =ν . Κάθε δειγματοληπτική μονάδα, σε καθένα από τα 5 δείγματα, ταξινομείται ως προς το χαρακτηριστικό «ημερήσια κατανάλωση καφέ» σε μια από τρεις δυνατές κατηγορίες, «λιγότερους από 3», «ακριβώς 3», «περισσότερους από 3». Δημιουργείται έτσι ένας

53 x πίνακας συνάφειας με καθορισμένα αθροίσματα στηλών. Ζητείται να κάνουμε, σε επίπεδο σημαντικότητας 0.05, τον έλεγχο της μηδενικής υπόθεσης

:0H Το ποσοστό (αναλογία) των ενηλίκων που πίνουν λιγότερους από τρεις καφέδες ημερησίως είναι ίδιο στις πέντε ηλικιακές ομάδες και το ποσοστό (αναλογία) των ενηλίκων που πίνουν ακριβώς τρεις καφέδες ημερησίως είναι ίδιο στις πέντε ηλικιακές ομάδες και το ποσοστό (αναλογία) των ενηλίκων που πίνουν περισσότερους από τρεις καφέδες ημερησίως είναι ίδιο στις πέντε ηλικιακές ομάδες έναντι της εναλλακτικής,

:1H όχι η 0H ή υπάρχουν δύο τουλάχιστον ηλικιακές ομάδες με διαφορετικά ποσοστά (αναλογίες) σε μια τουλάχιστον κατηγορία.

Αν ijp η πιθανότητα μια τυχαία παρατήρηση από τον πληθυσμό 5,4,3,2,1, =jj , να ταξινομηθεί στην κατηγορία 3,2,1, =ii τότε, η 0H και η 1H προφανώς διατυπώνονται ως εξής:

543210 : iiiii pppppH ==== , για κάθε 3,2,1, =ii έναντι της εναλλακτικής,

:1H όχι η 0H ή υπάρχουν δύο τουλάχιστον ηλικιακές ομάδες με διαφορετικά ποσοστά (αναλογίες) σε μια τουλάχιστον κατηγορία. Για τον έλεγχο αυτό χρησιμοποιείται η στατιστική συνάρτηση ελέγχου και η περιοχή απόρριψης που χρησιμοποιείται στον έλεγχο Χ2 ανεξαρτησίας. Δηλαδή, ο έλεγχος αυτός γίνεται ως να επρόκειτο για έλεγχο Χ2 ανεξαρτησίας. Πράγματι, αποδεικνύεται ότι:

Page 30: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 500

Έστω ότι από c υποπληθυσμούς παίρνουμε c τυχαία δείγματα μεγέθους cννν ,,, 21 K αντίστοιχα, για να ελέγξουμε αν οι c υποπληθυσμοί είναι ομογενείς ως προς ένα πολυωνυμικό χαρακτηριστικό Α με r κατηγορίες rAAA ,,, 21 K .

Έστω επίσης, ijp η πιθανότητα μια τυχαία παρατήρηση από τον πληθυσμό cjj ,,2,1, K= , να ταξινομηθεί στην κατηγορία rii ,,2,1, K= .

Σε επίπεδο σημαντικότητας α , η μηδενική υπόθεση

icii pppH === K210 : , για κάθε ri ,,2,1 K= απορρίπτεται έναντι της εναλλακτικής,

:1H όχι η 0H αν

2);1)(1(

,

22

ˆ)ˆ(

αχ −−∀

>−

= ∑ crji ij

ijij

E

EOX

και εφόσον 5ˆ ≥= νν jiij RE για όλα τα i και j . Ο έλεγχος αυτός ονομάζεται έλεγχος Χ2 ομογένειας (chi-square test of homogeneity).

Σχόλιο 14.3.1: Το ότι ο έλεγχος 2X ομογένειας γίνεται όπως ο έλεγχος 2X ανεξαρτησίας, είναι μάλλον κάτι αναμενόμενο, αν σκεφθούμε ότι η μηδενική υπόθεση του ελέγχου ομογένειας, icii pppH === K210 : , για κάθε ri ,,2,1 K= , ισοδύναμα μπορεί να γραφτεί, :0H για κάθε κατηγορία i, η αναλογία είναι ανεξάρτητη από τον υποπληθυσμό. Θυμηθείτε επίσης την ερμηνεία της ανεξαρτησίας μέσω των σχέσεων

)()|( iji APBAP = . Ας ολοκληρώσουμε τώρα τον έλεγχο του παραδείγματός μας.

Στον πίνακα συνάφειας που ακολουθεί, για κάθε i και j , φαίνεται η παρατηρηθείσα συχνότητα ijO , και μέσα σε παρένθεση φαίνεται η αντίστοιχη ijE που υπολογίζεται

όπως στον έλεγχο 2X ανεξαρτησίας από τον τύπο

νji

ij

CRE =ˆ ή

νν ji

ij

RE =ˆ .

Πράγματι,

62.281000

90318ˆ11 =

⋅=E , 6.63

1000200318ˆ

12 =⋅

=E , κ.ο.κ.

Ηλικιακή ομάδα 1 2 3 4 5 18-24 25-34 35-49 50-64 65≥

Σύνολα Γραμμών

<3 18 (28.62)

50 (63.6)

100 (98.58)

60 (73.14)

90 (54.06) 318

3 45 (40.05)

80 (89)

180 (137.95)

100 (102.35)

40 (75.65) 445

Ημερήσια κατανάλωση

καφέ > 3 27

(21.33) 70

(47.4) 30

(73.47) 70

(54.51) 40

(40.29) 237

90 200 310 230 170 1000

Page 31: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 501

Επειδή για κάθε i και j είναι 5ˆ ≥ijE , μπορούμε να κάνουμε έλεγχο 2X ομογένειας. Έτσι, έχουμε

7.10629.40

)29.4040(...62.28

)62.2818( 222 =

−++

−=X .

Η απορριπτική περιοχή του ελέγχου είναι

205.0);15)(13(

,

22

ˆ)ˆ(

−−∀

>−

= ∑ χji ij

ijij

E

EOX ή 507.15ˆ

)ˆ(

,

22 >

−= ∑

∀ ji ij

ijij

E

EOX

και επειδή 507.157.106 > , δηλαδή, επειδή η τιμή 106.7 της στατιστικής συνάρτησης ελέγχου είναι μεγαλύτερη της κρίσιμης τιμής 507.152

05.0;8 =χ (που παίρνουμε από

τον πίνακα της 2χ κατανομής για 8)15)(13( =−− βαθμούς ελευθερίας και 05.0=α ), η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 5%, απορρίπτεται και

επομένως τα συγκεκριμένα πειραματικά δεδομένα, σε επίπεδο σημαντικότητας 5%, δίνουν στατιστικά σημαντικές αποδείξεις ότι υπάρχουν δύο τουλάχιστον ηλικιακές ομάδες με διαφορετικά ποσοστά (αναλογίες) σε μια τουλάχιστον κατηγορία, ή αλλιώς, ότι οι πέντε ηλικιακές ομάδες δεν είναι ομογενείς ως προς την ημερήσια κατανάλωση καφέ, δηλαδή, τα 5 δείγματα δεν προέρχονται από τον ίδιο πληθυσμό. Η πιθανότητα το συμπέρασμα αυτό να είναι λάθος, είναι το πολύ 0.05. Ας δούμε ένα ακόμη παράδειγμα. Παράδειγμα 14.8: Σε μια έρευνα για τα ποσοστά δημοτικότητας ενός δημάρχου σε τέσσερα δημοτικά διαμερίσματα, επιλέξαμε με βάση ένα σχέδιο τυχαίας δειγματοληψίας (που λαμβάνει υπόψη και το μέγεθος κάθε διαμερίσματος), 200 κατοίκους από το 1ο δημοτικό διαμέρισμα, 280 από το 2ο , 150 από το 3ο και 110 από το 4ο. Κάθε κάτοικος που επελέγη ρωτήθηκε αν κρίνει θετικά ή αρνητικά το έργο του δημάρχου. Τα δεδομένα που προέκυψαν από τις απαντήσεις που πήραμε, φαίνονται στον πίνακα που ακολουθεί.

Δημοτικό διαμέρισμα 1 2 3 4

Θετική 18 50 100 60 Γνώμη Αρνητική 45 80 180 100 200 280 150 110

Με βάση αυτά τα δεδομένα, να ελέγξετε σε επίπεδο σημαντικότητας 05.0=α , αν το ποσοστό θετικής γνώμης για το έργο του δημάρχου είναι ίδιο στα τέσσερα δημοτικά διαμερίσματα ή υπάρχουν διαφοροποιήσεις.

Απάντηση: Τα αθροίσματα των στηλών, 2001 =ν , 2802 =ν , 1503 =ν , 1104 =ν , είναι προκαθορισμένα. Επομένως πρόκειται για τέσσερα πολυωνυμικά πειράματα. Ειδικότερα, πρόκειται για τέσσερα διωνυμικά πειράματα, αφού καθένα από τα δείγματα ταξινομείται σε δύο κατηγορίες: θετική γνώμη, αρνητική γνώμη. Ζητείται να κάνουμε σε επίπεδο σημαντικότητας 0.05, τον έλεγχο της μηδενικής υπόθεσης

:0H Το ποσοστό (αναλογία) θετικής γνώμης10 είναι ίδιο στα τέσσερα δημοτικά διαμερίσματα έναντι της εναλλακτικής,

10 και επομένως και αρνητικής γνώμης

Page 32: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 502

:1H όχι η 0H ή σε δύο τουλάχιστον δημοτικά διαμερίσματα το ποσοστό θετικής γνώμης δεν είναι ίδιο.

Αν jp η πιθανότητα (ποσοστό/αναλογία) θετικής γνώμης στο δημοτικό διαμέρισμα 4,3,2,1, =jj , τότε η 0H και η 1H γράφονται

43210 : ppppH === :1H δεν είναι όλα τα jp , 4,3,2,1=j ίσα.

Σημείωση 14.3.1: Επειδή οι κατηγορίες του χαρακτηριστικού «γνώμη για το έργο του δημάρχου» είναι μόνο δύο, για να συμβολίσουμε τις πιθανότητες ijp (μια τυχαία παρατήρηση από τον πληθυσμό cjj ,,2,1, K= , να ταξινομηθεί στην κατηγορία

rii ,,2,1, K= ), χρειάσθηκε μόνο ένας δείκτης. Οι αντίστοιχες πιθανότητες αρνητικής γνώμης συμβολίζονται με jq , 4,3,2,1=j .

Στον πίνακα συνάφειας που ακολουθεί, για κάθε i και j , φαίνεται η παρατηρηθείσα συχνότητα ijO και μέσα σε παρένθεση φαίνεται η αντίστοιχη εκτιμώμενη

αναμενόμενη (με βάση τη μηδενική υπόθεση) συχνότητα ijE που υπολογίζεται από

τον τύπο, νν jiij RE =ˆ . Πράγματι,

7.102740

200380ˆ11 =

⋅=E , 78.143

740280380ˆ

12 =⋅

=E , κ.ο.κ.

Δημοτικό διαμέρισμα

1 2 3 4 Σύνολα γραμμών

Θετική 120 (102.7)

130 (143.78

60 (77.03)

70 (56.49) 380

Γνώμη Αρνητική 80

(97.3) 150

(136.22) 90

(72.97) 40

(53.51) 360

200 280 150 110 740

Επειδή για κάθε i και j είναι 5ˆ ≥ijE , κάνουμε έλεγχο 2X ομογένειας. Έτσι, έχουμε

087.2351.53

)51.5340(...7.102

)7.102120( 222 =

−++

−=X .

Η απορριπτική περιοχή του ελέγχου είναι

205.0);14)(12(

,

22

ˆ)ˆ(

−−∀

>−

= ∑ χji ij

ijij

E

EOX ή 815.7ˆ

)ˆ(

,

22 >

−= ∑

∀ ji ij

ijij

E

EOX

και επειδή 815.7087.23 > , δηλαδή, επειδή η τιμή 23.087 της στατιστικής συνάρτησης ελέγχου είναι μεγαλύτερη της κρίσιμης τιμής 815.72

05.0;3 =χ (που

παίρνουμε από τον πίνακα της 2χ κατανομής για 3)14)(12( =−− βαθμούς ελευθερίας και 05.0=α ), η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 5%, απορρίπτεται και επομένως τα συγκεκριμένα δεδομένα, σε επίπεδο σημαντικότητας 5%, δίνουν στατιστικά σημαντικές αποδείξεις ότι υπάρχουν δύο τουλάχιστον δημοτικά διαμερίσματα με διαφορετικά ποσοστά (αναλογίες) θετικής γνώμης για το

Page 33: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 503

έργο του δημάρχου, ή αλλιώς, ότι τα τέσσερα δημοτικά διαμερίσματα δεν είναι ομογενή ως προς τη γνώμη των κατοίκων για το έργο του δημάρχου, δηλαδή, τα τέσσερα δείγματα δεν προέρχονται από τον ίδιο πληθυσμό. Η πιθανότητα το συμπέρασμα αυτό να είναι λάθος, είναι το πολύ 0.05. Το συμπέρασμα θα μπορούσε επίσης να διατυπωθεί ως εξής: τα συγκεκριμένα δεδομένα, σε επίπεδο σημαντικότητας 5%, δίνουν στατιστικά σημαντικές αποδείξεις ότι το ποσοστό θετικής γνώμης για το έργο του δημάρχου δεν είναι ανεξάρτητο από το δημοτικό διαμέρισμα! Παρατήρηση 14.3.1: Στην περίπτωση που 2== cr , δηλαδή στην περίπτωση που μελετάμε δύο διωνυμικά πειράματα ο πίνακας συνάφειας είναι 22x (δες Πίνακα 14.3.2).

Δείγμα-1 Δείγμα-2 Σύνολα γραμμών

1A :Επιτυχία 11Q 12Q 1R

2A :Αποτυχία 21Q 22Q 2R 1ν 2ν

Πίνακα 14.3.2

Αν συμβολίσουμε με 1p την πιθανότητα (ποσοστό/αναλογία) επιτυχίας στον υποπληθυσμό-1 και με 2p την πιθανότητα (ποσοστό/αναλογία) επιτυχίας στον υποπληθυσμό-2 (και επομένως με 1q την πιθανότητα αποτυχίας στον υποπληθυσμό-1 και με 2q την πιθανότητα αποτυχίας στον υποπληθυσμό-2), τότε ο έλεγχος ομογένειας, δηλαδή, ο έλεγχος της μηδενικής υπόθεσης

210 : ii ppH = , για κάθε 2,1=i έναντι της εναλλακτικής

211 : ii ppH ≠ , για τουλάχιστον ένα i γράφεται

210 : ppH = και 21 qq =

211 : ppH ≠ ή 21 qq ≠ ή ισοδύναμα,

210 : ppH =

211 : ppH ≠ .

Πρόκειται δηλαδή για έλεγχο σύγκρισης δύο διωνυμικών ποσοστών, 1p και 2p . Έτσι αν λάβουμε υπόψη μας την Παρατήρηση 14.1.3 για την ισοδυναμία του Ζ ελέγχου για διωνυμικό ποσοστό με τον έλεγχο 2X καλής προσαρμογής, είναι λογικό να περιμένουμε ο Ζ έλεγχος για τη σύγκριση δύο διωνυμικών ποσοστών να είναι ισοδύναμος, με τον έλεγχο 2X ομογένειας. Περιμένουμε δηλαδή, οι δύο αυτοί έλεγχοι να δίνουν ίδιο αποτέλεσμα. Πράγματι έτσι είναι. Ας δούμε ένα σχετικό παράδειγμα. Παράδειγμα 14.9 (συνέχεια του Παραδείγματος 12.9): Στο περιοδικό journal of Biology δημοσιεύθηκαν τα αποτελέσματα μιας έρευνας για το ποσοστό, 1p , των ψαριών στη Μεσόγειο και το ποσοστό, 2p , των ψαριών στον Ατλαντικό που έχουν προσβληθεί από παράσιτα. Στη Μεσόγειο, από 588 τυχαία επιλεγμένα ψάρια που εξετάσθηκαν

Page 34: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 504

βρέθηκαν μολυσμένα από παράσιτα τα 211 ενώ στον Ατλαντικό, από 123 τυχαία επιλεγμένα ψάρια που εξετάσθηκαν, βρέθηκαν μολυσμένα από παράσιτα τα 26. Σε επίπεδο σημαντικότητας 0.05, τα ευρήματα στα δύο δείγματα δίνουν στατιστικά σημαντικές αποδείξεις ότι το ποσοστό των ψαριών στη Μεσόγειο που έχουν προσβληθεί από παράσιτα δεν είναι ίδιο με το ποσοστό των ψαριών στον Ατλαντικό που έχουν προσβληθεί από παράσιτα; Απάντηση: Πρόκειται για έλεγχο σύγκρισης δύο διωνυμικών ποσοστών. Πρέπει να κάνουμε, σε επίπεδο σημαντικότητας 5%, τον έλεγχο της μηδενικής υπόθεσης

210 : ppH = έναντι της εναλλακτικής

211 : ppH ≠ . 1ος τρόπος: Στο Παράδειγμα 12.9 κάναμε τον έλεγχο αυτό με απορριπτική περιοχή

( )96.1

11ˆ1ˆ

ˆˆ025.0

21

21 =≥

⎟⎟⎠

⎞⎜⎜⎝

⎛+−

−= z

nnpp

ppz

και βρήκαμε

( )96.122.3

11ˆ1ˆ

ˆˆ

21

21 ≥=

⎟⎟⎠

⎞⎜⎜⎝

⎛+−

−=

nnpp

ppz .

Έτσι, σε επίπεδο σημαντικότητας 5% απορρίψαμε τη μηδενική υπόθεση και συμπεράναμε ότι τα συγκεκριμένα ευρήματα στα δύο δείγματα δίνουν στατιστικά σημαντικές αποδείξεις ότι το ποσοστό των ψαριών στη Μεσόγειο που έχουν προσβληθεί από παράσιτα δεν είναι ίδιο με το ποσοστό των ψαριών στον Ατλαντικό που έχουν προσβληθεί από παράσιτα. Η πιθανότητα το συμπέρασμα αυτό να είναι λάθος, είναι το πολύ 0.05.

2ος τρόπος: Για τον έλεγχο των δύο ποσοστών θα κάνουμε έλεγχο 2X ομογένειας. Στον πίνακα συνάφειας που ακολουθεί, για κάθε i και j , φαίνεται η παρατηρηθείσα συχνότητα ijO και μέσα σε παρένθεση φαίνεται η αντίστοιχη εκτιμώμενη

αναμενόμενη (με βάση τη μηδενική υπόθεση) συχνότητα ijE .

Δείγμα-1 (από Μεσόγειο)

Δείγμα-2 (από Ατλαντικό)

Σύνολα γραμμών

Μολυσμένα 211 (196)

26 (41) 237

Όχι μολυσμένα 377 (392)

97 (82) 474

588 123 711

Επειδή για κάθε i και j είναι 5ˆ ≥ijE , μπορούμε να κάνουμε έλεγχο 2X ομογένειας, έτσι, έχουμε

954.982

)8297(41

)4126(392

)392377(196

)196211( 22222 =

−+

−+

−+

−=X .

Η απορριπτική περιοχή του ελέγχου είναι

Page 35: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 505

205.0);12)(12(

,

22

ˆ)ˆ(

−−∀

>−

= ∑ χji ij

ijij

E

EOX ή 84.3ˆ

)ˆ(

,

22 >

−=∑

∀ ji ij

ijij

E

EOX

και επειδή 84.3954.9 > η μηδενική υπόθεση, σε επίπεδο σημαντικότητας 5%, απορρίπτεται και επομένως τα συγκεκριμένα ευρήματα στα δύο δείγματα, σε επίπεδο σημαντικότητας 5%, δίνουν στατιστικά σημαντικές αποδείξεις ότι το ποσοστό των ψαριών στη Μεσόγειο που έχουν προσβληθεί από παράσιτα δεν είναι ίδιο με το ποσοστό των ψαριών στον Ατλαντικό που έχουν προσβληθεί από παράσιτα. Η πιθανότητα το συμπέρασμα αυτό να είναι λάθος, είναι το πολύ 0.05. Πράγματι λοιπόν, το συμπέρασμα και με τους δύο ελέγχους είναι το ίδιο. Παρατηρείστε τις τιμές της στατιστικής συνάρτησης ελέγχου στις δύο περιπτώσεις. Είναι 22.3=z και 954.92 =X αντίστοιχα, δηλαδή 954.922.3 222 =≈= Xz . Παρατηρείστε επίσης, ότι για τις κρίσιμες τιμές των δύο ελέγχων είναι

205.0;1

22025.0 84.396.1)( χ=≈=z .

Σημείωση 14.3.2: α) Στην περίπτωση που ο πίνακας συνάφειας είναι 22x , όπως στο προηγούμενο παράδειγμα, και άρα ο έλεγχος γίνεται με 1)12)(12( =−− βαθμό ελευθερίας, προτείνεται να γίνεται η διόρθωση συνέχειας του Yates (όπως και στον έλεγχο 2X καλής προσαρμογής με ένα βαθμό ελευθερίας (Σημείωση 14.1.2)). β) Επίσης, όταν ο πίνακας συνάφειας είναι 22x και υπάρχει μία τουλάχιστον αναμενόμενη συχνότητα μικρότερη του 5 οπότε δε μπορεί να γίνει έλεγχος 2X , προτείνεται να γίνεται ο ακριβής έλεγχος Fisher (Fisher’s exact test)11.

11 Δε θα επεκταθούμε περισσότερο.

Page 36: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 506

Προβλήματα και Ασκήσεις

1. Στη βιβλιογραφία αναφέρεται ότι τα ποσοστά των ομάδων αίματος Α, Β, ΑΒ και

Ο σε έναν πληθυσμό είναι, 0.41, 0.10, 0.04 και 0.45, αντίστοιχα. Μια ομάδα ερευνητών, προκειμένου να ελέγξει αν τα ποσοστά των ομάδων αίματος σε αυτόν τον πληθυσμό είναι πράγματι αυτά που αναφέρονται στην βιβλιογραφία, επέλεξε τυχαία 200 άτομα από αυτόν τον πληθυσμό και για καθένα κατέγραψε την ομάδα αίματός του. Στον πίνακα που ακολουθεί φαίνεται η συχνότητα κάθε ομάδας αίματος που παρατηρήθηκε στο δείγμα.

Ομάδα αίματος

Α Β ΑΒ Ο Παρατηρηθείσα

συχνότητα 89 18 12 81 Σε επίπεδο σημαντικότητας 5%, τα ποσοστά που παρατηρούνται στο δείγμα συμφωνούν ή όχι, με τα αντίστοιχα ποσοστά που αναφέρονται στη βιβλιογραφία;

2. Ένας ερευνητής σχεδίασε και εκτέλεσε το εξής πείραμα: σε έναν κλειστό διάδρομο στο τέλος του οποίου υπήρχαν τρεις έξοδοι διαφορετικού χρώματος (πράσινου, κόκκινου και μπλε αντίστοιχα), απελευθέρωσε ένα ποντίκι 90 φορές και κατέγραψε πόσες φορές αυτό διέφυγε από την πράσινη έξοδο, πόσες από την κόκκινη και πόσες από τη μπλε. Η συχνότητα που παρατηρήθηκε για κάθε έξοδο διαφυγής φαίνεται στον πίνακα που ακολουθεί.

Έξοδος διαφυγής

Πράσινη Κόκκινη Μπλε Παρατηρηθείσα

συχνότητα 20 39 31 Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν αυτά τα πειραματικά δεδομένα ότι το ποντίκι δε δείχνει την ίδια προτίμηση και για τις τρεις εξόδους;

3. Μια εταιρεία προκειμένου να επιλέξει το όνομα ενός νέου προϊόντος της, έκανε

μια έρευνα για να ελέγξει κατά πόσο τέσσερα ονόματα, έστω Α, Β, Γ, Δ, που έχουν προταθεί, είναι εξίσου ελκυστικά. Ρωτήθηκαν 100 τυχαία επιλεγμένοι δυνητικοί αγοραστές του προϊόντος να δηλώσουν ποιο από τα τέσσερα ονόματα είναι κατά τη γνώμη τους το καλύτερο. Τα αποτελέσματα που προέκυψαν φαίνονται στον πίνακα που ακολουθεί.

Όνομα Α Β Γ Δ Παρατηρηθείσα

συχνότητα 24 26 21 29 Σε επίπεδο σημαντικότητας 5%, υποστηρίζουν αυτά τα δεδομένα ότι οι καταναλωτές δε δείχνουν την ίδια προτίμηση και για τα τέσσερα υποψήφια ονόματα;

4. Μια έρευνα που έγινε πριν τρία χρόνια για την ανάλυση των προτιμήσεων των καταναλωτών στα είδη καθημερινής συντήρησης του νοικοκυριού (απορρυπαντικά, καθαριστικά, χαρτικά) έδειξε ότι το 70% των σχετικών πωλήσεων ήταν προϊόντα επώνυμων εταιρειών, το 22% ήταν προϊόντα ιδιωτικής

Page 37: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 507

ετικέτας και το 8% ήταν απομιμήσεις (no name). Προκειμένου να ελέγξετε αν αυτά τα ποσοστά ισχύουν ακόμη, επιλέξατε (με βάση ένα σχέδιο τυχαίας δειγματοληψίας) 500 προϊόντα αυτής της κατηγορίας από τις πωλήσεις του τελευταίου τριμήνου και βρήκατε ότι 310 από αυτά ήταν επώνυμων εταιρειών, 130 ήταν ιδιωτικής εταιρείας και 60 ήταν απομιμήσεις. Τι λέτε, αυτά τα δεδομένα δίνουν, σε επίπεδο σημαντικότητας 0.05, στατιστικά σημαντικές αποδείξεις ότι τα ποσοστά που είχαν προκύψει από την προ τριετίας έρευνα έχουν πλέον αλλάξει;

5. Ένας ερευνητής μέτρησε την τιμή ένας αιματολογικού δείκτη 100 ζώων, τυχαία επιλεγμένων, από μια μεγάλη κτηνοτροφική μονάδα. Τις παρατηρήσεις που πήρε τις ομαδοποίησε σε πέντε κλάσεις αφού προηγουμένως τις τυποποίησε (από κάθε μια αφαίρεσε τη μέση τιμή τους και διαίρεσε τη διαφορά που προέκυψε με την τυπική απόκλισή τους). Προέκυψε, έτσι, ο ακόλουθος πίνακας συχνοτήτων.

Τιμή του δείκτη (τυποποιημένη)

Παρατηρηθείσα συχνότητα

< -1.5 8 [-1.5, -0.5) 20 [-0.5, 0.5) 40 [0.5, 1.5) 29 ≥ 1.5 3

Σε επίπεδο σημαντικότητας 5%, μπορούμε να ισχυρισθούμε ότι οι τυποποιημένες τιμές του δείγματος προέρχονται από την τυποποιημένη κανονική κατανομή;

6. Στην εικόνα που ακολουθεί φαίνονται οι θέσεις 168 φρεατίων έρευνας για κοίτασμα πετρελαίου σε μια περιοχή του Texas.

Η περιοχή έχει διαιρεθεί σε 1601610 =x τμήματα σχήματος τετραγώνου και εμβαδού 10mi2 το καθένα. Ο πίνακας συχνοτήτων της χωροδιάταξης των φρεατίων είναι ο ακόλουθος:

Αριθμός

φρεατίων ανά τμήμα

Παρατηρηθείσα συχνότητα

0 70 1 42 2 26 3 17 4 3 5 1 ≥ 6 1

Σύνολο 160

Page 38: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 508

Να ελέγξετε, σε επίπεδο σημαντικότητας 5%, αν η χωροδιάταξη των φρεατίων περιγράφεται από μια κατανομή Poisson.

7. Ένας ερευνητής μέτρησε σε μια πλάκα Petri τον αριθμό βακτηρίων ανά τετραγωνίδιο εμβαδού 1cm2. Στον πίνακα που ακολουθεί φαίνονται τα αποτελέσματα των μετρήσεων σε 50 τέτοια τετραγωνίδια.

Αριθμός

βακτηρίων/cm2 Παρατηρηθείσα

συχνότητα 0 4 1 15 2 16 3 12 4 2 ≥ 5 1

Σύνολο 50 Να ελέγξετε, σε επίπεδο σημαντικότητας 5%, αν ο αριθμός των βακτηρίων/cm2

περιγράφεται από την κατανομή Poisson με μέση τιμή 2 βακτήρια/cm2.

8. Από κατάλληλη διασταύρωση φυτών πετούνιας προκύπτουν, ως προς το χρώμα του άνθους και το σχήμα του φύλλου, οι εξής τέσσερις τύποι φυτών: ΑΒ (κόκκινα άνθη και στρογγυλά φύλλα), Αb (κόκκινα άνθη και μακρόστενα φύλλα), aΒ (λευκά άνθη και στρογγυλά φύλλα) και ab (λευκά άνθη και μακρόστενα φύλλα). Σύμφωνα με το μοντέλο κληρονομικότητας του Mendel, οι τέσσερις τύποι απογόνων, AB, Ab, aB και ab πρέπει να βρίσκονται σε αναλογία 9:3:3:1. Σε ένα σχετικό πείραμα, από 160 πειραματικά φυτά, τα 95 βρέθηκαν να είναι τύπου AB, τα 30 τύπου Ab, τα 28 τύπου aB και τα 7 τύπου ab. Σε επίπεδο σημαντικότητας 1%, αυτά τα πειραματικά δεδομένα δίνουν άραγε σημαντικές αποδείξεις εναντίον του μοντέλου κληρονομικότητας του Mendel; Σε επίπεδο σημαντικότητας 5%;

9. Μια βιομηχανία τροφίμων παράγει από τρεις γραμμές παραγωγής Γ1, Γ2 και Γ3,

ελαφρά συμπυκνωμένο χυμό τομάτας σε συσκευασίες των 200gr. Το τμήμα ποιοτικού ελέγχου της βιομηχανίας, όταν διαπιστώνει ότι κάποιο προϊόν είναι ελαττωματικό το κατατάσσει σε μία από τέσσερις κατηγορίες Α1, Α2, Α3 ή Α4, ανάλογα με το είδος και τη σοβαρότητα των ελαττωμάτων που παρουσιάζει. Επίσης, καταγράφει από ποια γραμμή παραγωγής παρήχθη. Στον πίνακα που ακολουθεί φαίνεται πώς κατανέμονται 309 προϊόντα που βρέθηκαν ελαττωματικά στις τέσσερις κατηγορίες Α1, Α2, Α3, Α4 και στις τρεις γραμμές παραγωγής Γ1, Γ2, Γ3.

Γραμμή Παραγωγής

Γ1 Γ2 Γ3 Α1 15 26 33 Α2 21 31 17 Α3 45 34 49

Κατηγορία κατάταξης

Α4 13 5 20 Σε επίπεδο σημαντικότητας 5%, δίνουν αυτά τα δεδομένα σημαντικές αποδείξεις ότι η κατηγορία κατάταξης ενός ελαττωματικού προϊόντος εξαρτάται από το ποια γραμμή παραγωγής προέρχεται;

Page 39: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 509

10. Ένας ερευνητής, για να ελέγξει αν η ανθεκτικότητα ενός συγκεκριμένου είδους φυτού σε κάποια συγκεκριμένη ασθένεια σχετίζεται με το μέγεθός του, πήρε ένα τυχαίο δείγμα 100 φυτών αυτού του είδους, τα κατέταξε ως προς το μέγεθος τους σε «μεγάλα» και «μικρά» και εξέτασε αν έχουν προσβληθεί ή όχι από την συγκεκριμένη ασθένεια. Ο αριθμός των φυτών σε κάθε κατηγορία φαίνεται στον πίνακα που ακολουθεί.

Μέγεθος Μεγάλα Μικρά

Ναι 15 15 Αρρώστησαν Όχι 25 45 Σε επίπεδο σημαντικότητας 5%, δίνουν αυτά τα δεδομένα σημαντικές αποδείξεις ότι η ανθεκτικότητα των φυτών εξαρτάται από το μέγεθός τους;

11. Ρωτήσαμε καθέναν από 200 ενήλικες κατοίκους μιας μικρής επαρχιακής πόλης τους οποίους επιλέξαμε με βάση ένα σχέδιο τυχαίας δειγματοληψίας, αν είναι καπνιστής, περιστασιακός καπνιστής, πρώην καπνιστής ή μη καπνιστής. Τα δεδομένα που συγκεντρώσαμε φαίνονται στον πίνακα που ακολουθεί.

Συνήθεια ως προς το κάπνισμα

Καπνιστής Περιστασιακός καπνιστής

Πρώην καπνιστής

Μη καπνιστής

Άνδρας 40 14 10 60 Φύλο Γυναίκα 20 4 4 48 Με βάση αυτά τα δεδομένα, να ελέγξετε σε επίπεδο σημαντικότητας 5%, αν υπάρχει συνάφεια/εξάρτηση μεταξύ φύλου και συνήθειας των κατοίκων της συγκεκριμένης πόλης ως προς το κάπνισμα.

12. Στο πλαίσιο μιας έρευνας αγοράς, ρωτήθηκε καθένας από 670 δυνητικούς αγοραστές ενός νέου προϊόντος να δηλώσει ποιο από τρία μοντέλα (Μ1, Μ2, Μ3) του νέου προϊόντος προτιμά καθώς και να κατατάξει τον εαυτό του σε έναν από τέσσερις τύπους καταναλωτή που του προτάθηκαν (Τ1, Τ2, Τ3, Τ4).

Τύπος καταναλωτή Τ1 Τ2 Τ3 Τ4

Μ1 20 22 56 38 Μ2 40 44 68 42 Μοντέλο Μ3 80 90 75 95

Με βάση αυτά τα δεδομένα, να ελέγξετε σε επίπεδο σημαντικότητας 5%, αν υπάρχει εξάρτηση μεταξύ τύπου καταναλωτή και προτίμησης μοντέλου.

13. Από καθένα από τρία συνοικιακά super market Α1, Α2 και Α3, επιλέξαμε, με βάση ένα σχέδιο τυχαίας δειγματοληψίας, ένα δείγμα 200 πελατών (ένα δείγμα από κάθε super market) και ρωτήσαμε αν θα αγόραζαν βιολογικά όσπρια, εφόσον αυτά υπήρχαν στα ράφια του super market. Για κάθε super market, οι απαντήσεις των πελατών (ναι, όχι, ίσως) δίνονται στον πίνακα που ακολουθεί.

Super market Α1 Α2 Α3

Ναι 21 78 94 Όχι 101 63 27 Πρόθεση

για αγορά Ίσως 78 59 79

Page 40: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 510

α) Με βάση τα αποτελέσματα αυτής της έρευνας, και σε επίπεδο σημαντικότητας 5%, τι μπορούμε να συμπεράνουμε για τις προθέσεις των πελατών στα τρία super market (ως προς το αν θα αγόραζαν βιολογικά όσπρια). β) Εξηγείστε τι ακριβώς ελέγξατε στο ερώτημα (α).

14. Θέλουμε να ελέγξουμε αν οι παράμετροι CBA ppp ,, τριών διωνυμικών πληθυσμών Α, Β και C, αντίστοιχα, είναι ίσες ή όχι. Για το σκοπό αυτό πήραμε τρία ανεξάρτητα τυχαία δείγματα, ένα από κάθε πληθυσμό, μεγέθους 100 το καθένα. Τα δεδομένα που συγκεντρώσαμε φαίνονται στον πίνακα που ακολουθεί.

Πληθυσμός

Α Β C Αριθμός επιτυχιών 26 21 35 Αριθμός αποτυχιών 74 79 65

Να διατυπώσετε και να κάνετε κατάλληλο στατιστικό έλεγχο (σε επίπεδο σημαντικότητας 5%). Για τι έλεγχο πρόκειται;

15. Στο πλαίσιο μιας έρευνας για τη διερεύνηση παραγόντων που επηρεάζουν την επιθετικότητα των ποντικιών έγινε, μεταξύ άλλων, το εξής πείραμα. Επελέγησαν τυχαία 140 νεογέννητα ποντίκια και αμέσως μετά τη γέννηση τους απομακρύνθηκαν από τις φυσικές τους μητέρες και δόθηκαν σε «θετές μητέρες». Εκατόν εξήντα επτά άλλα νεογέννητα ποντίκια, τα οποία επελέγησαν επίσης τυχαία, αφέθηκαν να μεγαλώσουν με τις φυσικές τους μητέρες. Όταν, κάθε ποντίκι, συμπλήρωνε τρεις μήνες ζωής, οι ερευνητές το έκλειναν σε ένα μικρό κλουβί μαζί με ένα άλλο ποντίκι που δεν είχε ξαναδεί. Στη συνέχεια παρατηρούσαν το ποντίκι για προκαθορισμένο χρονικό διάστημα (έξι λεπτών) και κατέγραφαν αν εκδήλωσε ή όχι επιθετική συμπεριφορά. Τα δεδομένα που προέκυψαν, φαίνονται στον πίνακα που ακολουθεί.

Μητέρα Φυσική Θετή

Ναι 27 47 Επιθετική συμπεριφορά Όχι 140 93

Σε επίπεδο σημαντικότητας 5%, μπορούμε, με βάση αυτά τα πειραματικά δεδομένα, να συμπεράνουμε ότι α) η πρόωρη απομάκρυνση των ποντικιών από τις φυσικές τους μητέρες επηρεάζει την εκδήλωση επιθετικής συμπεριφοράς στο μέλλον; (ο έλεγχος να γίνει με δύο τρόπους), β) το ποσοστό των ποντικιών που εκδηλώνουν επιθετική συμπεριφορά και έχουν απομακρυνθεί πρόωρα από τις φυσικές τους μητέρες είναι μεγαλύτερο από το ποσοστό των ποντικιών που εκδηλώνουν επιθετική συμπεριφορά και δεν έχουν απομακρυνθεί πρόωρα από τις φυσικές τους μητέρες;

16. Συνέχεια του Προβλήματος 6.21: Από μια συγκεκριμένη διασταύρωση μπιζελιών (φυτά που έχουν στρογγυλούς κίτρινους σπόρους με φυτά που έχουν ρυτιδωμένους πράσινους σπόρους) παράγονται απόγονοι τεσσάρων ειδών. Στρογγυλοί κίτρινοι, στρογγυλοί πράσινοι ρυτιδωμένοι κίτρινοι και ρυτιδωμένοι πράσινοι. Σύμφωνα με το μοντέλο κληρονομικότητας του Mendel τα τέσσερα είδη απογόνων πρέπει να βρίσκονται σε αναλογία 9:3:3:1 αντίστοιχα. Σε ένα κλασσικό πείραμα του Mendel, από μια τέτοια διασταύρωση προέκυψαν 556 απόγονοι από τους οποίους 315 βρέθηκαν στρογγυλοί κίτρινοι, 108 στρογγυλοί

Page 41: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 511

πράσινοι, 101 ρυτιδωμένοι κίτρινοι και 32 ρυτιδωμένοι πράσινοι. Αυτά τα πειραματικά δεδομένα υποστηρίζουν άραγε (σε επίπεδο σημαντικότητας 0.01) το μοντέλο κληρονομικότητας του Mendel ή μήπως δημιουργούν αμφιβολίες;

17. Μια ομάδα ερευνητών για να μελετήσει την εξάπλωση μιας ασθένειας (υφέρπουσα σήψη) στις φυτικές καλλιέργειες, διαίρεσε μια καλλιέργεια λάχανου σε 270 τετράγωνα τμήματα καθένα από τα οποία περιείχε τον ίδιο αριθμό λάχανων και κατέγραψε, ανά τμήμα, τον αριθμό των φυτών που παρουσίαζαν σημάδια υφέρπουσας σήψης. Τα αποτελέσματα των μετρήσεων στα 270 τμήματα της καλλιέργειας δίνονται στον πίνακα συχνοτήτων που ακολουθεί.

Αριθμός φυτών

που έχουν προσβληθεί/τμήμα

Παρατηρηθείσα συχνότητα

0 38 1 57 2 68 3 47 4 23 5 9 6 10 7 7 8 3 9 4

10 2 ≥ 11 2

Σύνολο 270

Να ελέγξετε, σε επίπεδο σημαντικότητας 5%, αν ο αριθμός των φυτών που παρουσιάζουν σημάδια υφέρπουσας σήψης (ανά τμήμα) περιγράφεται από μια κατανομή Poisson. Πώς μπορούμε να εξηγήσουμε το αποτέλεσμα αυτού του ελέγχου;

18. Συνέχεια του Προβλήματος 6.19: Στο Πρόβλημα 6.19 δίνεται ότι από τις αιτήσεις

υποψηφίων για εγγραφή σε ένα πανεπιστήμιο, το 60% γίνονται δεκτές, το 35% δε γίνονται δεκτές και το 5% γίνονται δεκτές υπό κάποιες προϋποθέσεις. Από 500 αιτήσεις που έγιναν φέτος, δεκτές χωρίς προϋποθέσεις έγιναν οι 329, δεκτές με προϋποθέσεις έγιναν οι 43 και οι υπόλοιπες δεν έγιναν δεκτές. α) Σε επίπεδο σημαντικότητας 0.05, συμφωνούν αυτά τα δεδομένα με τα ποσοστά επιτυχίας στο συγκεκριμένο πανεπιστήμιο ή μήπως φέτος κάτι έχει αλλάξει; β) Σε επίπεδο σημαντικότητας 0.05, υποστηρίζουν αυτά τα δεδομένα ότι το ποσοστό των αιτήσεων που έγιναν φέτος δεκτές υπό προϋποθέσεις δεν είναι 5% αλλά μεγαλύτερο;

19. Συνέχεια του Προβλήματος 6.20: Στο Πρόβλημα 6.20 δίνεται ότι πανελλαδική

έρευνα που έγινε πριν ένα έτος για τη διερεύνηση της στάσης των νέων ηλικίας 18-25 ετών απέναντι στην απαγόρευση του καπνίσματος σε δημόσιους χώρους, έδωσε τα ακόλουθα αποτελέσματα.

Στάση απέναντι στην απαγόρευση του καπνίσματος

Πολύ αρνητική Αρνητική Αδιάφορη Θετική Πολύ θετική 11.6% 21.1% 11.2% 32.5% 23.6%

Page 42: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 512

Από 100 νέους ηλικίας 18-25 ετών που πρόσφατα ρωτήσαμε (και επιλέξαμε με βάση ένα σχέδιο τυχαίας δειγματοληψίας) οι 10 απάντησαν ότι είναι πολύ αρνητικοί στην απαγόρευση του καπνίσματος σε δημόσιους χώρους, οι 25 ότι είναι αρνητικοί, οι 10 ότι τους αφήνει αδιάφορους μια τέτοια απαγόρευση, οι 30 ότι είναι θετικοί και οι 25 ότι είναι πολύ θετικοί. Σε επίπεδο σημαντικότητας 0.05, συμφωνούν αυτά τα δεδομένα με τα ποσοστά που προέκυψαν από την προ ενός έτους πανελλαδική έρευνα;

20. Από το αρχείο ενός μεγάλου μαιευτηρίου επιλέξαμε, με βάση ένα σχέδιο τυχαίας

δειγματοληψίας, 70 ιατρικούς φακέλους εγκύων και από κάθε φάκελο καταγράψαμε τη διάρκεια κύησης (σε ημέρες). Τα δεδομένα που προέκυψαν φαίνονται στον πίνακα που ακολουθεί. Υποστηρίζουν αυτά τα δειγματοληπτικά δεδομένα ότι η διάρκεια της κύησης ακολουθεί μια κανονική κατανομή; Να κάνετε κατάλληλο στατιστικό έλεγχο σε επίπεδο σημαντικότητας 0.05.

251 264 234 283 226 244 269 241 276 274 263 243 254 276 241 232 260 248 284 253 265 235 259 279 256 256 254 256 250 269 240 261 263 262 259 230 268 284 259 261 268 268 264 271 263 259 294 259 263 278 267 293 247 244 250 266 286 263 274 253 281 286 266 249 255 233 245 266 265 264

21. Συνέχεια της άσκησης 14.20: Σε μια πρόσφατη δημοσίευση αναφέρεται ότι ο

μέσος και η τυπική απόκλιση της διάρκειας της κύησης είναι 266 και 16 ημέρες αντίστοιχα. Αν δεχθούμε ότι πράγματι 266=μ ημέρες και 16=σ ημέρες, τα δεδομένα της άσκησης 14.20 υποστηρίζουν ότι η διάρκεια της κύησης ακολουθεί κανονική κατανομή με 266=μ και 16=σ ; Να κάνετε κατάλληλο στατιστικό έλεγχο σε επίπεδο σημαντικότητας 0.05.

22. Συνέχεια του Παραδείγματος 14.6: Η έρευνα για την αποτελεσματικότητα του

εμβολίου θα μπορούσε να γίνει ως εξής: σε 1ν τυχαία επιλεγμένους κατοίκους να μη χορηγηθεί το εμβόλιο, σε 2ν τυχαία επιλεγμένους κατοίκους να δοθεί μια δόση και σε 3ν επίσης τυχαία επιλεγμένους κατοίκους να χορηγηθούν και οι δύο δόσεις. Να σχολιάσετε (συγκριτικά) τους δύο πειραματικούς σχεδιασμούς.

23. Μια ερευνητική ομάδα επέλεξε (με βάση μια τυχαία διαδικασία) 450 μαθητές

Δημοτικού και για καθέναν κατέγραψε αν πήρε επαρκές ή μη επαρκές πρωινό και επίσης αν είχε ικανοποιητική ή μη ικανοποιητική συγκέντρωση κατά τα πρώτα 20 λεπτά της πρώτης ώρας μαθημάτων. Τα δεδομένα που προέκυψαν φαίνονται στον πίνακα που ακολουθεί.

Πρωινό Μη Επαρκές Επαρκές

Μη ικανοποιητική 122 50 Συγκέντρωση Ικανοποιητική 48 230 Σε επίπεδο σημαντικότητας 5%, μπορούμε, με βάση αυτά τα δεδομένα να συμπεράνουμε α) ότι η συγκέντρωση μαθητών επηρεάζεται/εξαρτάται από το αν παίρνουν επαρκές ή μη επαρκές πρωινό και β) ότι το ποσοστό των μαθητών με μη ικανοποιητική συγκέντρωση είναι μεγαλύτερο στους μαθητές που παίρνουν μη επαρκές πρωινό;

Page 43: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 513

Απαντήσεις

1. Σε επίπεδο σημαντικότητας 5%, δεν υποστηρίζουν ασυμφωνία αφού 70.32 =X ενώ 815.72

05.0;3 =χ .

2. Σε επίπεδο σημαντικότητας 5%, ναι, αφού 99.5067.6 205.0;2

2 =>= χX .

3. Σε επίπεδο σημαντικότητας 5%, όχι αφού 36.12 =X ενώ 815.7205.0;3 =χ

4. Σε επίπεδο σημαντικότητας 5%, ναι, αφού 99.522.18 205.0;2

2 =>= χX . 5. Σε επίπεδο σημαντικότητας 5%, δε μπορεί να απορριφθεί ο ισχυρισμός

αφού 047.42 =X ενώ 488.9205.0;4 =χ .

6. Σε επίπεδο σημαντικότητας 5%, απορρίπτεται η υπόθεση ότι η χωροδιάταξη περιγράφεται από μια κατανομή Poisson αφού 99.522.13 2

05.0;22 =>= χX

7. Σε επίπεδο σημαντικότητας 5%, δε μπορεί να απορριφθεί η υπόθεση ότι ο πληθυσμός ακολουθεί την κατανομή Poisson με μέση τιμή 2, αφού

1288.52 =X ενώ 488.9205.0;4 =χ .

8. Σε επίπεδο σημαντικότητας 1% αλλά και σε 5%, όχι, αφού 3111.12 =X ενώ 345.112

01.0;3 =χ και 815.7205.0;3 =χ , αντίστοιχα.

9. Σε επίπεδο σημαντικότητας 5%, ναι, αφού 592.1218.19 205.0;6

2 =>= χX .

10. Σε επίπεδο σημαντικότητας 5%, όχι, αφού 786.12 =X ενώ 841.3205.0;1 =χ .

11. Σε επίπεδο σημαντικότητας 5%, δεν υπάρχει συνάφεια/εξάρτηση αφού 88.42 =X και 815.72

05.0;3 =χ .

12. Σε επίπεδο σημαντικότητας 5%, ναι, αφού 592.1276.24 205.0;6

2 =>= χX 13. α) Σε επίπεδο σημαντικότητας 5%, τα δεδομένα δίνουν σημαντικές αποδείξεις

ότι σε δύο τουλάχιστον super market τα ποσοστά των απαντήσεων, για μία τουλάχιστον κατηγορία απάντησης, δεν είναι ίδια, αφού

488.9315.92 205.0;4

2 =>= χX β) Κάναμε έλεγχο ομογένειας τριών πληθυσμών (Α1, Α2, Α3) ως προς τρία πολυωνυμικά ποσοστά.

14. CBACBA qqqpppH ==== και:0 έναντι της 01 : HήίH ηςαληθναιεενΔ Σε επίπεδο σημαντικότητας 5%, η μηδενική υπόθεση δεν απορρίπτεται αφού

0682.52 =X ενώ 991.5205.0;2 =χ . Πρόκειται για έλεγχο ομογένειας τριών

πληθυσμών. 15. α) Σε επίπεδο σημαντικότητας 5%, ναι, αφού 841.361.12 2

05.0;12 =>= χX

(πρώτος τρόπος) και 96.146.3 025.0 =>= zz (δεύτερος τρόπος). β) Εργαζόμενοι με το δεύτερο τρόπο, προφανώς ναι (αφού η μηδενική απορρίπτεται στον αμφίπλευρο)

16. Δε δημιουργούν αμφιβολίες αφού 470.02 =X ενώ 345.11201.0;3 =χ .

17. Σε επίπεδο σημαντικότητας 5%, όχι, αφού 070.1175.46 205.0;5

2 =>= χX . Η χωροδιάταξη των φυτών που έχουν προσβληθεί δεν είναι τυχαία, η ασθένεια μάλλον είναι μεταδοτική (καταστρατηγείται, έτσι, η υπόθεση της ανεξαρτησίας).

18. α) Δε συμφωνούν αφού 991.538.28 205.0;2

2 =>= χX . β) 05.0:0 =pH έναντι της 05.0:1 >pH . Σε επίπεδο σημαντικότητας 0.05 απορρίπτεται η μηδενική αφού 645.169.3 05.0 =>= zz .

Page 44: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 514

19. Συμφωνούν αφού 34.12 =X ενώ 488.9205.0;4 =χ

20. Σε επίπεδο σημαντικότητας 5%, δεν απορρίπτεται η υπόθεση ότι η διάρκεια κύησης περιγράφεται από την )3.15,3.260( 2N αφού 276.42 =X και

815.7205.0;3 =χ .

21. Σε επίπεδο σημαντικότητας 5%, απορρίπτεται η υπόθεση ότι η διάρκεια κύησης περιγράφεται από την )16,266( 2N αφού 488.973.10 2

05.0;42 =>= χX .

22. Αυτός ο σχεδιασμός έγινε για να ελέγξουμε την ισότητα τριών διωνυμικών ποσοστών δηλαδή την ομογένεια τριών πληθυσμών, ενώ αυτός του παραδείγματος 14.6, για να ελέγξουμε την ανεξαρτησία δύο μεταβλητών (μιας Bermoulli και μιας πολυωνυμικής με τρία δυνατά αποτελέσματα). Και στους δύο ελέγχους ως στατιστική συνάρτηση ελέγχου χρησιμοποιείται η 2X και η απορριπτική περιοχή είναι η ίδια, 2

;22

αχ>X . Το νόημα του συμπεράσματος, πρακτικά, είναι ίδιο και στους δύο ελέγχους.

23. α) Σε επίπεδο σημαντικότητας 5%, ναι, αφού 841.318.130 205.0;1

2 =>= χX β) ναι, αφού 645.147.11 05.0 =>= zz .

Page 45: 14x2test14-15 - AUAΧ Γεωπονικό Πανεπιστήμιο Αθηνών / Γ.

Έλεγχος Χ2

Γεωπονικό Πανεπιστήμιο Αθηνών / Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 515

Τιμές 2a;χ n της κατανομής 2

nχ Ο Πίνακας δίνει τα άνω α -ποσοστιαία σημεία της κατανομής 2χ με n βαθμούς ελευθερίας

Αν 2~ nX χ , ισχύει, αχ α => )( 2;nXP .

n α = 0.995 α = 0.99 α = 0.975 α = 0.95 α = 0.05 α = 0.025 α = 0.01 α = 0.005 1 0.000 0.000 0.001 0.004 3.841 5.024 6.635 7.879 2 0.010 0.020 0.051 0.103 5.991 7.378 9.210 10.597 3 0.072 0.115 0.216 0.352 7.815 9.348 11.345 12.838 4 0.207 0.297 0.484 0.711 9.488 11.143 13.277 14.860

5 0.412 0.554 0.831 1.145 11.070 12.832 15.086 16.750 6 0.676 0.872 1.237 1.635 12.592 14.449 16.812 18.548 7 0.989 1.239 1.690 2.167 14.067 16.013 18.475 20.278 8 1.344 1.647 2.180 2.733 15.507 17.535 20.090 21.955 9 1.735 2.088 2.700 3.325 16.919 19.023 21.666 23.589

10 2.156 2.558 3.247 3.940 18.307 20.483 23.209 25.188 11 2.603 3.053 3.816 4.575 19.675 21,920 24.725 26.757 12 3.074 3.571 4.404 5.226 21.026 23.337 26.217 28.300 13 3.565 4.107 5.009 5.892 22.362 24.736 27.688 29.819 14 4.075 4.660 5.629 6.571 23.685 26.119 29.141 31.319

15 4.601 5.229 6.262 7.261 24.996 27.488 30.578 32.801 16 5.142 5.812 6.908 7.962 26.296 28.845 32.000 34.267 17 5.697 6.408 7.564 8.672 27.587 30.191 33.409 35.718 18 6.265 7.015 8.231 9.390 28.869 31.526 34.805 37.156 19 6.844 7.633 8.907 10.117 30.144 32.852 36.191 38.582

20 7.434 8.260 9.591 10.851 31.414 34.170 37.566 39.997 21 8.034 8.897 10.283 11.591 32.671 35.479 38.932 41.401 22 8.643 9.542 10.982 12.338 33.924 36.781 40.289 42.796 23 9.260 10.196 11.689 13.091 35.172 38.076 41.638 44.181 24 9.886 10.856 12.401 13.848 36.415 39.364 42.980 45.558

25 10.520 11.524 13.120 14.611 37.652 40.646 44.314 46.928 26 11.160 12.198 13.844 15.379 38.885 41.923 45.642 48.290 27 11.808 12.878 14.573 16.151 40.113 43.194 46.963 49.645 28 12.461 13.565 15.308 16.928 41.337 44.461 48.278 50.994 29 13.121 14.256 16.047 17.708 42.557 45.722 49.588 52.335

30 13.787 14.953 16.791 18.493 43.773 46.979 50.892 53.672 40 20.706 22.164 24.4331 26.509 55.756 59.342 63.691 66.766 50 27.991 29.708 32.3574 34.764 67.505 71.420 76.154 79.490 60 35.535 37.485 40.4817 43.188 79.082 83.298 88.379 91.952

70 43.275 45.442 48.7576 51.739 90.531 95.023 100.425 104.215 80 51.172 53.540 57.1532 60.392 101.879 106.629 112.329 116.321 90 59.196 61.754 65.6466 69.126 113.145 118.136 124.116 128.299

100 67.328 70.065 74.2219 77.930 124.342 129.561 135.807 140.169