ΔΗΔ22 – Ποσοτικές Μέθοδοι
ΣΥΝΟΨΗ ΜΕΛΕΤΗΣ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ
Αριθμητικές μέθοδοι σύνοψης δεδομένων
Ευχέρεια στους υπολογισμούς των στατιστικών μέτρων, με έμφαση σε μέση τιμή,
διακύμανση/τυπική απόκλιση, διάμεσο, τεταρτημόρια (ενότητες 3.1.1-3.1.3, 3.1.5 και 3.2.1-
3.2.3, 3.2.5)
Προσοχή στους υπολογισμούς της διαμέσου και των τεταρτημορίων για τα μη ομαδοποιημένα
δεδομένα: οι υπολογισμοί γίνονται πάντα στην ταξινομημένη λίστα των δεδομένων (από τη
μικρότερη στη μεγαλύτερη τιμή)
Κατανόηση εννοιών όπως η συμμετρία και συντελεστής μεταβλητότητας (ενότητες 3.1.6-3.1.7)
Ευχέρεια στην ερμηνεία του θηκογράμματος (ενότητα 3.3)
Πιθανότητες
Από τα θεωρήματα που παρουσιάζονται στο κεφάλαιο 4 δεν χρειάζονται οι αποδείξεις, πρέπει
όμως να κατανοείτε τις έννοιες
Κατανόηση των πιθανοτήτων της ένωσης και τομής ενδεχομένων (ενότητες 4.1, 4.3):
o Ένωση σημαίνει διάζευξη ενδεχομένων (το Α ή το Β) και η πιθανότητα υπολογίζεται από
τον προσθετικό κανόνα Pr(𝐴 ∪ 𝐵) = Pr(𝐴 ή 𝛣) = Pr(𝐴) + Pr(𝐵) − Pr(𝐴 ∩ 𝐵)
Περιοριστείτε στον προσθετικό κανόνα για ζεύγη ενδεχομένων
Υπολογισμός της πιθανότητας της ένωσης δύο ενδεχομένων δεν σημαίνει
υπολογισμό δύο ξεχωριστών πιθανοτήτων: η πιθανότητα Pr(𝐴 ή 𝛣) δεν είναι
απαραίτητα ίση με την πιθανότητα του Α συν την πιθανότητα του Β. Αυτό ισχύει
μόνο εάν τα Α και Β είναι αμοιβαία αποκλειόμενα, δηλαδή μόνο εάν τα A και B
δεν μπορούν να συμβούν ταυτόχρονα, οπότε Pr(𝐴 και 𝛣) = 0
o Ένωση σημαίνει σύζευξη ενδεχομένων (το Α και το Β) και η πιθανότητα υπολογίζεται
από τον πολλαπλασιαστικό κανόνα Pr(𝐴 ∩ 𝐵) = Pr(𝐴 και 𝛣) = Pr(𝐴) Pr(𝛣|𝛢) =
Pr(𝐵) Pr(𝐴|𝐵)
Περιοριστείτε στον πολλαπλασιαστικό κανόνα για ζεύγη ενδεχομένων
o Ανεξάρτητα ενδεχόμενα (ενότητα 4.7):
Εάν Pr(𝐴|𝐵) = Pr(𝐴), τότε η πιθανότητα να συμβεί το Α δεν επηρεάζεται από
το Β, οπότε το Α είναι ανεξάρτητο του Β
Εάν Pr(𝛣|𝛢) = Pr(𝛣), τότε η πιθανότητα να συμβεί το Β δεν επηρεάζεται από
το Α, οπότε το Β είναι ανεξάρτητο του Α
Εάν τα Α & Β είναι ανεξάρτητα τότε Pr(𝐴 ∩ 𝐵) = Pr(𝐴 και 𝛣) = Pr(𝐴) Pr(𝛣)
Δεσμευμένη (υπό συνθήκη) πιθανότητα (ενότητα 4.4):
o Πιθανότητα ενός ενδεχομένου δεδομένου ότι έχει συμβεί ένα άλλο ενδεχόμενο.
o Δεδομένου ότι υπάρχει μια πληροφορία για ένα ενδεχόμενο, αυτομάτως αναφερόμαστε
σε δεσμευμένη (υπό συνθήκη) πιθανότητα
o Η υπό συνθήκη πιθανότητα δεν είναι η τομή ενδεχομένων: η πιθανότητα να συμβεί το Α
και το Β (μαζί) δεν είναι η πιθανότητα να συμβεί το Α δεδομένου ότι έχει συμβεί το Β
o Ο υπολογισμός της υπό συνθήκη πιθανότητας γίνεται από τον πολλαπλασιαστικό
Pr(𝐴∩𝐵)
κανόνα: Pr(𝐴|𝐵) = Pr(𝐵)
Κατανόηση του υπολογισμού των πιθανοτήτων ένωσης/τομής και δεσμευμένων πιθανοτήτων από
πίνακες συχνοτήτων
Ευχέρεια στον υπολογισμό της ολικής πιθανότητας και τον κανόνα του Bayes (ενότητα 4.6)
Υπολογισμός πλήθους συνδυασμών και διατάξεων (ενότητα 4.8): προσοχή στο εάν ενδιαφέρει η
σειρά (διατάξεις) ή όχι (συνδυασμοί)
Στατιστικές κατανομές
Σημαντικό είναι να αποκτήσετε ευχέρεια στον υπολογισμό πιθανοτήτων από την κανονική
κατανομή (ενότητα 6.2.2) και να εξοικειωθείτε με τη χρήση του πίνακα της τυποποιημένης
κανονικής κατανομής (οι πίνακες δίνονται στα παραρτήματα και το τυπολόγιο). Πρέπει να
μπορείτε να υπολογίζετε πιθανότητες της μορφής Pr(𝑋 ≤ 𝑥), Pr(𝑋 > 𝑥), και Pr(𝑥1 ≤ 𝑋 ≤ 𝑥2 )
Να έχετε ευχέρεια στους υπολογισμούς πιθανοτήτων (όπως οι τρεις στο προηγούμενο bullet) από
τη διωνυμική κατανομή (ενότητα 6.1.2) και την κατανομή Poisson (ενότητα 6.1.5), είτε μέσω
των τύπων ή μέσω των αντίστοιχων πινάκων (δίνονται στα παραρτήματα και το τυπολόγιο)
Διαστήματα εμπιστοσύνης
Ο υπολογισμός οποιουδήποτε διαστήματος εμπιστοσύνης γίνεται με το γενικό τύπο:
(εκτίμηση σημείου)±(κρίσιμη τιμή)(τυπικό σφάλμα)
Κατανόηση της πληροφορίας που παρέχει ένα διάστημα εμπιστοσύνης
o Πρόκειται για μια στατιστική εκτίμηση με τη μορφή διαστήματος (σε αντίθεση μια ένα
μέτρο όπως η μέση τιμή που είναι μια εκτίμηση σημείου)
o Ένα διάστημα εμπιστοσύνης για τη μέση τιμή ενός μεγέθους Χ δεν σημαίνει ότι το
μέγεθος Χ κυμαίνεται εντός του διαστήματος με κάποια πιθανότητα. Πχ το ότι το 95%
διάστημα εμπιστοσύνης του μέσου εισοδήματος ενός νοικοκυριού είναι [€13000,
€20000], δεν σημαίνει ότι το 95% των νοικοκυριών έχει εισόδημα στο διάστημα αυτό
Το διάστημα εμπιστοσύνης αποτελεί εκτίμηση για τη μέση τιμή του Χ και όχι για
το εύρος/διακύμανση του Χ. Πχ το παραπάνω διάστημα εμπιστοσύνης έχει 95%
πιθανότητα να περιλαμβάνει την (άγνωστη) μέση τιμή του πληθυσμού (δηλαδή
το μέσο εισόδημα του συνόλου/πληθυσμού των νοικοκυριών)
Εξοικειωθείτε με τα ακόλουθα διαστήματα (ενότητες 8.2.1-8.2.2 και οι σχετικές ενότητες 7.3.1-
7.3.2):
o Μέση τιμή με γνωστή τυπική απόκλιση πληθυσμού (χρήση κανονικής κατανομής)
o Μέση τιμή με άγνωστή τυπική απόκλιση πληθυσμού (χρήση κανονικής κατανομής για
μεγάλα δείγματα, κατανομή 𝑡 για μικρά δείγματα)
o Ποσοστό
Έλεγχοι υποθέσεων
Κατανόηση τύπων σφαλμάτων (τύπος Ι & ΙΙ) και των βασικών τύπων ελέγχων: μονόπλευροι και
αμφίπλευροι έλεγχοι (σημαντική η κατανόηση των βασικών εννοιών στην ενότητα 9.1)
Σε κάθε έλεγχο υπάρχει μια μηδενική υπόθεση που διατυπώνεται πάντα ως ισότητα (το status
quo). H εναλλακτική υπόθεση μπορεί να είναι < (αριστερόπλευρος έλεγχος), > (δεξιόπλευρος), =
(αμφίπλευρος)
o Ένας αμφίπλευρος έλεγχος είναι πάντα αυστηρότερος (πιο συντηρητικός)
Σκοπός ενός στατιστικού ελέγχου είναι να αξιολογηθούν οι ενδείξεις που παρέχει ένα δείγμα
κατά της ισχύος της μηδενικής υπόθεσης
o Τη μηδενική υπόθεση δεν τη «δεχόμαστε» ποτέ: την απορρίπτουμε ή δεν την
απορρίπτουμε (το ότι δεν απορρίπτεται κάτι δεν σημαίνει ότι πρόκειται για κάτι αληθές,
απλά δεν υπάρχουν ενδείξεις που το καταρρίπτουν)
Σε κάθε στατιστικό έλεγχο υπολογίζεται μια στατιστική συνάρτηση από τα στοιχεία ενός
δείγματος και η τιμή της συγκρίνεται με μια κρίσιμη τιμή
Οι κανόνες απόφασης σε όλους τους ελέγχους είναι τρεις:
o Αριστερόπλευρος έλεγχος: Εάν (τιμή συνάρτησης ελέγχου)<(κρίσιμη τιμή), τότε
απόρριψη της 𝛨0 , διαφορετικά μη απόρριψη
o Δεξιόπλευρος έλεγχος: Εάν (τιμή συνάρτησης ελέγχου)>(κρίσιμη τιμή), τότε απόρριψη
της 𝛨0 , διαφορετικά μη απόρριψη
o Αμφίπλευρος έλεγχος: Εάν (απόλυτη τιμή συνάρτησης ελέγχου)>(κρίσιμη τιμή), τότε
απόρριψη της 𝛨0 , διαφορετικά μη απόρριψη
Εξοικειωθείτε με τους βασικούς στατιστικούς τουλάχιστον για την περίπτωση του ενός
πληθυσμού (ενότητες 9.2.1-9.2.2). Οι έλεγχοι αυτοί είναι ουσιαστικά ένας άλλος τρόπος
εξαγωγής συμπερασμάτων αντί της χρήσης διαστημάτων εμπιστοσύνης. Εάν κατανοήσετε τη
χρήση των στατιστικών κατανομών/πινάκων για τους υπολογισμούς των διαστημάτων
εμπιστοσύνης (ενότητες 8.2.1-8.2.2), τότε οι ενότητες 9.2.1-9.2.2 είναι απλά ένας διαφορετικός
τρόπος εξαγωγής παρόμοιων συμπερασμάτων.
Ιδανικά θα πρέπει να μπορείτε να πραγματοποιήσετε ελέγχους υποθέσεων για δύο πληθυσμούς
(ενότητες 9.3.1-9.3.2).
o Οι τύποι των στατιστικών συναρτήσεων μπορεί να φαίνονται δυσνόητοι, αλλά πρόκειται
μόνο για αριθμητικούς υπολογισμούς. Η διαδικασία με την οποία γίνονται οι έλεγχοι δεν
διαφέρει σε τίποτα από τους ελέγχους ενός δείγματος
o Σε ελέγχους μέσων τιμών δύο δειγμάτων διακρίνουμε δύο περιπτώσεις:
Ανεξάρτητα δείγματα: δείγματα διαφορετικών παρατηρήσεων από διαφορετικούς
πληθυσμούς (ομάδες), πχ. φοιτητές ΔΗΔ έναντι φοιτητών ΔΕΟ
Εξαρτημένα δείγματα: καταγραφή των ίδιων περιπτώσεων σε διαφορετικές
συνθήκες, πχ. στελέχη πριν ένα εκπαιδευτικό σεμινάριο και τα ίδια στελέχη μετά
το σεμινάριο