Στατιστική Επιχειρήσεων Εβελίνα Κοσσιέρη ΤΕΙ Πειραιά
Στατιστική Επιχειρήσεων Εβελίνα Κοσσιέρη ΤΕΙ Πειραιά
ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ
Εβελίνα Κοσσιέρη
Τμήμα Λογιστικής και Χρηματοοικονομικής
ΤΙ ΜΕΛΕΤΑ Η ΣΤΑΤΙΣΤΙΚΗ
ΔΕΙΓΜΑ
ΑΠΟΓΡΑΦΗ
Η δειγματοληψία είναι η
συγκέντρωση στοιχείων μόνο
από ένα τμήμα (υποσύνολο) του
πληθυσμού, που θέλουμε να
ερευνήσουμε.
ΚΑΤΗΓΟΡΙΕΣ ΜΕΤΑΒΛΗΤΩΝ
Ποιοτικές Μεταβλητές
Επιπλέον κατηγορίες μεταβλητών
Οι ποιοτικές μεταβλητές διακρίνονται σε δύο κατηγορίες.
Πηγή
ΤΑ ΒΑΣΙΚΑ ΜΕΡΗ ΕΝΟΣ ΣΤΑΤΙΣΤΙΚΟΥ
ΠΙΝΑΚΑ (β)
Τα βασικά μέρη ενός στατιστικού πίνακα είναι:
Ονομασίες αξόνων
Επεξηγήσεις
ΑΣΚΗΣΗ 1
Σε μια στατιστική έρευνα όπου ο πληθυσμός είναι οι
αθλητές μιας ομάδας και μεταβλητή, το βάρος των
αθλητών να καταγράψετε τις τιμές της μεταβλητής
Απάντηση
Οι τιμές του βάρους μπορούν να είναι οποιεσδήποτε
μεταξύ κάποιας ανώτατης και κάποιας κατώτατης τιμής,
επομένως μπορούμε να πούμε ότι είναι π.χ. από 50 έως
90 κιλά. Αυτό το αναπαριστούμε με τη μορφή του
διαστήματος [50, 90].
Εδώ πρέπει να σημειωθεί ότι η αγκύλες [,] σημαίνουν την
δυνατότητα ύπαρξης της τιμής που έπεται ή ακολουθεί
την αγκύλη αντίστοιχα μέσα στο διάστημα, δηλ στην
άσκησή μας σημαίνει ότι το βάρος 50 και 90 μπορεί να
αποτελεί το βάρος κάποιου αθλητή.
ΑΣΚΗΣΗ 2
Στατιστική έρευνα όπου ο πληθυσμός είναι ο
ελληνικές οικογένειες και μεταβλητή, το πλήθος των
ανήλικων τέκνων να καταγράψετε τις τιμές της
μεταβλητής
Απάντηση
Ο αριθμός των ανήλικων τέκνων μιας ελληνικής οικογένειας
μπορεί να έχει ως ελάχιστη τιμή το 0 και ως μέγιστη π.χ. το 18.
Το ερώτημα όμως εδώ είναι μπορεί να πάρει όλες τις τιμές από
το 0 έως το 18;
Σίγουρα μια μη ακέραιη τιμή όπως το 3.5 δεν είναι αποδεκτή
ως τιμή της μεταβλητής, άρα εδώ αποφεύγουμε το συμβολισμό
με χρήση διαστήματος όπως προηγουμένως. Αντί για διάστημα
γράφουμε 0,1,2,… 18 ή λέμε ότι μπορεί να λάβει τις ακέραιες
τιμές από 0 έως 18.
ΑΣΚΗΣΗ 3
Σε μια στατιστική έρευνα όπου ο πληθυσμός είναι το
οι σεισμοί σε όλον τον κόσμο και μεταβλητή, ο
χαρακτηρισμός τους ως προς το είδος τους.
Απάντηση
Οι σεισμοί χωρίζονται σε τεκτονικούς, ηφαιστειογενείς
και εγκατακρημνισιγενείς. Επομένως αυτές είναι οι τιμές
που μπορεί να λάβει η μεταβλητή μας.
ΑΣΚΗΣΗ 4
Κατηγορίες μεταβλητών
Οι μεταβλητές χωρίζονται σε δύο κατηγορίες, στις
ποιοτικές και στις ποσοτικές.
ΑΣΚΗΣΗ 5
Στη στατιστική έρευνα όπου ο πληθυσμός είναι οι
αθλητές μιας ομάδας και μεταβλητή το βάρος των
αθλητών, να εντοπίσετε την κατηγορία στην οποία
ανήκει η μεταβλητή
Απάντηση
Είπαμε προηγουμένως ότι οι τιμές της μεταβλητής
αυτής βρίσκονται στο διάστημα [50, 90]. Αφού
λοιπόν λαμβάνει αριθμητικές τιμές είναι ποσοτική.
ΑΣΚΗΣΗ 6
Στη στατιστική έρευνα όπου ο πληθυσμός είναι ο
ελληνικές οικογένειες και μεταβλητή, το πλήθος των
ανήλικων τέκνων που έχουν, να εντοπίσετε την
κατηγορία στην οποία ανήκει η μεταβλητή αυτή.
Απάντηση
Είπαμε προηγουμένως ότι ο αριθμός των ανήλικων
τέκνων μιας ελληνικής οικογένειας μπορεί να πάρει τις
ακέραιες τιμές 0,1,2,… 18.
Αφού λοιπόν λαμβάνει αριθμητικές τιμές είναι
ποσοτική.
ΑΣΚΗΣΗ 7
Στη στατιστική έρευνα όπου ο πληθυσμός είναι το
πλήθος των σεισμών σε όλον τον κόσμο και μεταβλητή,
ο χαρακτηρισμός τους ως προς το είδος τους, να
εντοπίσετε την κατηγορία στην οποία ανήκει η
μεταβλητή
Απάντηση
Οι κατηγορίες στις οποίες εντάσσονται οι σεισμοί ως
προς το είδος τους είναι τεκτονικοί, ηφαιστειογενείς
και εγκατακρημνισιγενείς. Επομένως οι τιμές της
μεταβλητής δεν είναι αριθμητικές και άρα η
μεταβλητή είναι ποιοτική.
ΑΣΚΗΣΗ 8
Στη στατιστική έρευνα όπου ο πληθυσμός είναι οι
αθλητές μιας ομάδας και μεταβλητή το βάρος των
αθλητών, να εντοπίσετε την κατηγορία στην οποία
ανήκει η ποσοτική μεταβλητή.
Απάντηση
Είπαμε προηγουμένως ότι πρόκειται για ποσοτική
μεταβλητή και επειδή το βάρος των αθλητών θα
μπορούσε να λάβει οποιαδήποτε τιμή στο
διάστημα[50, 90], π.χ. την τιμή 67.2, πρόκειται για
συνεχή μεταβλητή.
ΑΣΚΗΣΗ 9
Στη στατιστική έρευνα όπου ο πληθυσμός είναι ο
ελληνικές οικογένειες και μεταβλητή, το πλήθος των
ανήλικων τέκνων που έχουν, να εντοπίσετε την
κατηγορία στην οποία ανήκει η ποσοτική μεταβλητή
αυτή.
Απάντηση
Είπαμε προηγουμένως ότι ο αριθμός των ανήλικων
τέκνων μιας ελληνικής οικογένειας μπορεί να πάρει τις
ακέραιες τιμές 0,1,2,… 18, όμως δεν μπορεί να πάρει
όλες τις τιμές από 0 έως 18, αφού οι δεκαδικές τιμές
εξαιρούνται. Άρα πρόκειται για διακριτή μεταβλητή.
ΑΣΚΗΣΗ 10
Στη στατιστική έρευνα όπου ο πληθυσμός είναι ο
ελληνικές οικογένειες και μεταβλητή, το πλήθος των
ανήλικων τέκνων που έχουν, να εντοπίσετε την
κατηγορία στην οποία ανήκει η ποσοτική μεταβλητή
αυτή.
Απάντηση
Είπαμε προηγουμένως ότι ο αριθμός των ανήλικων
τέκνων μιας ελληνικής οικογένειας μπορεί να πάρει τις
ακέραιες τιμές 0,1,2,… 18, όμως δεν μπορεί να πάρει
όλες τις τιμές από 0 έως 18, αφού οι δεκαδικές τιμές
εξαιρούνται. Άρα πρόκειται για διακριτή μεταβλητή.
ΑΣΚΗΣΗ 10
ΑΣΚΗΣΗ 12
Σκοποί Ενότητας
4
Περιεχόμενα Ενότητας
• Τι είναι κλάσεις
• Γενικές παρατηρήσεις
• Ιδανικό πλήθος κλάσεων
• Κανόνας Sturges
• Σύνδεση Εύρους R, πλάτους c και πλήθους k
• Άσκηση και επίλυση αυτής
Τι είναι οι κλάσεις;
Κλάσεις είναι ημιανοικτά διαστήματα της
μορφής [αi, bi), τα οποία είναι ταυτόχρονα και
διαδοχικά, έτσι ώστε να μην υπάρχει κάποια
τιμή του διαστήματος εντός του οποίου ορίζεται
η μεταβλητή, που να μην ανήκει σε κάποια
κλάση.
Παρατηρήσεις - 2
8
Εύρος Τιμών Δείγματος
R= xmax-xmin
10
Ιδανικό Πλήθος Κλάσεων - 2
11
Κανόνας Sturges
• Ένας εμπειρικός κανόνας για τον καλύτερο
αριθμό κλάσεων (κανόνας του Sturges)
• Ο ιδανικός αριθμός κλάσεων για Ν μετρήσεις
είναι ο πλησιέστερος ακέραιος αριθμός προς
τον αριθμό k, που παρέχεται από τη σχέση:
k = 1 + 3,322 log10N
12
Πλάτος Κλάσης
13
K= R/c
14
Άσκηση
Σε μία στατιστική έρευνα καταγράφησαν οι
βαθμοί 50 φοιτητών με βαθμούς στην κλίμακα 0
- 100.
35 56 98 45 100 95 20 50 91 93
85 100 64 99 90 87 72 51 90 52
86 84 45 65 98 75 97 50 62 55
60 15 60 62 80 78 75 60 92 80
65 90 55 70 82 70 96 95 94 78
15
Διερεύνηση Προβλήματος - 1
16
Διερεύνηση Προβλήματος - 2
k = 1 + 3,322 log10N
Άρα k=1+3,322log1050
k= 6,643978=> k= 7 κλάσεις
17
Διερεύνηση Προβλήματος - 3
18
Διερεύνηση Προβλήματος - 4
Συνήθως η πρώτη κλάση πρέπει να ξεκινάει από
την ελάχιστη παρατήρηση και να έχει πλάτος το
12 που υπολογίσαμε προηγουμένως.
Κλάσεις: [15, 27)
[27, 39)
[39, 51)
[51, 63)
[63, 75)
[75, 87)
[87,99) 19
20
Τι θα πρέπει να Προσέξουμε στην
Δημιουργία των Κλάσεων; - 1
21
23
Δημιουργούμε Πίνακα
Κλάσεις Συχνότητα νi
[15, 28) 2
[28, 41) 1
[41, 54) 6
[54, 67) 11
[67,80) 7
[80,93) 12
[93, 106) 11
Σύνολο 50
24
Σχετική Συχνότητα (fi)
Είναι το ποσοστό των εμφανίσεων μιας συγκεκριμένης
τιμής στο σύνολο του δείγματος. Αν x1 , x2 , x3 ,…, xκ οι
τιμές μιας μεταβλητής Χ ενός δείγματος μεγέθους ν και
ν1 , ν2 , ν3 , … , νκ οι αντίστοιχες συχνότητές τους, τότε
σχετική συχνότητα της τιμής xi , i = 1 , 2 , 3 , …, κ λέγεται
αριθμός fi= vi/v, i = 1 , 2 , 3 , …, κ.
25
Αθροιστική Συχνότητα ( Νi )
Είναι το πλήθος των παρατηρήσεων που
βρίσκονται κάτω από μια συγκεκριμένη τιμή
μέσα στο δείγμα μας. Αν οι τιμές x1 , x2 , x3 ,…, xκ
μιας ποσοτικής μεταβλητής Χ, ενός δείγματος
μεγέθους ν , είναι σε αύξουσα διάταξη και ν1 ,
ν2 , ν3 ,…, ν κ οι αντίστοιχες συχνότητές τους,
τότε αθροιστική συχνότητα της τιμής x i , i = 1 , 2
, 3 , …, κ λέγεται ο φυσικός αριθμός Νi = ν1 + ν2 +
ν3 +…+ νi που δείχνει πόσες παρατηρήσεις είναι
μικρότερες ή ίσες της τιμής xi.
26
Αθροιστική Σχετική Συχνότητα (Fi)
Είναι το ποσοστό των παρατηρήσεων που
βρίσκονται κάτω από μια συγκεκριμένη τιμή
μέσα στο δείγμα μας.
Αν οι τιμές x1 , x2 , x3 ,…, xκ μιας ποσοτικής
μεταβλητής Χ, ενός δείγματος μεγέθους ν, είναι
σε αύξουσα διάταξη και f1, f2, f3 ,…,fκ οι
αντίστοιχες σχετικές συχνότητές τους , τότε
αθροιστική σχετική συχνότητα της τιμής x i , i =
1 , 2 , 3 , …, κ λέγεται ο αριθμός Fi = f1 + f2 + f3
+…+fκ
27
∑x i
x= i =1
∑x i
µ= i =1
Ν
ΤΥΠΟΣ ΑΡΙΘΜΗΤΙΚΟΥ ΜΕΣΟΥ (2)
α. Σταθμικός αριθμητικός μέσος δείγματος
για n παρατηρήσεις:
n
∑ x ⋅v i i
x= i =1
n
ΔΙΑΜΕΣΟΣ
n +1
2
ΥΠΟΛΟΓΙΣΜΟΣ ΔΙΑΜΕΣΟΥ (3)
n +1
Άρα η 2 παρατήρηση στην ταξινομημένη
σειρά των παρατηρήσεων, δηλαδή η
n +1
( )
2
x
είναι και η ζητούμενη διάμεσος
π.χ. αν έχουμε τις παρατηρήσεις 5,8,2,6,9 για
να υπολογιστεί η διάμεσος πρέπει πρώτα να
τις ταξινομήσουμε σε αύξουσα σειρά, άρα
Το n=5, άρα
n +1 5 +1 6
= = =3
2 2 2
Επομένως η 3η παρατήρηση στην ταξινομημένη
σειρά 2, 5, 6, 8, 9
θα είναι και η ζητούμενη διάμεσος. Άρα η διάμεσος
είναι δ= 6.
ΥΠΟΛΟΓΙΣΜΟΣ ΔΙΑΜΕΣΟΥ (5)
θέσεις n
=
6
= 3 και
2 2
ΥΠΟΛΟΓΙΣΜΟΣ ΔΙΑΜΕΣΟΥ (7)
n 6
+1 = +1 = 3 +1 = 4
2 2
n n
( ) ( +1)
x 2
+x 2
6+7
δ= = = 6,5
2 2
ΥΠΟΛΟΓΙΣΜΟΣ ΔΙΑΜΕΣΟΥ (9)
ΑΣΚΗΣΗ
ΤΕΤΑΡΤΗΜΟΡΙΑ
Τα τεταρτημόρια μιας κατανομής είναι τρία και
χωρίζουν την κατανομή με τέτοιο τρόπο ώστε:
•Μεταξύ ελάχιστης παρατήρησης και 1ου τεταρτημορίου
να βρίσκεται το 25% των παρατηρήσεων.
•Μεταξύ 1ου και 2ου τεταρτημορίου βρίσκεται το 25% των
παρατηρήσεων.
•Μεταξύ 2ου και 3ου τεταρτημορίου βρίσκεται το 25% των
παρατηρήσεων.
•Μεταξύ 3ου τεταρτημορίου και μέγιστης παρατήρησης
βρίσκεται το 25% των παρατηρήσεων.
ΣΥΜΒΟΛΙΣΜΟΣ ΤΕΤΑΡΤΗΜΟΡΙΩΝ
Τα εννέα δεκατημόρια συμβολίζονται με Qi,
όπου i=1, 2,3.
Παρατηρήσεις:
•Τα τεταρτημόρια ακολουθούν πάντα την
διάταξη xmin≤Q1 ≤Q2 ≤Q3 ≤xmax
•Το 2ο τεταρτημόριο συμπίπτει με τη διάμεσο.
ΤΥΠΟΣ ΥΠΟΛΟΓΙΣΜΟΥ
ΤΕΤΑΡΤΗΜΟΡΙΩΝ
Όταν οι παρατηρήσεις δίνονται με συχνότητες,
c in
Qi ai ( N Qi1 )
vi 4
ΣΥΜΒΟΛΙΣΜΟΣ ΔΕΚΑΤΗΜΟΡΙΩΝ
Τα εννέα δεκατημόρια συμβολίζονται με Di,
όπου i=1, 2, …,9.
Παρατηρήσεις:
•Τα δεκατημόρια ακολουθούν πάντα την
διάταξη xmin≤D1 ≤D2 ≤… ≤ D10 ≤xmax
•Το 5ο δεκατημόριο συμπίπτει με τη διάμεσο.
ΤΥΠΟΣ ΥΠΟΛΟΓΙΣΜΟΥ
ΔΕΚΑΤΗΜΟΡΙΩΝ
Όταν οι παρατηρήσεις δίνονται με συχνότητες,
c in
Di ai ( N Qi1 )
vi 10
Όπως και στη διάμεσο, όταν οι παρατηρήσεις είναι
ταξινομημένες σε κλάσεις, πρώτα εντοπίζουμε την
κλάση στην οποία ανήκει το δεκατημόριο από το
in
10
ΕΚΑΤΟΣΤΗΜΟΡΙΑ
Τα εκατοστημόρια μιας κατανομής είναι ενενήντα εννέα
και χωρίζουν την κατανομή με τέτοιο τρόπο ώστε:
•Μεταξύ ελάχιστης παρατήρησης και 1ου
εκατοστημορίου να βρίσκεται το 1% των παρατηρήσεων.
•Μεταξύ 1ου και 2ου εκατοστημορίου βρίσκεται το 1% των
παρατηρήσεων.
•Μεταξύ 2ου και 3ου εκατοστημορίου βρίσκεται το 1% των
παρατηρήσεων.
•……………………………………………………………………………………….
•Μεταξύ 99ου τεταρτημορίου και μέγιστης παρατήρησης
βρίσκεται το 1% των παρατηρήσεων.
ΣΥΜΒΟΛΙΣΜΟΣ ΕΚΑΤΟΣΤΗΜΟΡΙΩΝ
ΤΥΠΟΣ ΥΠΟΛΟΓΙΣΜΟΥ
ΕΚΑΤΟΣΤΗΜΟΡΙΩΝ
Όταν οι παρατηρήσεις δίνονται με συχνότητες,
c in
Pi ai ( N Qi1 )
vi 10
Όπως και στη διάμεσο, όταν οι παρατηρήσεις είναι
ταξινομημένες σε κλάσεις, πρώτα εντοπίζουμε την κλάση στην
οποία ανήκει το δεκατημόριο από το
in
100
ΤΥΠΟΣ Ή ΕΠΙΚΡΑΤΟΥΣΑ ΤΙΜΗ
Επικρατούσα τιμή είναι η τιμή εκείνη που
παρουσιάζεται με τη μέγιστη συχνότητα εντός
του δείγματος.
Στα αναλυτικά δεδομένα, τα οποία δε δίνονται
με συχνότητες, η επικρατούσα τιμή είναι εκείνη
η παρατήρηση με τη μέγιστη συχνότητα.
1
T0 ai c
1 2
Δ1: Η διαφορά της μέγιστης συχνότητας με τη
συχνότητα της προηγούμενης κλάσης
Δ2: Η διαφορά της μέγιστης συχνότητας με τη
συχνότητα της επόμενης κλάσης
xmax xmin
xmax xmin
ΑΣΚΗΣΗ 1 (1)
Στην άσκηση με τις κλάσεις των μισθών των 500
υπαλλήλων, να υπολογιστούν τα τεταρτημόρια της
κατανομής.
ΑΣΚΗΣΗ 1 (3)
Στην άσκηση με τις κλάσεις των μισθών των 500
υπαλλήλων, να υπολογιστούν τα εκατοστημόρια της
κατανομής.
ΚΛΑΣΕΙΣ ΣΥΧΝΟΤΗΤΑ νi ΑΘΡΟΙΣΤΙΚΗ
ΣΥΧΝΟΤΗΤΑ Νi
0-500 40 40
500-1000 265 305
1000-1500 167 472
1500-2000 28 500
ΣΥΝΟΛΟ 500 -
Ενότητα # 5: Διασπορά
ΠΑΡΑΔΕΙΓΜΑ (1)
Έστω 3 πενταμελείς ομάδες φοιτητών με
βαθμολογίες:
Ομάδα 1: 6,7,5,8,4
Ομάδα 2: 7,5,6,5,7
Ομάδα 3: 8,6,2,4,10
Παρατηρούμε ότι και οι τρεις πενταμελείς ομάδες
έχουν μέση βαθμολογία 6.
ΠΑΡΑΔΕΙΓΜΑ (2)
ΠΑΡΑΔΕΙΓΜΑ (3)
Ομάδα 1
Ομάδα 2
Ομάδα 3
ΤΙ ΔΕΙΧΝΕΙ Η ΔΙΑΣΠΟΡΑ
ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ
1. Εύρος (Range)
2. Ενδοτεταρτημοριακή απόκλιση (Quartile
Deviation)
3. Μέση απόκλιση (Mean Deviation)
4. Διακύμανση (Variance)
5. Τυπική απόκλιση (Standard Deviation)
6. Συντελεστής μεταβλητότητας (Coefficient of
Variation)
ΕΥΡΟΣ (RANGE)
Σύμβολο: R
Τύπος: R=xmax-xmin
με xmax: η μέγιστη σε μέγεθος παρατήρηση
xmin: η ελάχιστη σε μέγεθος παρατήρηση
Πλεονέκτημα: απλό στον υπολογισμό
Μειονέκτημα: εξαρτάται μόνο από τις δύο ακραίες
παρατηρήσεις του δείγματος xmax και xmin
ΕΝΔΟΤΕΤΑΡΤΗΜΟΡΙΑΚΗ ΑΠΟΚΛΙΣΗ
Σύμβολο: QD
Τύπος: QD=Q3-Q1
με Q1: το πρώτο τεταρτημόριο
Q3: το τρίτο τεταρτημόριο
Πλεονέκτημα: απλό στον υπολογισμό
Μειονέκτημα: εξαρτάται μόνο από τα 2 τεταρτημόρια
ΜΕΣΗ ΑΠΟΚΛΙΣΗ
Σύμβολο: MD
n
f
n
xi x
xi x i
με xi: η παρατήρηση i
x : ο αριθμητικός μέσος των παρατηρήσεων
Πλεονέκτημα: λαμβάνει υπόψη όλες τις
παρατηρήσεις.
Μειονέκτημα: Εκτός της ελάχιστης τιμής που
μπορεί να λάβει δεν έχει κάποιο άνω φράγμα.
ΔΙΑΚΥΜΑΝΣΗ
Σύμβολο: Var, s2 (για το δείγμα), σ2 (για τον πληθυσμό)
n k
Τύπος: s2= (x
i 1
i x) 2
ή s2= f
i 1
i ( xi x ) 2
(για κλάσεις)
n n
με xi: η παρατήρηση i
x : ο αριθμητικός μέσος των παρατηρήσεων
fi: η συχνότητα της παρατήρησης i
Πλεονέκτημα: λαμβάνει υπόψη όλες τις παρατηρήσεις.
Μειονέκτημα: Εκτός της ελάχιστης τιμής που μπορεί να
λάβει δεν έχει κάποιο άνω φράγμα. Επίσης
τετραγωνίζει τις μονάδες μέτρησης της.
ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ
Σύμβολο: s (για το δείγμα), σ (για τον πληθυσμό)
n k
Τύπος: s= f
(x x) 2
( xi x ) 2
i 1
i
ή s= i 1
i
(για κλάσεις)
n n
με xi: η παρατήρηση i
x : ο αριθμητικός μέσος των παρατηρήσεων
fi: η συχνότητα της παρατήρησης i
Πλεονέκτημα: λαμβάνει υπόψη όλες τις παρατηρήσεις.
Αποτετραγωνίζει τις μονάδες μέτρησης.7
Μειονέκτημα: Εκτός της ελάχιστης τιμής που μπορεί να
λάβει δεν έχει κάποιο άνω φράγμα. Επίσης τετραγωνίζει
τις μονάδες μέτρησης της.
ΣΥΝΤΕΛΕΣΤΗΣ ΜΕΤΑΒΛΗΤΟΤΗΤΑΣ
Σύμβολο: CV
s
Τύπος: CV= x 100%
με s: η τυπική απόκλιση
x : ο αριθμητικός μέσος
Πλεονέκτημα: Δεν έχει μονάδες μέτρησης.
Λαμβάνει τιμές από 1 ως 100.
Μειονέκτημα: Προϋποθέτει τον υπολογισμό του
μέσου και της τυπικής απόκλισης.
ΙΔΙΟΤΗΤΕΣ ΔΙΑΚΥΜΑΝΣΗΣ (1)
1. Αν σε κάθε παρατήρηση προσθέσουμε ή
αφαιρέσουμε την ίδια σταθερή τιμή, τότε η
διακύμανση δεν μεταβάλλεται.
sxc sx
2. Αν κάθε παρατήρηση πολλαπλασιαστεί ή διαιρεθεί
με τον ίδιο αριθμό τότε η διακύμανση των νέων
παρατηρήσεων πολλαπλασιάζεται ή διαιρείται με
το τετράγωνο του αριθμού αυτού.
s xc c s x
2
μ=Μ=Τ0
ΘΕΤΙΚΑ ΑΣΥΜΜΕΤΡΗ ΚΑΤΑΝΟΜΗ
Τ0<Μ<μ
μ<Μ<Τ0
ΒΑΣΙΚΟ ΠΛΕΟΝΕΚΤΗΜΑ
ΣΥΜΜΕΤΡΙΚΟΤΗΤΑΣ ΤΗΣ ΚΑΤΑΝΟΜΗΣ
Μπορούμε να μελετήσουμε μόνο το ένα μέρος της
κατανομής και να εκτιμήσουμε με ακρίβεια τι θα συμβεί για
το άλλο.
Παράδειγμα: Συμμετρική κατανομή με μέσο μ=5 και 1ο
τεταρτημόριο 3, θα έχει τρίτο τεταρτημόριο το 7
ΑΣΚΗΣΗ 1 (1)
Πωλήσεις 400 επιχειρήσεων
ΑΣΚΗΣΗ 1 (3)
5. Διακύμανση πωλήσεων
6. Τυπική απόκλιση πωλήσεων
7. Συντελεστής μεταβλητότητας πωλήσεων
8. Να ελέγξετε τη συμμετρία των πωλήσεων
Ενότητα # 6: Ασυμμετρία
Σκοποί ενότητας
4
Περιεχόμενα ενότητας
x T0
Sk
s
Αν x T0 (συμμετρική κατανομή), τότε Sk=0
Αν x T0 (θετική ασυμμετρία), τότε Sk>0
Αν x T0 (αρνητική ασυμμετρία), τότε Sk<0
ΜΕΤΡΙΑ ΑΣΥΜΜΕΤΡΙΚΕΣ ΚΑΤΑΝΟΜΕΣ
Ισχύει η σχέση x T0 3 ( x M )
Άρα ο συντελεστής ασυμμετρίας του Pearson
γράφεται:
3 (x M )
Sk
s
ΠΑΡΑΤΗΡΗΣΕΙΣ
(Q3 M ) ( M Q1 )
Sk
(Q3 M ) ( M Q1 )
Όταν η κατανομή είναι συμμετρική Sk=0
Όταν η κατανομή είναι θετικά ασύμμετρη Sk>0
Όταν η κατανομή είναι αρνητικά ασύμμετρη
Sk<0
ΡΟΠΕΣ (1)
• Κεντρικές ροπές
( xi x )
k
t
f i ( xi x )t
t i 1
ή t i 1
n n
3 2
1 3
2
ΠΡΟΣΔΙΟΡΙΣΜΟΣ ΑΣΥΜΜΕΤΡΙΑΣ ΜΕ ΤΗ ΧΡΗΣΗ ΤΩΝ ΡΟΠΩΝ (2)
3 2 3
1 1
2 3
23
ΠΡΟΣΔΙΟΡΙΣΜΟΣ ΑΣΥΜΜΕΤΡΙΑΣ ΜΕ ΤΗ ΧΡΗΣΗ ΤΩΝ ΡΟΠΩΝ (4)
ΚΥΡΤΩΣΗ
Λεπτόκυρτη
Μεσόκυρτη
Πλατύκυρτη
ΜΕΤΡΑ ΚΥΡΤΩΣΗΣ (1)
4
2 2
2
4
2 2 3 2 3
2
ΑΣΚΗΣΗ (2)
Να υπολογισθούν:
1. Η ασυμμετρία της κατανομής.
2. Η κύρτωση της κατανομής
Ενότητα # 7: Θεωρία Πιθανοτήτων (Πείραμα Τύχης)
ΔΕΙΓΜΑΤΙΚΟΣ ΧΩΡΟΣ
Είναι το σύνολο όλων των δυνατών
αποτελεσμάτων ενός πειράματος τύχης.
Σύμβολο: S, Ω
Π.χ. Για τη ρίψη των ενός ζαριού είναι:
S={1, 2, 3, 4, 5, 6}
ΕΝΔΕΧΟΜΕΝΟ
Ονομάζεται ένα υποσύνολο του δειγματικού
χώρου ενός πειράματος τύχης.
Σύμβολο: Α, Β, …
Παρατηρήσεις: Ως ενδεχόμενο μπορεί να
είναι όλος ο δειγματικός χώρος, αλλά και το
σύνολο που δεν περιέχει κανένα αποτέλεσμα
του δειγματικού χώρου δηλαδή το Ø
ΓΡΑΦΙΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗ
ΕΝΔΕΧΟΜΕΝΩΝ
Γίνεται με τη χρήση διαγραμμάτων Venn
Α
ΕΝΩΣΗ ΔΥΟ ΕΝΔΕΧΟΜΕΝΩΝ
• Ένωση δύο ενδεχομένων Α και Β στον
δειγματικό χώρο S είναι το ενδεχόμενο που
συμβολίζεται Α Β και περιλαμβάνει τα
αποτελέσματα που περιέχονται στο Α ή στο Β.
ΣΥΜΠΛΗΡΩΜΑ ΕΝΔΕΧΟΜΕΝΟΥ
• Συμπλήρωμα του ενδεχομένου Α στον δειγματικό
χώρο S είναι το ενδεχόμενο που συμβολίζεται Α’ ή Αc
και περιλαμβάνει τα αποτελέσματα του δειγματικού
χώρου S που δεν περιέχονται στο Α.
ΤΥΧΑΙΑ ΜΕΤΑΒΛΗΤΗ (1)
Είναι η συνάρτηση που απεικονίζει τα δυνατά
αποτελέσματα ενός πειράματος τύχης στο σύνολο
των πραγματικών αριθμών.
π.χ. στη ρίψη ενός κύβου αντιστοιχίζεται ένας
αριθμός σε κάθε έδρα του και έτσι οι τιμές της
τυχαίας μεταβλητής είναι x: 1, 2, 3, 4, 5, 6
π.χ. στη ρίψη ενός νομίσματος αν το αποτέλεσμα
κεφαλή αντιστοιχηθεί στο 0 και το γράμματα στο 1,
οι τιμές της τυχαίας μεταβλητής είναι x: 0, 1
ΠΑΡΑΤΗΡΗΣΕΙΣ
0 P( A) 1
Αν P(A)=0, το ενδεχόμενο Α είναι αδύνατο,
δηλαδή δεν πραγματοποιείται.
Αν P(A)=1, το ενδεχόμενο Α είναι βέβαιο, δηλαδή
θα πραγματοποιηθεί σίγουρα.
ΣΤΑΤΙΣΤΙΚΟΣ ΟΡΙΣΜΟΣ ΤΗΣ ΠΙΘΑΝΟΤΗΤΑΣ
P ( A) lim
f
n n
P( A B) P( A) P( B)
Αν A B {} τότε
P( A B) P( A) P( B) P( A B)
P( A B)
P( A / B)
P( B)
Με P( B) 0
ΑΝΕΞΑΡΤΗΤΑ ΕΝΔΕΧΟΜΕΝΑ
Δύο ενδεχόμενα Α και Β ονομάζονται
ανεξάρτητα όταν:
P( B / A) P( B)
Και επομένως
P( A B) P( A) P( B)
Original
Ενότητα # 8: Πιθανότητες ΙΙ
ΑΣΚΗΣΗ 1 (1)
1. Ποια η πιθανότητα σε μία τράπουλα 52
φύλλων να επιλέξουμε τυχαία ένα φύλλο
που να είναι σπαθί;
Λύση
Ως γνωστό ένα τραπουλόχαρτο μπορεί να
είναι σπαθί(1), καρό(2), κούπα(3), ή
μπαστούνι(4).
ΑΣΚΗΣΗ 1 (2)
Τα 52 τραπουλόχαρτα χωρίζονται σε
τέσσερεις ομάδες των 13 χαρτιών που κάθε
μία ομάδα είναι σπαθί, καρό, κούπα, ή
μπαστούνι.
Ορίζουμε το ενδεχόμενο
Α: το τραπουλόχαρτο που θα επιλεγεί να είναι
σπαθί.
ΑΣΚΗΣΗ 1 (3)
Σύμφωνα με τον ορισμό της πιθανότητας θα
πρέπει να υπολογίσουμε το πλήθος όλων
των δυνατών αποτελεσμάτων.
Είναι σαφές ότι όλα τα δυνατά αποτελέσματα
όταν επιλέγω τυχαία ένα τραπουλόχαρτο
είναι 52.
ΑΣΚΗΣΗ 1 (4)
Στη συνέχεια θα πρέπει να υπολογίσουμε το
πλήθος των ευνοϊκών αποτελεσμάτων,
δηλαδή πόσα από τα τραπουλόχαρτα είναι
σπαθί.
Όπως είδαμε και προηγουμένως από τα
τραπουλόχαρτα τα 13 είναι σπαθί.
ΑΣΚΗΣΗ 1 (5)
Άρα σύμφωνα με τον ορισμό της πιθανότητας θα
έχουμε:
E 13 1
P ( A) 0,25
52 4
ΑΣΚΗΣΗ 2 (1)
2. Ποια η πιθανότητα σε μία τράπουλα 52
φύλλων να επιλέξουμε τυχαία ένα φύλλο
που να είναι σπαθί ή φιγούρα;
Λύση:
Σε αυτή την άσκηση θα πρέπει να οριστούν
δύο ενδεχόμενα:
Α: το τραπουλόχαρτο που θα επιλεγεί να
είναι σπαθί.
ΑΣΚΗΣΗ 2 (2)
και
Β: το τραπουλόχαρτο που θα επιλεγεί να είναι
φιγούρα.
Τα 52 τραπουλόχαρτα εκτός από σπαθί, καρό,
κούπα, ή μπαστούνι, μπορούν να χωριστούν και σε
φιγούρες (Βαλές, Ντάμα, Ρήγας) και αριθμούς από
το 1 ως το 10.
Κάθε ομάδα των 13 φύλλων αποτελείται από τους 10
αριθμούς και τις φιγούρες Βαλές , Ντάμα, Ρήγας.
ΑΣΚΗΣΗ 2 (3)
Η ζητούμενη πιθανότητα ανήκει στην ένωση των
ενδεχομένων Α , Β, δηλαδή στην A B
Επομένως
P( A B) P( A) P( B) P( A B)
Όπως υπολογίστηκε στην προηγούμενη άσκηση
1
P ( A)
4
ΑΣΚΗΣΗ 2 (4)
Για να υπολογιστεί το P(B) θα πρέπει να
υπολογίσουμε το πλήθος των ευνοϊκών
αποτελεσμάτων του ενδεχομένου Β.
Όπως αναλύθηκε και προηγουμένως το
πλήθος των φιγούρων μιας τράπουλας είναι
τρεις για κάθε ένα από τα σπαθί, καρό, κούπα
και μπαστούνι.
ΑΣΚΗΣΗ 2 (5)
Άρα συνολικά θα έχουμε 12 φιγούρες. Επομένως η
ζητούμενη πιθανότητα θα είναι:
12 3
P( B)
52 13
Άρα χρησιμοποιώντας το νόμο της πρόσθεσης των
πιθανοτήτων θα έχουμε:
ΑΣΚΗΣΗ 2 (6)
P( A B) P( A) P( B) P( A B)
Επομένως θα πρέπει να υπολογίσουμε την πιθανότητα: P( A B)
ΑΣΚΗΣΗ 2 (7)
A B : Είναι το ενδεχόμενο το τραπουλόχαρτο που
επιλέγουμε τυχαία να είναι φιγούρα σπαθί.
P( A B) P( A) P( B) P( A B)
13 12 3 22
0,423
52 52 52 52
ΑΣΚΗΣΗ 3 (1)
3. Ποια η πιθανότητα σε μία τράπουλα 52
φύλλων να επιλέξουμε τυχαία ένα φύλλο
και να είναι Ρήγας δεδομένου του ότι μας
έχει δοθεί ήδη η πληροφορία ότι είναι
φιγούρα;
Λύση:
Πρόκειται για δεσμευμένη πιθανότητα, αφού
έχουμε την πληροφόρηση ότι είναι
φιγούρα.
ΑΣΚΗΣΗ 3 (2)
Άρα θα χρησιμοποιήσουμε τον τύπο:
P( A B)
P( A / B) , P( B) 0
P( B)
Ορίζουμε τα ενδεχόμενα
Α: Το τραπουλόχαρτο να είναι Ρήγας
Β: Το τραπουλόχαρτο να είναι Φιγούρα
ΑΣΚΗΣΗ 3 (3)
12
Όπως υπολογίστηκε και προηγουμένως: P ( B )
52
ΠΑΡΑΤΗΡΗΣΕΙΣ (1)
2. n( A B) n( A) n( A B)
3. n( A B) n( A) n( B) n( A B)
ΠΑΡΑΔΕΙΓΜΑ
ΜΕΤΑΘΕΣΕΙΣ
ΔΙΑΤΑΞΕΙΣ
(n m)!
m
ΕΠΑΝΑΛΗΠΤΙΚΟΙ ΣΥΝΔΥΑΣΜΟΙ
n m 1
n
m
m
ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΔΙΑΤΑΞΕΙΣ
n
n
m
m
ΑΣΚΗΣΕΙΣ (1)
ΑΣΚΗΣΕΙΣ (2)
ΚΑΤΑΝΟΜΗ ΠΙΘΑΝΟΤΗΤΑΣ
ΠΑΡΑΔΕΙΓΜΑ (2)
ΣΥΝΑΡΤΗΣΗ ΠΙΘΑΝΟΤΗΤΑΣ
Πρέπει:
1. f(x)=P(X=x)=Px≥0
και
2. f ( x) Px 1
ΣΥΝΑΡΤΗΣΗ ΚΑΤΑΝΟΜΗΣ
ΠΑΡΑΔΕΙΓΜΑ (2)
1
F (1) P( X 1) P( X 1)
6
1 1 2 1
F (2) P( X 2) P( X 1) P( X 2)
6 6 6 3
F (3) P( X 3) P( X 1) P( X 2) P( X 3)
1 1 1 3 1
6 6 6 6 2
ΠΑΡΑΔΕΙΓΜΑ (3)
F (4) P( X 4) P( X 1) P( X 2) P( X 3) P( X 4)
1 1 1 1 4 2
6 6 6 6 6 3
F (5) P( X 5)
P( X 1) P( X 2) P( X 3) P( X 4) P ( X 5)
1 1 1 1 1 5
6 6 6 6 6 6
ΠΑΡΑΔΕΙΓΜΑ (4)
F (6) P( X 6)
P( X 1) P( X 2) P( X 3) P( X 4) P( X 5) P( X 6)
1 1 1 1 1 1 6
1
6 6 6 6 6 6 6
ΣΥΝΑΡΤΗΣΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ
f ( x) P( x1 X x2 ) P( x1 X x2 ) f ( x) dx
x1
ΒΑΣΙΚΕΣ ΑΠΑΙΤΗΣΕΙΣ
f ( x) 0
και
f ( x)dx 1
ΣΥΝΑΡΤΗΣΗ ΚΑΤΑΝΟΜΗΣ
ΠΑΡΑΤΗΡΗΣΕΙΣ
P( X x2 ) P( X x1 ) F ( x2 ) F ( x1 ) 0
Ενότητα # 11: Κατανομές Πιθανότητας ΙΙ
ΠΑΡΑΔΕΙΓΜΑ (1)
Έστω η συνάρτηση
3 2
x , ό ...0 x 2
8
f (x)
0, ό ...x (0,2]
Παρατηρούμε ότι : x 2 0
2
3 x
και
2 2 3
3 3 3 23 03 3 8
8
8
( ) 1
2 2
x dx x dx
0
8 3
0 0 8 3 3 8 3
ΠΑΡΑΔΕΙΓΜΑ (2)
Για x2 F ( x) 1
ΑΣΚΗΣΗ 1
• Διωνυμική κατανομή
• Κατανομή Poisson
• Υπεργεωμετρική κατανομή
• Γεωμετρική κατανομή
• Κατανομή Pascal
ΔΙΩΝΥΜΙΚΗ ΚΑΤΑΝΟΜΗ
x!(n x)! x
ΟΡΙΣΜΟΣ ΔΙΩΝΥΜΙΚΗΣ ΚΑΤΑΝΟΜΗΣ (3)
n k nk
x
F ( x) P( X x) p q
k 0 k
ΙΔΙΟΤΗΤΕΣ ΤΗΣ ΔΙΩΝΥΜΙΚΗΣ ΚΑΤΑΝΟΜΗΣ (1)
( x ) n p
V ( x) n p q
V ( x) n p q
(q p) 2
1
n pq
ΙΔΙΟΤΗΤΕΣ ΤΗΣ ΔΙΩΝΥΜΙΚΗΣ ΚΑΤΑΝΟΜΗΣ (3)
1 6 p q
2 3
n pq
ΚΑΤΑΝΟΜΗ POISSON
ΟΡΙΣΜΟΣ (2)
e x
Px P( X x)
x!
Με λ=np
( ) n p
V ( ) n p
1
1
1
2 3
ΥΠΕΡΓΕΩΜΕΤΡΙΚΗ ΚΑΤΑΝΟΜΗ
ΣΥΝΑΡΤΗΣΗ ΠΙΘΑΝΟΤΗΤΑΣ
M N M
x nx
f ( x) P( X x) Px , x 0,1,2,..., n
N
n
ΙΔΙΟΤΗΤΕΣ ΥΠΕΡΓΕΩΜΕΤΡΙΚΗΣ ΚΑΤΑΝΟΜΗΣ
M
E( X ) m
N
nM ( N n)( N M )
V (X )
N ( N 1)
2
ΓΕΩΜΕΤΡΙΚΗ ΚΑΤΑΝΟΜΗ
1
( )
p
p
V (X ) 2
q
KATANOMH PASCAL H’ ΑΡΝΗΤΙΚΗ ΔΙΩΝΥΜΙΚΗ ΚΑΤΑΝΟΜΗ (1)
1 r r
P( X x) p q
r 1
ΑΣΚΗΣΕΙΣ (ΔΙΩΝΥΜΙΚΗ
ΚΑΤΑΝΟΜΗ)
ΑΣΚΗΣΗ (1)
Μια μηχανή παράγει ένα προϊόν, με
πιθανότητα ελαττωματικού p=0,005.
Να υπολογιστούν οι πιθανότητες:
α) Από 10 προϊόντα που παράγονται από τη
μηχανή να μην υπάρχει ελαττωματικό.
β) Από 10 προϊόντα που παράγονται από τη
μηχανή το πολύ 2 να είναι ελαττωματικά.
ΑΣΚΗΣΗ (2)
ΑΣΚΗΣΕΙΣ (ΥΠΕΡΓΕΩΜΕΤΡΙΚΗ
ΚΑΤΑΝΟΜΗ)
ΑΣΚΗΣΗ
ΛΥΣΗ (1)
p 75% o,75
q 1 p 1 0,75 0,25
Ορίζουμε το ενδεχόμενο Χ: το πλήθος των
προσπαθειών μέχρι ο τοξοβόλος να πετύχει το
κέντρο του στόχου του.
1. Η πιθανότητα να πετύχει το κέντρο του
στόχου του στην 3η προσπάθεια δίνεται από την
συνάρτηση πιθανότητας για x=3.
• Kανονική κατανομή
• Ομοιόμορφη κατανομή
• Γάμμα κατανομή
• Κατανομή Student – t
• Κατανομή F
ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ
• Ε(z)=0
• V(z)=1
Η τυποποιημένη κανονική κατανομή
συμβολίζεται: Ν(0,1)
z u2
1
( z ) P( Z z ) e 2
du, z
2
ΓΡΑΦΙΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗ ΤΗΣ Φ(z)
ΑΣΚΗΣΕΙΣ (ΤΥΠΟΠΟΙΗΜΕΝΗ
ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ)
ΑΣΚΗΣΗ
ΓΕΝΙΚΕΣ ΑΣΚΗΣΕΙΣ
ΑΣΚΗΣΗ 1
ΑΣΚΗΣΗ 2
1
, x ( a, )
f ( x) a
0, x (a, )
1
α β
( )
2
( )2
V (X )
12
ΓΑΜΜΑ ΚΑΤΑΝΟΜΗ (1)
a 1 x
x e , x 0, a 0, 0
f ( x)
0, ά
( )
V ( X ) 2
ΕΚΘΕΤΙΚΗ ΚΑΤΑΝΟΜΗ (1)
x
F ( X ) P( X x) e u du 1 e x
0
1
( )
1
V (X )
2
ΑΣΚΗΣΕΙΣ (ΟΜΟΙΟΜΟΡΦΗ
ΚΑΤΑΝΟΜΗ)
ΑΣΚΗΣΗ
ΑΣΚΗΣΗ
ΑΣΚΗΣΗ 1 (1)
β) Να δημιουργήσετε το ιστόγραμμα
συχνοτήτων.
γ) Να βρείτε αριθμητικό μέσο και διάμεσο.
ΑΣΚΗΣΗ 2
ΑΣΚΗΣΗ 4
ΑΣΚΗΣΗ 2
ΑΣΚΗΣΗ 1
Η κατανομή των μισθών που καταβάλλει μια επιχείρηση
στους υπαλλήλους βρέθηκε ότι είναι συμμετρική. Αν ο μέσος
μισθός υπολογίστηκε ότι είναι 875 ευρώ, ενώ ένας στους 4
υπαλλήλους λαμβάνει μισθό κάτω από 720 ευρώ και ο
συντελεστής μεταβλητότητας είναι 10%, να υπολογίσετε τα
ακόλουθα:
α) Ο διάμεσος μισθό.
β) Ο μισθός πάνω από τον οποίο αμείβεται το 25% των
υπαλλήλων.
γ) Η διακύμανση των μισθών.
δ) Η τυπική απόκλιση των μισθών.
ε) Ο επικρατών μισθό.
ΑΣΚΗΣΗ 2 (1)
ΑΣΚΗΣΗ 2 (2)
Όμως, αυτά τα μικρά ποσοστά -και ο μικρός κίνδυνος για τον καθένα μας
χωριστά- μπορεί να μεταφραστεί σε έναν όχι ευκαταφρόνητο αριθμό ατόμων
που θα αρρωστήσουν σοβαρά ή και θα καταλήξουν, στη φάση της μεγάλης
εξάπλωσης της νέας γρίπης. Kαι πρέπει να είμαστε έτοιμοι γι' αυτό -σαν
άτομα, σαν κοινωνία και σαν υγειονομικό σύστημα.» Τάκης
Παναγιωτόπουλος - Επιδημιολόγος – ΗΜΕΡΗΣΙΑ ON LINE (1-8-2009)
ΑΣΚΗΣΗ 2 (3)
ΑΣΚΗΣΗ 3 (1)
ΑΣΚΗΣΗ 4 (1)
Να υπολογισθούν:
i) Η πιθανότητα να επιτύχει 4 πωλήσεις.
ii) Η πιθανότητα να μην επιτύχει καμία πώληση.
iii) Η πιθανότητα να επιτύχει το πολύ 2 πωλήσεις.
iv) Η πιθανότητα να επιτύχει τουλάχιστον 3 πωλήσεις.
v) Ο αναμενόμενος αριθμός και η τυπική απόκλιση των
πωλήσεων.
ΑΣΚΗΣΗ 5
ΑΣΚΗΣΗ 6 (2)
ΑΣΚΗΣΗ 7 (2)