The Wayback Machine - https://web.archive.org/web/20260221150926/https://www.scribd.com/document/642581592/%CE%95%CE%A6%CE%91%CE%A1%CE%9C%CE%9F%CE%A3%CE%9C%CE%95%CE%9D%CE%97-%CE%9F%CE%99%CE%9A%CE%9F%CE%9D%CE%9F%CE%9C%CE%99%CE%9A%CE%97-%CE%A3%CE%A4%CE%91%CE%A4%CE%99%CE%A3%CE%A4%CE%99%CE%9A%CE%97-%CE%A3%CF%84%CE%AC%CE%B8%CE%B7%CF%82-%CE%9A%CE%BB%CF%89%CE%BD%CE%AC%CF%81%CE%B7%CF%82-%CE%93%CE%B5%CF%89%CF%80%CE%BF%CE%BD%CE%B9%CE%BA%CF%8C-%CE%A0%CE%B1%CE%BD%CE%B5%CF%80%CE%B9%CF%83%CF%84%CE%AE%CE%BC%CE%B9%CE%BF-%CE%91%CE%B8%CE%B7%CE%BD%CF%8E%CE%BD
0% found this document useful (0 votes)
224 views133 pages

ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Στάθης Κλωνάρης Γεωπονικό Πανεπιστήμιο Αθηνών

ΣΤΑΤΙΣΤΙΚΗ

Uploaded by

mpilias
Copyright
© Public Domain
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
0% found this document useful (0 votes)
224 views133 pages

ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Στάθης Κλωνάρης Γεωπονικό Πανεπιστήμιο Αθηνών

ΣΤΑΤΙΣΤΙΚΗ

Uploaded by

mpilias
Copyright
© Public Domain
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd

ΕΦΑΡΜΟΣΜΕΝΗ ΟΙΚΟΝΟΜΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στάθης Κλωνάρης

Γεωπονικό Πανεπιστήμιο Αθηνών

Προτεινόμενα Βιβλία
 Παρουσίαση των απαραίτητων εργαλείων και μεθόδων της
Στατιστικής Ανάλυσης για την δημιουργία και επεξεργασία
στατιστικών υποδειγμάτων στον χώρο των κοινωνικών
επιστημών.
 Έμφαση θα δοθεί στην κατανόηση και ερμηνεία των
αποτελεσμάτων.

Με την ολοκλήρωση των μαθημάτων ο φοιτητής θα


είναι σε θέση να:
 Γνωρίζει τεχνικές περιγραφικής Στατιστικής
 Επιλέγει και υλοποιεί την κατάλληλη τεχνική επαγωγικής στατιστικής
 Ερμηνεύει τα αποτελέσματα τν ποσοτικών και ποιοτικών
αναλύσεων.

Περιεχόμενο του Μαθήματος

 Είδη στατιστικών δεδομένων και τρόποι


Συλλογής τους.
 Παρουσίαση δεδομένων.
 Βασικά Χαρακτηριστικά δεδομένων.
 Έλεγχοι Υποθέσεων.
 Απλή Γραμμική Παλινδρόμηση.
 Θέματα Αριθμοδεικτών.
Γιατί χρειαζόμαστε την
Στατιστική

Εκλογικές Δημοσκοπήσεις
Έρευνα Αγοράς
Αθλητική Στατιστική

Μεταβολή: +21.58 Χαμηλό 52 εβδ.: 754.16

Άνοιγμα: 1013.99 % Μεταβολή: +2.13%

Χαμηλό ημέρας: 1011.49 Υψηλό 52 εβδ.: 1159.97


Προηγ.
1011.67 Υψηλό ημέρας: 1033.94
Κλείσιμο:
Τελ. Συναλλαγή: 1033.25 Εύρος ημέρας: 1011.49 - 1033.94
Όχι πια τεχνική, αλλά συστημική η άνοδος του
ΧΑ – Απεγκλωβίζονται τα χαρτοφυλάκια που
μπήκαν στις αυξήσεις κεφαλαίου των τραπεζών

Ορισμοί
Στατιστική είναι η επιστήμη που ασχολείται με την
συγκέντρωση, την επεξεργασία και την ανάλυση δεδομένων
με σκοπό την εξαγωγή συμπερασμάτων τα οποία
χρησιμεύουν στην ήψη αποφάσεων.

Η στατιστική ανάλογα με το αντικείμενο με το οποίο ασχολείται


παίρνει και ιδιαίτερη ονομασία Κοινωνική στατιστική, Ιατρική
Στατιστική, Βιοστατιτική, Οικονομική Στατιστική, Στατιστική των
Επιχειρήσεων.

Η Στατιστική των Επιχειρήσεων είναι μία επίσημη που μας βοηθά


να πάρουμε επιχειρηματικές αποφάσεις κάτω από συνθήκες
αβεβαιότητας οι όποιες βασίζονται σε κάποιες αριθμητικές και
μετρήσιμές πηροφορίες.
Κλάδοι της Στατιστικής
Μονομεταβλητοί
Πληθυσμοί
ΠΕΡΙΓΡΑΦΙΚΗ
ΣΤΑΤΙΤΙΚΗ
Πολυμεταβλητοί
Πλυθησμοί

ΣΤΑΣΤΙΚΗ
Εκτίμηση σε
σημείο
Στατιστική
Εκτίμηση
ΕΠΑΓΩΓΙΚΗ Εκτίμηση σε
ΣΤΑΤΙΚΗ Έλεγχος
Διιάστημα
στατιστικών
Υποθέσεων

Επιχειρηματικά Προβλήματα και


Βασικές Στατιστικές Μέθοδοι

Παρουσίαση και Διεξαγωγή Προβλέψεις


Περιγραφή Συμπερασμάτων Μεγεθών
Δεδομένων (Μεταβλητών)

Είδη και Τρόποι Βασικές Απλή Συσχέτιση


Συλλογής Κατανομές και Παλινδρόμηση
Δεδομένων Πιθανοτήτων

Πίνακες και Κανονική Πολλαπλή


Διαγράμματα Κατανομή Συσχέτιση και
και Κατανομές Παλινδρόμηση
Δειγματοληψίας

Περιγραφική Εκτιμητική Ανάλυση


Στατιστική Χρονολογικών
Σειρών

Ελεγχοι
Υποθέσεων
Ορισμός Περιγραφικής Στατιστικής
Με τον όρο αυτό περιγράφουμε τις μεθόδους
που ασχολούνται με την συλλογή, παρουσίαση
και χαρακτηρισμό των δεδομένων του
Δείγματος ή Πληθυσμού

Πίνακες
Διαγράμματα
Μέτρα Διασποράς
Μέτρα Κεντρικής Τάσης και Θέσης

Ορισμός Επαγωγικής Στατιστικής


Έτσι ορίζονται οι μέθοδοι που μας βοηθούν να
εκτιμήσουμε τα χαρακτηριστικά ενός πληθυσμού με
βάση τα αποτελέσματα που προκύπτουν από τις
παρατηρήσεις ενός δείγματος - Εξαγωγή
συμπερασμάτων για τον Πληθυσμό

Εκτίμηση παραμέτρων Πληθυσμού

Έλεγχος υποθέσεων
Εφαρμογές της Στατιστικής στον Οικονομικό
Τομέα
Μέτρηση οικονομικής δραστηριότητας (δείκτες κ.λπ.)
Ανάλυση Τιμών
Ανάλυση διαχρονικών διακυμάνσεων
Έλεγχος ποιότητας
Έρευνα αγοράς
Πωλήσεις
Λογιστικά - Οικονομικά

κ.λ.π.

Χρήση των αποτελεσμάτων

Λήψη αποφάσεων
Προβλέψεις
Δεδομένα
Δεδομένα είναι οι αριθμητικές πληροφορίες που
συλλέγουμε και στην συνέχεια επεξεργαζόμαστε για
να πάρουμε μία απόφαση

Κλίμακα λόγου
Κλίμακα διαστήματος
} Ποσοτικά
δεδομένα

Ποιοτικά
Κλίμακα ιεράρχησης
Ονομαστική Κλίμακα } δεδομένα

Κατηγορίες Δεδομένων

Ποσοτικά Ποιοτικά
Χαρακτηριστικά Χαρακτηριστικά

Κλίμακα Κλ ίμακα Κλίμακα Ονομαστική


Λόγου Διαστήματος Ιεράρχησης Κλίμακα
· Αξία · Θερμοκρασί · Βαθμολογία · Επάγγελμα
· Όγκος α · Scores · Οικογενεια
· Μήκος · Tests · Ένταση κή
· Επιφάνεια (GMATT, γνώμης κατάσταση
· Ταχύτητα GRE, · Κλάδος
TOEFL οικονομίας
· Tests προσω-
πικότητας
Τρόποι Συλλογής Δεδομένων

 Απογραφή

 Δειγματοληψία

 Συνεχής Καταγραφή

Είδος Δεδομένων

ΣΥΝΕΧΗΣ ΚΑΤΑΓΡΑΦΗ: Δημοσιευμένα στοιχεία


από οργανισμούς (ΕΣΥΕ, EUROSTAT, FAO), ή
Ιδιωτικές εταιρείες π.χ. ICAP

ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΕΡΕΥΝΗΤΙΚΑ: Δεδομένα που


προκύπτουν από πρωτογενή έρευνα π.χ.
δεδομένα ΕΟΠ, ΔΙΓΕΛΠ, δεδομένα από ένα
ερευνητικό πρόγραμμα (ISAFRUIT), και τέλος
δεδομένα που προκύπτουν από κάποια έρευνα
αγοράς
Μέθοδοι δειγματοληψίας

Απλή τυχαία δειγματοληψία

Τυχαία συστηματική δειγματοληψία

Στρωματοποιημένη τυχαία δειγματοληψία

Δειγματοληψία σε πολλά στάδια

Δειγματοληψία Ποσοστών

Πρόβλημα

Για τις ανάγκες μιας έρευνας πρέπει να


υπολογιστεί το ποσοστό της συνολικής δαπάνης
που τα νοικοκυριά μιας συγκεκριμένης περιοχής
αφιερώνουν για την αγορά τροφίμων
Πληθυσμός

Χρόνος Διαφορετικά
Δείγμα
Χρηματοδότηση

Γιατί Δείγμα;
Η συλλογή στοιχείων που αφορούν τον πληθυσμό
Πολύ χρονοβόρα
Απαγορευτικά ακριβή
Αδύνατη (π.χ. Έλεγχος ποιότητας)

Μέθοδος Δειγματοληψίας ;

Δειγματοληψία Ποσοστών
Πληθυσμός

Δαπάνη για Τρόφιμα


Μεταβλητές
Συνολική Δαπάνη

Μέσο % Δαπάνης για Τρόφιμα =


Σ(Δαπάνη για Τρόφιμα)/Σ(Συνολική Δαπάνη)

Περιγραφική
Στατιστική

Δείγμα
Μέγεθος Δείγματος
Δαπάνη για Τρόφιμα
Μεταβλητές
Συνολική Δαπάνη

Μέσο % Δαπάνης για Τρόφιμα = Περιγραφική


Στατιστική
Σ(Δαπάνη για Τρόφιμα)/Σ(Συνολική Δαπάνη)

Εκτίμηση του Μέσου % στον πληθυσμό


Διάστημα Εμπιστοσύνης για τον Μέσο του Πληθυσμού

Επαγωγική
Στατιστική
Τα αριθμητικά δεδομένα
και η παρουσίασή τους

Αριθμητικά δεδομένα
Δεδομένα είναι οι αριθμητικές πληροφορίες που συλλέγουμε και
στην συνέχεια επεξεργαζόμαστε για να πάρουμε μία απόφαση

Οι τιμές που παίρνουν τα διάφορα


χαρακτηριστικά που διερευνούμε

Μεταβλητές

Μεταβλητές
Συνεχείς
Διακριτές
Παρουσίαση αριθμητικών δεδομένων

Πίνακες Διαγράμματα

Ταξινόμηση του πρωτογενούς Προκαλούν προσοχή


υλικού.
Αποκαλύπτονται πιο εύκολα τα Άμεση αντίληψη του θέματος
χαρακτηριστικά του Αφετηρία και οδηγός στατιστικών
φαινομένου που διερευνάται διερευνήσεων

Στοιχεία Στοιχεία
Τίτλος
Τίτλος
Επικεφαλίδες στηλών
Κλίμακα
Πηγή
Πηγή
Υποσημειώσεις

Πίνακας 2.1: Πρωτογενή Δεδομένα Τμήματος


Προσωπικού
Πίνακας Συχνοτήτων
• Επιλογή του κατάλληλου αριθμού διαστημάτων –
Διαστήματα τάξης
• Σωστό πάτος (εύρος) των διαστημάτων τάξης
πλάτος διαστημάτων = εύρος τιμών / επιθυμητός αριθμός
διαστημάτων
Προσοχή: Στρογγυλοποιημένο πλάτος και Στρογγυλά όρια
διαστημάτων
• Καθορισμός των ορίων των διαστημάτων τάξης

Καθορισμός αριθμών τάξεων


• Συλλέξτε τα Δεδομένα  Αριθμός των Αριθμός
Παρατηρήσεων Τάξεων
• Δημιουργήστε μία κατανομή
συχνοτήτων για τα δεδομένα < 50 5-7

50-200 7-9
• Πως;
200-500 9-10
• α) Καθορίστε τον αριθμό
των τάξεων … 500-1000 10-11
• Πως; -> Κοιτάξτε τον 1000-5000 11-13
παρακάτω πίνακα
Με 200 παρατηρήσεις, θα 5000-50000 13-17
πρέπει να έχουμε μεταξύ 7
& 10 τάξεις… > 50000 17-20
Εναλλακτικά, μπορούμε να χρησιμοποιήσουμε τον τύπο
του Sturges: Αριθμός των τάξεων = 1 + 3.3 log10 (n)
Πίνακας 2.3: Κατανομή Συχνοτήτων των Ετησίων Αποδοχών

Πίνακας 2.4 Κατανομή του Προσωπικού ανά Κατηγορία


Διάγραμμα 2.1
Ιστόγραμμα Κατανομής Συχνοτήτων Ετησίων Αποδοχών

Διάγραμμα 2.2
Ποσοστιαία Κατανομή Συχνοτήτων και Πολυγωνική Γραμμή των
Ετήσιων Αποδοχών
Διάγραμμα 2.3
Ποσοστιαίες Κατανομές των Αρχικών και Σημερινών Αποδοχών

Διάγραμμα 2.4
Ποσοστιαίες Αθροιστικές Πολυγωνικές Γραμμές των Αρχικών και
Σημερινών Αποδοχών
ΠΙΝΑΚΑΣ 1
Πραγματικός πληθυσμός της χώρας κατά ομάδες ηλικιών

Ομάδες Ατομα
Ηλικιών
0-4 556,987
5-9 663,434
10-14 754,446
15-19 766,605
20-24 791,412
25-29 721,751
30-34 728,940
35-39 681,316
40-44 673,251
45-49 559,963
50-54 657,315
55-59 655,264
60-64 644,864
65-69 453,855
70-74 344,023
75 - 606,474
Σύνολο 10,259,900
Πηγή : ΕΣΥΕ

Ιστόγραμμα

ΔΙΑΓΡΑΜΜΑ 1
Πραγματικός Πληθυσμος της χώρας κατά ομάδες ηλικιών

900,000

800,000

700,000

600,000

500,000

400,000

300,000

200,000

100,000

0
0-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75 -

Πηγή: ΕΣΥΕ
ΠΙΝΑΚΑΣ 2
Εγχώρια Ιδιωτική Κατανάλωση κατά λειτουργικές διακρίσεις
Σε εκατ. δρχ. - Σε σταθερές τιμές 1970

Κατηγορίες 1950 1955 1960 1965 1970 1975 1980 1985 1990
1. Τρόφιμα, ποτά και καπνός 37,701 46,901 54,245 70,242 87,322 103,980 121,713 132,492 144,429
1.1 Τρόφιμα 32,132 40,576 46,392 60,955 73,420 86,113 95,479 96,961 104,225
1.1.1 Ψωμί & άλλα δημητριακά 7,264 7,299 6,982 6,918 7,065 7,411 8,093 6,231 6,752
1.1.2 Κρέας 3,050 5,043 6,978 11,718 16,273 21,508 25,569 27,047 29,754
1.1.3 Ψάρια 2,211 2,447 3,515 4,348 3,534 3,456 3,597 3,563 4,657
1.1.4 Γάλα, τυρί, αυγά 4,168 6,493 7,686 10,273 12,421 14,665 15,187 17,086 17,282
1.1.5 Λάδι & λίπη 4,045 4,671 4,977 6,457 6,681 7,326 7,561 8,303 7,261
1.1.6 Φρούτα & λαχανικά 8,636 10,982 11,313 15,132 18,218 20,546 21,997 21,311 23,698
1.1.7 Πατάτες & λοιποί βολβοί 1,474 1,778 2,167 2,091 2,110
1.1.8 Ζάχαρη 2,092 2,749 3,831 4,584 1,642 1,685 1,777 1,858 1,887
1.1.9 Καφές, τσάϊ, κακάο 455 570 730 1,008 1,192 1,861 1,718 2,416 2,764
1.1.10 Λοιπά τρόφιμα & ζαχαρωτά 211 322 380 517 4,920 5,877 7,813 7,055 8,060
1.2 Ποτά 2,985 3,108 3,644 4,043 6,625 7,721 12,442 15,988 19,909
1.2.1 Μη οινοπνευματώδη ποτά 279 395 913 1,549 2,658 2,767 4,196
1.2.2 Οινοπνευματώδη ποτά 2,985 3,108 3,365 3,648 5,712 6,172 9,784 13,221 15,713
1.3 Καπνός 2,584 3,217 4,209 5,244 7,277 10,146 13,792 19,543 20,295
2. Ένδυση & Υπόδηση 5,880 7,536 9,833 16,796 26,212 33,953 34,684 28,363 29,171
3. Στέγαση, θέρμανση & φωτισμός 9,837 12,549 15,700 20,740 29,503 40,573 54,035 61,928 70,945
4. Έπιπλα, είδη επιπλ. & οικιακός εξοπλισμός 4,907 6,167 8,401 12,057 15,597 24,072 27,077 28,527 30,549
5. Δαπάνες υγείας 2,878 3,485 3,854 5,004 8,731 9,986 11,383 11,857 12,286
6. Μεταφορές & επικοινωνίας 2,852 4,607 6,516 10,480 17,604 28,092 41,034 57,838 67,368
7. Αναψυχή, διασκέδαση, εκπαίδευση 4,877 6,536 9,074 13,087 10,143 12,008 14,125 20,804 23,818
8. Λοιπά αγαθά & υπηρεσίες 734 859 1,121 1,443 15,849 21,925 27,295 29,662 33,794
ΣΥΝΟΛΟ 69,666 88,640 108,744 149,849 210,961 274,589 331,346 371,471 412,360

Πηγή: ΕΣΥΕ

ΔΙΑΓΡΑΜΜΑ 2
Εγχώρια Ιδιωτική Κατανάλωση των Κατηγοριών Τροφίμων και Ενδυσης
(Σε σταθερές τιμές 1970=100)

180,000
160,000
Τρόφιμα
140,000
120,000
100,000
80,000
60,000
Ένδυση
40,000
20,000
0
1940 1950 1960 1970 1980 1990 2000

Πηγή ΕΣΥΕ
ΠΙΝΑΚΑΣ 3
Πραγματικός πληθυσμός της χώρας κατά ομάδες ηλικιών

0- 9 1,220,421 μέχρι 9 1,220,421 όλοι


10 - 19 1,521,051 μέχρι 19 2,741,472 πάνω από 9 9,039,479
20 - 39 2,923,419 μέχρι 39 5,664,891 πάνω από 19 7,518,428
40 - 59 2,545,793 μέχρι 59 8,210,684 πάνω από 39 4,595,009
60 - 74 1,442,742 μέχρι 74 9,653,426 πάνω από 59 2,049,216
75 - 606,474 όλοι 10,259,900 πάνω από 74 606,474

12,000,000
3.500.000
10,000,000
3.000.000
2.500.000
8,000,000

2.000.000 6,000,000
1.500.000 4,000,000 Δεξιόστροφη
1.000.000 Αθροιστική
2,000,000
500.000 Πολυγωνική
0
0 Γραμμή
0- 9 10 - 19 20 - 39 40 - 59 60 - 74 75 - 0 1 2 3 4 5 6 7

10000000
9000000
8000000
7000000
6000000
5000000
4000000 Αριστερόστροφη
3000000
Αθροιστική
2000000
1000000 Πολυγωνική
0 Γραμμή
0 1 2 3 4 5 6 7

Κυκλικά Διαγράμματα Κατανομή της Χρησιμοποιούμενης Γεωργικής Γής κατα βασικές κατηγορίες
χρήσεως

Μόνιμα Λειβάδια και


Βοσκότοποι
(16.9 %)

Αροτραίες
Μόνιμες Φυτείες καλλιέργειες
(27.8%) (55.0%)

Οικογενειακοί
Λαχανόκηποι
(0.3%)

Κατανομή του αριθμού των ημερών απασχόλησης που πραγματοποιήθηκε στη


γεωργίακατά κατηγορία εργαζομένων
Απασχόληση χωρίς
αμοιβή
Εποχιακοί εργάτες Λοιποί εργάτες
1.9%
10.1% 1.0%

Μόνομοι Εργάτες
1.6%

Κάτοχοι και μέλη του


νοικοκοιριού
85.5%
Απλό Ακιδωτό Διάγραμμα

Συνολικές Επενδύσεις

10,000,000

8,000,000
Εκατ.Δρχ

6,000,000
4,000,000

2,000,000

0
1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

Έτος

Ακιδωτό Διάγραμμα Συνιστωσών

Ποσοστό Συνολικών και Αγροτικών Επενδύσεων στο Συνολικό και


Γεωργικό ΑΕΠ

40.0%

30.0%

20.0%

10.0%

0.0%
1995 1996 1997 1998 1999 2000

Συνολικές Επενδύσεις Αγροτικές Επενδύσεις


Πολλαπλό Ακιδωτό Διάγραμμα

Ποσοστό Συνολικών και Αγροτικών Επενδύσεων στο Συνολικό και


Γεωργικό ΑΕΠ

22.6%
21.1% 21.7%
19.5% 19.8%
18.6%

12.3% 12.8%
11.5%
10.0%
7.4% 8.2%

1995 1996 1997 1998 1999 2000

Συνολικές Επενδύσεις Αγροτικές Επενδύσεις

Ποσοστιαίο Ακιδωτό Διάγραμμα

Ποσοστό Συνολικών και Αγροτικών Επενδύσεων στο Συνολικό και


Γεωργικό ΑΕΠ

7,4% 8,2% 10,0% 11,5%


12,3% 12,8%

18,6% 19,5% 19,8% 21,1% 21,7% 22,6%

1995 1996 1997 1998 1999 2000

Συνολικές Επενδύσεις Αγροτικές Επενδύσεις


Διαγραμματική Παραπλάνηση
• Απουσία αρίθμησης σε έναν από
τους δύο άξονες
• Η λεζάντα που συνοδεύει το
γράφημα
• Η ύπαρξη απολύτων και όχι
σχετικών τιμών (ποσοστών).

Διαγραμματική Παραπλάνηση
Πωλήσεις

0 2 9 16 23 30
Έτος
Διαγραμματική Παραπλάνηση
13

Η πολυπόθητη αποκλιμάκωση
12

των επιτοκίων επιτέλους άρχισε


Επιτόκιο %
11

10

8
0 2 9 16 23 30
Ιούλιος
13

Μια μικρή εβδομαδιαία ανάσα 12

στην αδιάκοπη πορεία των


Επιτόκιο %

11

επιτοκίων 10

8
0 2 9 16 23 30
Ιούλιος

Διαγραμματική παραπλάνηση
1565

1560

1555

1550

1545
DJIN

1540

1535 2,00%

1530 1,50%

1,00%
1525

0,50%
1520
3/1/2010 4/1/2010 5/1/2010 6/1/2010 7/1/2010 8/1/2010 9/1/2010 10/1/2010
DJIN

0,00%
3/1/2010 4/1/2010 5/1/2010 6/1/2010 7/1/2010 8/1/2010 9/1/2010 10/1/2010
-0,50%

-1,00%

-1,50%

-2,00%
Γραμμοδιάγραμμα ή Χρονοδιάγραμμα
Εξέλιξη του μεριδίου δαπάνης για αγορά τροφίμων την περίοδο 1950-1995

0.6

0.5

0.4
Budget Shares

0.3

0.2

0.1

0
1950 1953 1956 1959 1962 1965 1968 1971 1974 1977 1980 1983 1986 1989 1992 1995
Time

Food at Home

Γραμμοδιάγραμμα ή Χρονοδιάγραμμα
Διαφορετική κλίμακα
Evolution of expenditure Shates over the period 1950-1995

0.55

0.5
Budget Shares

0.45

0.4

0.35
1950 1953 1956 1959 1962 1965 1968 1971 1974 1977 1980 1983 1986 1989 1992 1995
Time

Food at Home
ΕΡΕΥΝΑ
ΠΡΟΘΕΣΗΣ
ΨΗΦΟΥ
“ΒΗΜΑ ΤΗΣ
ΚΥΡΙΑΚΗΣ”
10/10/2010

Η ΤΑΥΤΟΤΗΤΑ ΤΗΣ ΕΡΕΥΝΑΣ


Τάση συγκέντρωσης Μέτρα Κεντρικής Τάσης
και Θέσης

Τάση διασποράς Μέτρα Διασποράς

Σχήμα Σχήμα της κατανομής


Αριθμητικός Μέσος

Γεωμετρικός Μέσος Μέτρα Κεντρικής Τάσης


Αρμονικός Μέσος

Διάμεσος ή Κεντρική Τιμή


Τεταρτημόρια Μέτρα Κεντρικής Θέσης
Τύπος ή Επικρατούσα Τιμή
Αριθμητικός Μέσος

n
Απλός ή Αστάθμιστος
Αριθμητικός Μέσος
X i
X i 1
n
Παράδειγμα
2 2,1 2,3 3,2 3,2 2,3
3,3 4,1 3,3 3,5 3,5 3,5
3,7 3,7 3,7 5,7 3,9 3,9
3,9 3,9 4,1 4,3 4,3 4,3
4,4 4,4 4,5 5,7 5,7 6

Σταθμικός Αριθμητικός Μέσος


w X i i
X i 1
n

w
i 1
i

Παράδειγμα

Τιμή (Χ) Ποσότητα (w) w iX i


120 1000 120000
150 5000 750000
180 6000 1080000
200 3000 600000
15000 2550000
k
Αριθμητικός Μέσος Κατανομής
Συχνοτήτων
fX i i
X i 1
k
Παράδειγμα
Xi fi f iX i
f i 1
i
2,0 1,0 2,0
2,1 1,0 2,1
2,3 2,0 4,6
3,2 2,0 6,4
3,3 2,0 6,6
3,5 3,0 10,5
3,7 3,0 11,1
3,9 4,0 15,6
4,1 2,0 8,2
4,3 3,0 12,9
4,4 2,0 8,8
4,5 1,0 4,5
5,7 3,0 17,1
6,0 1,0 6,0

Αριθμητικός Μέσος Κατανομής k


Συχνοτήτων  f X i i
(Τάξεις μεγέθους) X i 1
k

Παράδειγμα
f
i 1
i

fi Xi fiX i
2,0 - 2,9 4 2.45 9.8
3,0 - 3,9 14 3.45 48.3
4,0 - 4,9 8 4.45 35.6
5,0 - 6,0 4 5.5 22
30 115.7
Αποτελεί το πιο σημαντικό μέτρο
κεντρικής τάσης

Επηρεάζεται από όλες τις τιμές

Γεωμετρικός Μέσος

Απλός Γεωμετρικός Μέσος

Παράδειγμα
2,0 2,1 2,3 3,2 3,2 2,3
3,3 4,1 3,3 3,5 3,5 3,5
3,7 3,7 3,7 5,7 3,9 3,9
3,9 3,9 4,1 4,3 4,3 4,3
4,4 4,4 4,5 5,7 5,7 6,0
Γεωμετρικός Μέσος Κατανομής
Συχνοτήτων

Ιδιότητες Γεωμετρικού Μέσου

α) Για να υπολογιστεί απαιτείται


β)
γ) Επηρεάζεται λιγότερο από τις ακραίες τιμές

δ) Δεν έχει ευρεία εφαρμογή


Αρμονικός Μέσος

Απλός Αρμονικός Μέσος

Αρμονικός Μέσος Κατανομής


Συχνοτήτων

Ιδιότητες Αρμονικού Μέσου

Παράδειγμα
Ένα προϊόν πωλείται σε τρία καταστήματα σε διαφορετική τιμή.
Με 10000 δρχ. μπορούν να αγοραστούν 10 μονάδες στο 1ο
κατάστημα, στο 2ο κατάστημα 8 μονάδες και στο 3ο 16 μονάδες.
Ζητείται ο αριθμός των μονάδων που μπορούν να αγοραστούν
κατά μέσο όρο με 10000 δρχ.

Α. Μέσος = (10+8+16)/3 = 11,333 Μέση Τιμή = 10000/11,333 = 882,3


Πραγματική Μέση Τιμή = (1000+1250+625)/3 = 958,3
Μέσος αριθμός μονάδων = Δαπάνη / Μέση Τιμή

Αρμονικός Μέσος
Διάμεσος ή Κεντρική Τιμή (Median)
Χωρίζει την σειρά των δεδομένων στην μέση αν αυτά τοποθετηθούν
κατά αύξουσα ή φθίνουσα τάξη μεγέθους . Είναι η τιμή που βρίσκεται
στο μέσο αυτών. Είναι χρήσιμο μέτρο για δείγματα με μεγάλο μέγεθος.
Θέση Διαμέσου (n+1)/2
2,0 3,5 4,3
2,1 3,7 4,3 Αν n άρτιος η διάμεσος έχει θεωρητική τιμή
Παράδειγμα
2,3 3,7 4,3
2,3 3,7 4,4
3,2 3,9 4,4
3,2 3,9 4,5 Θέση Διαμέσου (30+1)/2=15,5
3,3 3,9 5,7
3,3 3,9 5,7 Διάμεσος = Μ= 3,9
3,5 4,1 5,7
3,5 4,1 6,0

Διάμεσος κατανομής με
διαστήματα τάξεων

Fi = το κατώτερο όριο της κλάσης που περιέχει την διάμεσο


δ = το εύρος της κλάσεως
fi = συχνότητα της κλάσεως
Φi-1= αθροιστική συχνότητα προηγούμενης κλάσης

Παράδειγμα

fi Xi Φi
2,0 - 2,9 4 2,45 4
3,0 - 3,9 14 3,45 18
4,0 - 4,9 8 4,45 26
5,0 - 6,0 4 5,45 30
30
Τεταρτημόρια
Χωρίζουν την σειρά των δεδομένων σε 4 ίσα μέρη αν
αυτά τοποθετηθούν κατά αύξουσα τάξη μεγέθους

Θέση 1ου Τεταρτημόριου (n+1)/4


Θέση 2ου Τεταρτημόριου (n+1)/2 (Διάμεσος)
Θέση 3ου Τεταρτημόριου 3(n+1)/4

Τύπος ή Επικρατούσα Τιμή (Mode)


Η τιμή με την μεγαλύτερη συχνότητα ν που παρουσιάζεται τις
περισσότερες φορές

Εκτίμηση της Διαμέσου και των Τεταρτημορίων


με Γραμμική Παρεμβολή
100%
95%
90%
85%
80%
75%
Ποσοατά Εργαζομένων (%)

70%
65%
60%
55% Q1=L Q1+δ(n/4 - F Q1-1)/f Q1 =4+2(190/4-4)/47=5,851 εκ. δρχ.
Μ=LM + δ  (n/2 - FM-1)/fM = 6+2(190/2-51/68 = 7,294 εκ. δρχ.
50%
45%
40% Q3=L Q3+δ(3n/4-F Q3-1)/f Q3=8+2(3190/4-119)/25=9,880 εκ. δρχ.
35%
30%
25%
20%
15%
10%
5%
0%
Q1 M Q3
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34
Ετήσιες Αμοιβές (εκ. δρχ.)
Θηκόγραμμα (Box Plot)…
 Το θηκόγραμμα (box plot) είναι μία γραφική τεχνική η οποία σχεδιάζει
πέντε στατιστικές:
 την μικρότερη την μεγαλύτερη παρατήρηση, το πρώτο, δεύτερο, και τρίτο
τεταρτημόριο.

Μύστακας (1.5*(Q3–Q1))
Οι προεκτεινόμενες γραμμές στα αριστερά και στα δεξιά καλούνται μύστακες
(whiskers). Κάθε σημείο που πέφτει έξω από τους μύστακες καλείται ακραία τιμή
(outlier). Οι μύστακες επεκτείνονται προς τα έξω στο μικρότερο από το (1.5 φορά
το ενδοτεταρτημοριακό εύρος) ή στην ποιο τελευταία τιμή η οποία δεν είναι
ακραία.

Θηκόγραμμα (Box Plot)…

 Αυτά τα θηκογράμματα είναι


από δεδομένα με χρόνος
εξυπηρέτησης πελατών.

 Ο χρόνος εξυπηρέτησης στα


Wendy’s είναι ο μικρότερος
και λιγότερο μεταβλητός.

 Στα Hardee’s o χρόνος


εξυπηρέτησης έχει την
μεγαλύτερη μεταβλητότητα,
ενώ στα Jack-in-the-Box έχει
τον μεγαλύτερο χρόνος
εξυπηρέτησης.
Σύγκριση Μέτρων Κεντρικής
Τάσης και Θέσης
Μόνο στα μέτρα Κ. Τάσης μπορούν να γίνουν αλγεβρικές πράξεις

Ο Αριθμητικός μέσος υπολογίζεται σε κάθε περίπτωση. Ο


Γεωμετρικός και Αρμονικός Μέσος δεν δέχονται τιμές < = 0

Όταν αναφερόμαστε σε ολόκληρο τον πληθυσμό. Επίσης


ισχύει για τις μεταβλητές που ακολουθούν συμμετρικές
κατανομές (π.χ. Κανονική, t-κατανομή, Τυπική κατανομή)

Στις κατανομές με σχήμα καμπύλης, κοίλης προς τα δεξιά

Στις κατανομές με σχήμα καμπύλης, κοίλης προς τα


αριστερά
Γιατί μετράμε την διασπορά;

Παράδειγμα
Δίνεται το ετήσιο ποσοστό κέρδους δύο επιχειρήσεων για 6
χρόνια. Αν έπρεπε να επιλέξετε την μετοχή μιας εκ των 2 με
κριτήριο το ποσοστό κέρδους αυτά τα 6 χρόνια. Ποια θα ήταν η
επιλογή;
Έτος 1η Επιχείρηση 2η Επιχείρηση
1990 5,2 7,9
1991 4,5 7,0
1992 3,9 -5,3
1993 4,8 14,2
1994 5,0 -11,0
1995 5,4 16,0

Ο Αριθμητικός Μέσος και στις δύο περιπτώσεις είναι 4,8

ΜΕΤΡΑ ΔΙΑΣΠΟΡΑΣ

Εύρος
Τεταρτημοριακή Απόκλιση ή Ημι-
ενδοτεταρτημοριακό Εύρος
Μέση Απόκλιση
Διακύμανση και Τυπική Απόκλιση
Συντελεστής Μεταβλητότητας

Συντελεστής Gini
Εύρος
Η διαφορά μεγαλύτερης και μικρότερης τιμής

Πλεονέκτημα: Εύκολος τρόπος υπολογισμού


Μειονέκτημα: Εξαρτάται από τις ακραίες τιμές
Δίνει μια πρώτη γρήγορη εικόνα της διασποράς

Συνήθεις χρήσεις: Θερμοκρασίες Τιμές


χρηματιστηρίου
Σε στατιστικές που αφορούν
ποιοτικούς ελέγχους στην
βιομηχανία

Τεταρτημοριακή Απόκλιση

Λαμβάνει υπόψη το 50% των δεδομένων


Πλεονέκτημα: Δεν επηρεάζεται από τις ακραίες τιμές
Εξαρτάται αποκλειστικά από δύο τιμές
Μέση Απόκλιση

Αταξινόμητα στοιχεία Ταξινομημένα στοιχεία

Βασικό πλεονέκτημα:
εξαρτάται από όλες τις τιμές της μεταβλητής

Βασικό μειονέκτημα:
Περιορισμένη δυνατότητα αλγεβρικών υπολογισμών

Διακύμανση και Τυπική Απόκλιση


Το σημαντικότερο μέτρο διασποράς λόγω των σημαντικών
μαθηματικών ιδιοτήτων που έχει

Διακύμανση Τυπική Απόκλιση

Πληθυσμός

Δείγμα

Αμερόληπτη
Εκτίμηση του σ2
Διακύμανση Τυπική Απόκλιση
Αμερόληπτη
Εκτίμηση του σ2 για
Ταξινομημένα
στοιχεία

Μεγαλύτερες αποκλίσεις έχουν μεγαλύτερο βάρος από τις


μικρότερες.
Είναι προτιμότερες πολλές και μικρές αποκλίσεις από λίγες και
μεγάλες.

Η τυπική απόκλιση χρησιμοποιείται γιατί μετράται σε


μονάδες μέτρησης της μεταβλητής

Παράδειγμα i ( i - )
2.0 -1.9 3.5
2.1 -1.8 3.2
2.3 -1.6 2.5
2.3 -1.6 2.5
3.2 -0.7 0.5
3.2 -0.7 0.5
3.3 -0.6 0.3
3.3 -0.6 0.3
3.5 -0.4 0.1
3.5 -0.4 0.1
3.5 -0.4 0.1
3.7 -0.2 0.0
3.7 -0.2 0.0
3.7 -0.2 0.0
3.9 0.0 0.0
3.9 0.0 0.0
3.9 0.0 0.0
3.9 0.0 0.0
4.1 0.2 0.0
4.1 0.2 0.0
4.3 0.4 0.2
4.3 0.4 0.2
4.3 0.4 0.2
4.4 0.5 0.3
4.4 0.5 0.3
4.5 0.6 0.4
5.7 1.8 3.3
5.7 1.8 3.3
5.7 1.8 3.3
6.0 2.1 4.5
116.4 0.0 29.8
Θεώρημα Chebyshev
Ανεξάρτητα από την μορφή της κατανομής μέσα
στο διάστημα βρίσκεται τουλάχιστον το
μέρος των τιμών της Χ

στο διάστημα βρίσκεται τουλάχιστον το 75%


Παράδειγμα
στο διάστημα βρίσκεται τουλάχιστον το 88%

Συντελεστής Μεταβλητότητας
ή Σχετική Διασπορά
Αποτελεί σχετική μέτρηση της διασποράς και
εκφράζεται ως ποσοστό επι τοις εκατό %

Πληθυσμός Δείγμα

Δεν εξαρτάται από τη μονάδα μέτρησης της μεταβλητής και


επιτρέπει την σύγκριση μεταβλητών ή ομάδων δεδομένων που
εκφράζονται σε διαφορετικές μονάδες μέτρησης
Σχετική Θέση τιμών

Η στατιστική Ζ μας πληροφορεί πόσες τυπικές αποκλίσεις


μία τιμή του δείγματος είναι πάνω ή κάτω από τον μέσο
όρο του δείγματος.
Η καμπύλη Lorenz
και ο συντελεστής Gini
Μέτρο ανισοκατανομής ή συγκέντρωσης: Ελέγχουν πόσο
έντονα ανισοκατανέμεται η συνολική τιμή μιας μεταβλητής
(π.χ. Γεωργικό οικογενειακό εισόδημα, Γεωργική Γη) στα
μέλη ενός πληθυσμού (π.χ. στους νομούς της Ελλάδος ).

Η ένταση της ανισοκατανομής ελέγχεται διαγραμματικά


με την καμπύλη Lorenz είτε υπολογιστικά με τον
συντελεστή Gini
Η καμπύλη Lorenz είναι μια μέθοδος γραφικής απεικόνισης
της ανισότητας.
Βασίζεται στην σχέση της ποσοστιαίας αθροιστικής κατανομής
ενός μεγέθους με την κατανομή των μονάδων που αντιστοιχούν
σ΄ αυτή.

Παράδειγμα

Τα μηνιαία εισοδήματα 6 εργαζομένων είναι: 190, 165,


300, 230, 150 και 580 χιλ. δρχ. Να κατασκευαστεί η
καμπύλη Lorenz. Να συγκριθεί με την καμπύλη που
προκύπτει από τα εισοδήματα 160 , 170, 190, 220, 250 και
420 χιλ. δρχ.

Yi fi Fi Fi% Φi Φi%
150 1 1 (1/6) = 0.1666 150 (150/1615) =0.0929
165 1 2 (2/6) = 0.3333 315 (315/1615) =0.1950
190 1 3 (3/6) = 0.5000 505 (505/1615) = 0.3127
230 1 4 (4/6) = 0.6666 735 (735/1615) = 0.4551
300 1 5 (5/6) = 0.8333 1035 (1035/1615)=0.6409
580 1 6 (6/6) =1.0000 1615 (1615/1615)=1.0000
1615 6
1,00

0,90
0,80

0,70
0,60

0,50 B
0,40 A

0,30
0,20

0,10
0,00
0,00 0,17 0,33 0,50 0,67 0,83 1,00

Συντελεστής Gini

Δείκτης ανισότητας που βασίζεται στην καμπύλη Lorenz.


Δίνει το λόγο του εμβαδού ανισοκατανομής που είναι με
μεγάλη προσέγγιση το εμβαδόν του κάτω δεξιά τριγώνου
της καμπύλης Lorenz.

Όσο μεγαλύτερη είναι η ανισότητα τόσο μεγαλύτερο είναι και το


εμβαδόν μεταξύ της καμπύλης Lorenz και της διαγωνίου.

Ο συντελεστής Gini αντιπροσωπεύει το μερίδιο του εμβαδού


μεταξύ της καμπύλης Lorenz και της διαγωνίου στο συνολικό
εμβαδόν του τριγώνου που ορίζεται από την διαγώνιο και τους
δύο άξονες.
1η μέθοδος (Γεωμετρική)

Φi+1

Φi

O Fi Fi+1

Εμβαδόν κάτω από την καμπύλη Lorenz και μεταξύ των σημείων Fi και Fi+1

( Fi +1 - Fi )  i + 1
2
( Fi +1 - Fi )( i +1
 -  i) =
1
2
( Fi +1 - Fi )(  i +1 +  i )

1 n -1
Εμβαδόν κάτω από την καμπύλη Lorenz  (Fi +1 - Fi )( i +1 +  i )
2 i =0

Το εμβαδόν μεταξύ καμπύλης 1 1 n -1


Lorenz και διαγωνίου
-  (Fi +1 - Fi )( i +1 +  i )
2 2 i =0

Συντελεστής Gini
Παράδειγμα

Yi fi Fi Φi (Fi+1-Fi) (Φi+1+Φi)
150 1 0.1666 0.0929 0.0154
165 1 0.3333 0.1950 0.0479
190 1 0.5000 0.3127 0.0846
230 1 0.6666 0.4551 0.1280
300 1 0.8333 0.6409 0.1827
580 1 1.0000 1.0000 0.2734
1615 6 0.7322

n -1
G1 = 1 -  (Fi +1 - Fi )( i +1 +  i ) = 1 - 0.7322 = 0.2678
i =0

Παράδειγμα: Άμεσων ενισχύσεων


(€*1000) EL ES IT FR UK EU25
0 - 1250 € 217,751 198,268 377,987 37,391 14,604 1,595,300
1250 € - 2000 € 134,564 137,591 182,105 38,526 16,369 762,004
2000 € - 5000 € 397,189 493,268 537,666 190,930 95,798 2,643,490
5000 € - 10000 € 349,804 620,605 552,098 468,064 196,284 3,669,472
10000 € - 20000 € 238,447 878,768 600,671 1,239,434 372,773 5,452,290
20000 € - 50000 € 97,006 1,132,224 611,125 3,223,712 870,141 8,808,451
50000€ - 100000 € 17,237 503,844 351,516 1,842,704 867,617 4,912,290
100000 € - 200000 € 4,625 287,169 225,889 416,712 650,571 2,338,809
200000 € -300000 € 1,195 83,466 77,317 35,786 199,706 733,157
300000-500000 € 1,180 52,891 68,086 8,709 122,875 657,373
>500000 € 1,184 88,514 107,913 12,940 71,655 932,280
Total 1,460,182 4,476,608 3,692,373 7,514,908 3,478,393 32,504,916

(number*1000) EL ES IT FR UK EU25
0 - 1250 € 552.96 465.8 984.15 71.3 24.65 4359.24
1250 € - 2000 € 84.83 86.29 115.03 24.03 10.15 480.24
2000 € - 5000 € 125.32 152.91 169.38 56.96 28.44 815.46
5000 € - 10000 € 50.98 88.15 79.15 63.63 27.15 518
10000 € - 20000 € 17.87 62.01 43.43 84.81 25.98 384.69
20000 € - 50000 € 3.52 38.38 20.48 102.69 27.32 288.49
50000€ - 100000 € 0.27 7.47 5.14 27.98 12.53 73.22
100000 € - 200000 € 0.04 2.15 1.68 3.36 4.84 17.64
200000 € -300000 € 0.01 0.35 0.32 0.16 0.84 3.07
300000-500000 € 0 0.14 0.18 0.03 0.33 1.73
>500000 € 0 0.08 0.11 0.01 0.09 1.06
Total 835.8 903.73 1419.05 434.96 162.32 6942.84
Αθροιστικές Ποσοστιαίες Συχνότητες
EL ES IT FR UK EU25
14.9% 4.4% 10.2% 0.5% 0.4% 4.9%
24.1% 7.5% 15.2% 1.0% 0.9% 7.3%
51.3% 18.5% 29.7% 3.6% 3.6% 15.4%
% cumulative

75.3% 32.4% 44.7% 9.8% 9.3% 26.7%


91.6% 52.0% 61.0% 26.3% 20.0% 43.4%
98.3% 77.3% 77.5% 69.2% 45.0% 70.5%
99.4% 88.6% 87.0% 93.7% 70.0% 85.7%
99.8% 95.0% 93.1% 99.2% 88.7% 92.9%
99.8% 96.8% 95.2% 99.7% 94.4% 95.1%
99.9% 98.0% 97.1% 99.8% 97.9% 97.1%
100.0% 100.0% 100.0% 100.0% 100.0% 100.0%

EL ES IT FR UK EU25
66.16% 51.54% 69.35% 16.39% 15.19% 62.79%
76.31% 61.09% 77.46% 21.92% 21.44% 69.70%
91.30% 78.01% 89.40% 35.01% 38.96% 81.45%
% cumulative

97.40% 87.76% 94.97% 49.64% 55.69% 88.91%


99.54% 94.63% 98.03% 69.14% 71.69% 94.45%
99.96% 98.87% 99.48% 92.75% 88.52% 98.61%
99.99% 99.70% 99.84% 99.18% 96.24% 99.66%
100.00% 99.94% 99.96% 99.95% 99.22% 99.92%
100.00% 99.98% 99.98% 99.99% 99.74% 99.96%
100.00% 99.99% 99.99% 100.00% 99.94% 99.98%
100.00% 100.00% 100.00% 100.00% 100.00% 100.00%

Καμπύλη Lorenze
Καμπύλη Lorenze

Καμπύλη Lorenze
Καμπύλη Lorenze

Καμπύλη Lorenze

Συντελεστής EL ES IT FR UK EU25
Gini 0.373 0.260 0.248 0.443 0.339 0.206
Ανισοκατανομή των ενισχύσεων;

Ανισοκατανομή των ενισχύσεων;


2η μέθοδος (Kendall and Stuart)

Υπολογίζουμε πρώτα την μέση απόλυτη διαφορά όλων των


τιμών της μεταβλητής

Παράδειγμα:
150 165 190 230 300 580
150 0 15 40 80 150 430
165 15 0 25 65 135 415
190 40 25 0 40 110 390
230 80 65 40 0 70 350
300 150 135 110 70 0 280
580 430 415 390 350 280 0

Μέτρηση Ασυμμετρίας
X -M 0 Θετική ασυμμετρία

X -M =0 Μηδενική ασυμμετρία (συμμετρία)

X -M 0 Αρνητική ασυμμετρία

Δείκτης Ασυμμετρίας Sk (κατά Bowley)


(Q3 - M) - (M - Q1) Q3 + Q1 - 2M
Sk = =
(Q3 - M) + (M - Q1) Q3 - Q1
Είδη Συμμετρικών Κατανομών
Κανονική κατανομή

Q1 X = M Q3

Θετική Ασυμμετρία Αρνητική Ασυμμετρία

Q1 MX Q3 Q1 X M Q3
Έλεγχος Υποθέσεων: Είναι μια μέθοδος της Στατιστικής
Συμπερασματολογίας (statistical inference) που μας βοηθά να βγάλουμε
συμπεράσματα σε σχέση με την τιμή μιας παραμέτρου του πληθυσμού,
συγκρίνοντας τα αποτελέσματα του δείγματος με εκείνα που θα
περιμέναμε εάν η υπόθεση είναι αληθινή.

Η μέθοδος αυτή μας βοηθά να διαπιστώσουμε εάν τα δεδομένα του δείγματος


υποστηρίζουν την υπόθεση ότι η παράμετρος του πληθυσμού έχει μια συγκεκριμένη
τιμή.

Με άλλα λόγια προσπαθούμε να προσδιορίσουμε την πιθανότητα να προκύψει ένα


δείγμα όπου η τιμή της παραμέτρου είναι π.χ. μ από έναν πληθυσμό με πραγματική
τιμή μ0. Εάν η πιθανότητα είναι μεγάλη τότε η διαφορά μεταξύ του μ και μ0
οφείλεται στις τυχαίες κυμάνσεις της δειγματοληψίας. Αντίθετα, εάν διαπιστωθεί ότι
η πιθανότητα είναι μικρή, τότε η υπόθεση δεν ισχύει.

Παραδείγματα: Έλεγχος ποσοστού εκλογικού σώματος υπέρ κάποιου κόμματος,


έλεγχος ποιότητας στην βιομηχανία,
Μηδενική υπόθεση (Null Hypothesis) Η0, είναι η υπόθεση που ελέγχουμε.

Εναλλακτική υπόθεση (Alternative Hypothesis) Η1, είναι η υπόθεση


που θα δεχθούμε εάν η μηδενική υπόθεση βρεθεί εσφαλμένη.
Η Εναλλακτική υπόθεση δεν περιέχει το σύμβολο ίσον (=) όσον αφορά
την τιμή της παραμέτρου του πληθυσμού αλλά βασίζεται στο ≠, >, <
Η αποδοχή ή η απόρριψη της μηδενικής υπόθεσης βασίζεται στη τιμή του
κριτηρίου ελέγχου (test statistic). Κριτήριο ελέγχου είναι η στατιστική
(μεταβλητή) που υπολογίζεται με βάση τις πληροφορίες του δείγματος και
ακολουθεί μια γνωστή κατανομή (Ζ κανονικής κατανομής, t κατανομής
student, κτλ). Εφόσον το κριτήριο ακολουθεί μια γνωστή κατανομή, με την
χρήση των εμβαδών της αντίστοιχης κατανομής θα προσδιορίσουμε την
πιθανότητα με βάση την οποία θα κρίνουμε εάν η H0 είναι αληθινή ή όχι.
Επίπεδο σημαντικότητας (significant level) και συμβολίζεται με α, είναι
η τιμή της πιθανότητας που μικρότερή της θα θεωρείται απίθανο να
αποδοθεί στην τύχη ενώ μεγαλύτερη θα είναι φυσικό να ην αποδώσουμε
στην τύχη.

Έλεγχος Υπόθεσης Μέσου (γνωστή σ): κριτήριο Ζ


Η0: μ=μο Η1: μ≠μο
X 
Κριτήριο ελέγχου: Z
/ n
Εφόσον το επίπεδο σημαντικότητας είναι α, τότε η περιοχή απόρριψης έχει
εμβαδόν (πιθανότητα) α, και η περιοχή αποδοχής εμβαδόν ίσο με 1-α

Οι τιμές του κριτηρίου Ζ που αντιστοιχούν στα όρια της περιοχής απόρριψης
ονομάζονται κριτικές τιμές (critical values). Η κάτω τιμή συμβολίζεται με Ζα/2
και η άνω τιμή με Ζ1-α/2

Εάν Ζ είναι η τιμή που προκύπτει από τα δεδομένα του δείγματος τότε εάν:
Ζ<Ζα/2 ή Ζ>Ζ1-α/2 τότε η Η0 απορρίπτεται
Ζα/2<Ζ<Ζ1-α/2 τότε η Η0 γίνεται δεκτή
Κατανομή Δειγματοληψίας και Περιοχές
Απόρριψης και Αποδοχής της Ηo

Περιοχήαπόρριψης Περιοχήαπόρριψης
(α/2) Περιοχήαποδοχής της Ηο (α/2)
(1- α)

Κριτικήτιμή: Ζα/2 Τιμήμέσουυπόθεσης Ηο Κριτικήτιμή: Ζ1-α/2

Παράδειγμα:
Μία εταιρεία παράγει συνθετικό δέρμα που χρησιμοποιείται για την υποδηματοποιία. Μία από τις
βασικές προδιαγραφές που πρέπει να τηρούνται είναι το πάχος. Από τις προδιαγραφές είναι γνωστό
ότι ο συγκεκριμένος τύπος συνθετικού δέρματος παράγεται με μέσο πάχος 4 χιλιοστά και σ=0,1
χιλιοστά. Από δείγμα 50 μετρήσεων προέκυψε μέσο παχος=4,02 χιλιοστά. Το ερώτημα που
απασχολεί τον υπεύθυνο παραγωγής είναι εάν η παραγωγή εξελίσσεται ομαλά σύμφωνα με τις
προδιαγραφές ή κάποιο πρόβλημα στην παραγωγή προκαλεί μεταβολή στο πάχος του συνθετικού
δέρματος.

n=50 Η0: μ = 4 χιλ. Οι κριτικές τιμές του κριτηρίου Ζ σύμφωνα με


την τυποποιημένη κανονική κατανομή είναι -1,96
Η1: μ ≠ 4χιλ.
και 1,96

X   4,02  4,00
Z   1,41
/ n 0,1 / 50

Εφόσον Ζ=+1,41, βλέπουμε ότι -1,96<Ζ<=1,96 που σημαίνει ότι η τιμή του κριτηρίου Ζ
βρίσκεται στην περιοχή αποδοχής της Η0
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84850 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92786 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99897 0.99900

Έλεγχος Υπόθεσης Μέσου (γνωστή σ)


με Επίπεδο Σημαντικότητας 0,05

Απορρίπτουμε την Ηο Απορρίπτουμε την Ηο


(α/2 = 0,025) (α/2 = 0,025)
Δεν απορρίπτουμε την Ηο
(1-α = 0,95)

Ζ = -1,96 μο = 4 χιλιοστά Ζ = +1,96


Έλεγχος Υπόθεσης μέσου του
προγράμματος Statgraphics
Sample population=4.02
Population standard deviation=0.1
Sample size=50

95% confidence interval for mean:4.02+/- 0.02772 [3.99228;404772]

Null Hypothesis: μ=4,0 Alternative: Not equal


Computed Z statistic=1.41421 P-Value=0.1573
Conclusion: Do not reject the null hypothesis for alfa=0.05

The StatAdvisor
Given a sample of 50 observations with a mean of 4.02 and a population standard deviation of 0.1 the
computed Z statistic equals 1.41421. since the P-value for the test is grater than or equal to 0.05, the
null hypothesis cannot be rejected at the 95.0% confidence level. The confidence interval shows that
the values of μ supported by the data fall between 3.99228 and 4.04772

Απορρίπτουμε την Η0 εάν |Ζ| > |Ζα/2| (ή |Ζ|>|Ζ1-α/2|


Δεχόμαστε την Η0 εάν |Ζ| <|Ζα/2| (ή |Ζ|<|Ζ1-α/2|

Σχέση μεταξύ του Διαστήματος Εμπιστοσύνης και του ελέγχου της υπόθεσης

 Μας πληροφορεί για το που μπορεί να βρίσκεται ο άγνωστος μ εάν


 : X  Z1a . γνωρίζουμε μόνο τον X
n
Ο έλεγχος της Η0 μας λέει εάν ο X μπορεί να προέρχεται από έναν πληθυσμό με μέσο μ0.

Όλες οι τιμές του διαστήματος εμπιστοσύνης μπορούν να γίνουν δεκτές σαν μ0 εφόσον απέχουν από τον

X μέχρι  Z1 a .
n

Με άλλα λόγια αντί να κάνουμε τον κλασσικό έλεγχο της Η0, εκτιμούμαι το διάστημα
εμπιστοσύνης και εάν περιλαμβάνεται η τιμή μ0 τότε δεχόμαστε την Η0 αλλιώς την
απορρίπτουμε.
Εσφαλμένα Συμπεράσματα από την Διεξαγωγή
των Ελέγχων Υποθέσεων

Σφάλμα Τύπου Ι: Η Υπόθεση μηδέν (H0) απορρίπτεται ενώ είναι


σωστή
Παράδειγμα: κάποιες ακραίες τιμές στην δειγματοληψία είχαν σαν αποτέλεσμα ο μέσος όρος να ισούται με X  4,03
X   4,03  4,00
Z   2,12  1,96 άρα η Η0 απορρίπτεται ενώ είναι σωστή
/ n 0,1 / 50

Σφάλμα Τύπου ΙΙ: Η Υπόθεση μηδέν (H0) δεν απορρίπτεται


γίνεται δεκτή ενώ είναι λανθασμένη.

Παράδειγμα:
X   4,025  4,00
X  4,025 Z   1,77  1,96
/ n 0,1 / 50

Εσφαλμένα Συμπεράσματα από την Διεξαγωγή των


Ελέγχων Υποθέσεων
Κατά το έλεγχο υποθέσεων υπάρχουν δύο δυνατοί τύποι σφαλμάτων. Το σφάλμα
τύπου I συμβαίνει όταν απορρίπτουμε μία αληθινή μηδενική υπόθεση, ενώ το
σφάλμα τύπου II συμβαίνει όταν δεχόμαστε μία ψευδή μηδενική απόφαση.

Πραγματικότητα Απόφαση
Επιλέγω Η0 Επιλέγω Η1

Η0 Αληθινή Σωστή Απόφαση Σφάλμα Τύπου I

Η1 Αληθινή Σφάλμα τύπου II Σωστή Απόφαση


Παράδειγμα Εσφαλμένων αποφάσεων
Ένα συνηθισμένο παράδειγμα είναι από τον χώρο της δικαιοσύνης. Όταν κάποιος
αντιμετωπίζει μια σοβαρή κατηγορία οδηγείται στο δικαστήριο, όπου ο δημόσιος
κατήγορο και ο συνήγορος υπεράσπισης παρουσιάζουν αποδείξεις και
αναπτύσσουν επιχειρήματα, και τελικά οι ένορκοι αποφασίζουν αν ο
κατηγορούμενος είναι αθώος ή ένοχος.
Αυτό που κάνουν οι ένορκοι είναι ένας έλεγχος υποθέσεων.
Η0: ο κατηγορούμενος είναι αθώος
Η1: ο κατηγορούμενος είναι ένοχος

Πραγματικότητα Απόφαση δικαστηρίου


Επιλέγω Η0 Επιλέγω Η1
(Αθώωση) (Καταδίκη)
Η0 Αληθινή (αθώος) Σωστή Απόφαση Σφάλμα Τύπου I

Η1 Αληθινή (ένοχος) Σφάλμα τύπου II Σωστή Απόφαση

Ερώτηση ….
1. Μπορούμε να αποφύγουμε τα σφάλματα κατά τον έλεγχο των
υποθέσεων;

2. Μπορούμε να υπολογίσουμε την πιθανότητα να διαπράξουμε κατά


τον έλεγχο των υποθέσεων;

α= P (Σφάλμα Τύπου I)=P (Απορρίπτω την H0 όταν είναι αληθινή)=


Επίπεδο σημαντικότητας

β= P (Σφάλμα Τύπου II)=P (Δεν απορρίπτω την H0 όταν είναι λάθος)

1-β: Δύναμη κριτηρίου ή Ισχύς ελέγχου εκφράζεται συνήθως ως


συνάρτηση των τιμών μ1-μο δηλαδή 1-β=f (μ1-μ0)
Κατανομές Δειγματοληψίας και Περιοχές Απόρριψης
και Αποδοχής της Ηo όταν η Ηo είναι Λανθασμένη

Περιοχή αποδοχής
της Η0

Περιοχή απόρριψης
της Η0 (1-β)
β

Η0=μ0 Z 1-α Η1=μ1

Περιοχές Απόρριψης και Αποδοχής της Η0 σε


Μονοκατάληκτα Κριτήρια Ελέγχου (α = 0.05)

Η0: μ=μ0
Έναντι της εναλλακτικής Η 1:
μ<μ0
Εάν Ζ<Ζα απορρίπτουμε την
Απορρίπτουμε τηνΗο υπόθεση μηδέν (Η0)
Δεναπορρίπτουμε τηνΗο

Ζ= -1,645 μο

Η0: μ=μ0
Έναντι της εναλλακτικής Η1:
μ>μ0
Εάν Ζ>Ζα απορρίπτουμε την
Απορρίπτουμε τηνΗο
υπόθεση μηδέν (Η0)
Δεναπορρίπτουμε τηνΗο

μο Ζ= +1,645
Έλεγχος Υπόθεσης Μέσου (άγνωστη σ): κριτήριο t
Τις περισσότερες φορές η τυπική απόκλιση του πληθυσμού είναι άγνωστη και ως εκ
τούτου χρησιμοποιούμε την εκτίμηση s από τα δεδομένα του δείγματος.
Έτσι με άγνωστη τυπική απόκλιση του πληθυσμού, χρησιμοποιούμε το κριτήριο t
student με n-1 βαθμούς ελευθερίας για τον έλεγχο της υπόθεσης H0: μ=μ0

X  0
tn 1 
Παράδειγμα: s/ n
4.7 4.5 4.8 5.0 5.1 5.4 4.9 5.0 5.1 4.3 5.1 5.6 5.6 4.6 5.2

4.5 4.3 4.9 5.2 5.3 5.5 5.2 5.6 4.8 4.5 5.3 5.5 4.9 5.0 5.2

Η0: μ=5 X
Η1: μ≠5 X 
150.6
 5.02 s
(X  X ) 2


4.188
 0.144  0.38
n 30 n 1 30  1

X  0 5.02  5
t 29    0.29 t 29 ,0.025  2.045 t29  t29 ,0.025 Άρα ότι η Η0 γίνεται δεκτή
s / n 0.38 / 30

Έλεγχος Υπόθεσης Ποσοστού: κριτήριο Ζ


Η0: π=π0
με Η1: π≠π0 για δικατάληκτο κριτήριο
ή Η1: π<π0 ή Η1: π>π0 για μονοκατάληκτο κριτήριο

 0 (1   0 )
p=X/n sp 
n
p 0
κριτήριο Z Z
sp

Για δικατάληκτο κριτήριο όταν |Ζ|<|Ζα/2| ή |Ζ|<|Ζ1-α/2| η Η0 γίνεται δεκτή


Για μονοκατάληκτο κριτήριο προς τα κάτω όταν Ζ>Ζα η Η0 γίνεται δεκτή
Για μονοκατάληκτο κριτήριο προς τα πάνω όταν Ζ<Ζ1-α η Η0 γίνεται δεκτή
Παράδειγμα:
Το Υπουργείο Αγροτικής Ανάπτυξης & Τροφίμων ενόψει της εφαρμογής της νέας ΚΑΠ θέλει να
διαπιστώσει πόσοι από τους δικαιούχους άμεσων ενισχύσεων ξεπερνούν το όριο των 5.000 €.
Παλαιότερη μελέτη της Δ/νσης Αγροτικής Πολιτικής είχε καταλήξει στο συμπέρασμα ότι περίπου
το 15% των δικαιούχων απολαμβάνουν ενισχύσεις μεγαλύτερες από 5.000 €. Έμπειρα στελέχη
όμως του Υπουργείου εισηγούνται στον Υπουργό ότι το συγκεκριμένο ποσοστό έχει φτάσει στο
25% με τάσεις ανόδου λόγω της επιτυχημένης εφαρμογής των παλαιοτέρων διορθωτικών
προγραμμάτων. Επειδή η βάση δεδομένων των πληρωμών του ΟΠΕΚΕΠΕ δεν είναι κατάλληλα
ενημερωμένη, η ηγεσία του Υπουργείου, προκειμένου να ελέγξει τους ισχυρισμούς των στελεχών,
αποφασίζει να διεξάγει μία μικρής εμβέλειας έρευνα σε ένα τυχαίο δείγμα 700 δικαιούχων. Σε
αυτό το τυχαίο δείγμα, 196 δικαιούχοι απάντησαν ότι απολαμβάνουν άμεσες ενισχύσεις
μεγαλύτερες από 5.000 €. α). Να διατυπωθεί η μηδενική και η εναλλακτική υπόθεση β) Η άποψη
των στελεχών του υπουργείου είναι σωστή ή λάθος;
Α. Διατύπωση ερευνητικών υποθέσεων: Η0: π=0.25 και Η1: π>0.25
Β. p=196/700=0.28  0 (1   0 ) 0.25(1  0.25)
sp    0.0164
n 700
p   0 0.28  0.25
Z   1.83
sp 0.0164
α=0.05 Z1-0.05=Z0.95=+1.645 Επειδή Ζ>Ζ1-α η Η0 απορρίπτεται

Έλεγχος Διαφοράς Δύο Μέσων


Είναι έλεγχος υποθέσεων μεταξύ δύο δειγμάτων.

Σκοπός του κριτηρίου είναι να ελέγξουμε την διαφορά μεταξύ των μέσων δύο πληθυσμών με βάση
τις παρατηρήσεις δύο ανεξαρτήτων δειγμάτων που έχουν επιλεγεί από τους δύο πληθυσμούς.

Κατανομή Δειγματοληψίας της Διαφοράς δύο Μέσων


και Περιοχές Απόρριψης και Αποδοχής της Ηο

Περιοχή απόρριψης Περιοχή απόρριψης


(α/2) Περιοχή αποδοχής της Ηο (α/2)
(1 - α)

Κριτική τιμή: Ζα/2 Υπόθεση Ηο: μ1 - μ2 Κριτική τιμή: Ζ1-α/2


Δικατάληκτο κριτήριο Μονοκατάληκτο κριτήριο Μονοκατάληκτο κριτήριο
Η0: μ1-μ2=θ0 Η0: μ1-μ2=0 Η0: μ1-μ2=0 Η0: μ1-μ2=0

Η1: μ1-μ2≠θ0 Η1 μ1-μ2≠0 Η1: μ1-μ2>0 Η1: μ1-μ2<0

Για μεγάλα δείγματα (n1, n2>30)

s12 s22 ( X1  X 2 )  0
s X1  X 2  
n1 n2
Z
s X1  X 2
Για μικρά δείγματα (n1, n2<30) Χρησιμοποιούμε το κριτήριο t student

1 1
s X 1  X 2  s 2p (  )
n1 n2
( X1  X 2 )  0
( n1  1) s12  ( n2  1) s 22
t n1  n2  2 
sp 
2

( n1  1)  ( n2  1)
s X1  X 2

Παράδειγμα
Το ΕΘΙΑΓΕ θέλει να ελέγξει εάν το γεωργικό οικογενειακό εισόδημα (ΓΟΕ) των γεωργών με υψηλό
μορφωτικό επίπεδο διαφέρει από το ΓΟΕ των γεωργών με χαμηλό μορφωτικό επίπεδο. Δύο τυχαία
δείγματα 150 γεωργών με υψηλό ΓΟΕ και 200 γεωργών με χαμηλό ΓΟΕ έδωσαν τα εξής
αποτελέσματα:
Υψηλό Μορφωτικό Χαμηλό Μορφωτικό
Επίπεδο Επίπεδο
Μέγεθος δείγματος n=150 n=200

Μέσος 105 χιλ € 115 χιλ €


Τυπική Απόκλιση 23 χιλ € 35 χιλ. €

Η0: μ1-μ2=0 Η1: μ1-μ2≠0

s X1  X 2 
s12 s22
 
232 35 2

( X  X 2 ) (105  115)
 3.107 Z  1   3.22
n1 n2 150 115 s X1  X 2 3,107

Για επίπεδο σημαντικότητας α=0.05 Ζα/2=Ζ0.025=-1.96

Ζ<Ζ0.025 άρα η Η0 απορρίπτεται και γίνεται δεκτή η εναλλακτική υπόθεση. Δηλαδή το


ΓΟΕ διαφέρει ανάλογα με το μορφωτικό επίπεδο του γεωργού.
Παράδειγμα
Ένας γεωπόνος μελετά την απόδοση βαμβακιού σε δύο περιοχές κατά την περασμένη καλλιεργητική
περίοδο. Το πρόβλημα που τον απασχολεί είναι εάν η καλλιέργεια βαμβακιού στην πρώτη περιοχή
απέδωσε όσο και στην δεύτερη. Ο μελετητής συλλέγει ένα τυχαίο δείγμα 18 εκμεταλλεύσεων στην
μία περιοχή και ένα δείγμα 20 εκμεταλλεύσεων στην δεύτερη περιοχή. Τα δεδομένα έχουν ως εξής:
Περιοχή I Περιοχή II

Μέγεθος δείγματος n=18 n=20

Μέσος 3.5 ton/ha 2.7 ton/ha Η0: μ1-μ2=0 Η1: μ1-μ2≠0


Τυπική Απόκλιση 1.3 ton/ha 1.5 ton/ha

(n1  1) s12  (n2  1) s22 (18  1)1.32  (20  1)1.52


s 2p    1.9856
(n1  1)  (n2  1) (18  1)  (20  1)
(3.5  2.7)
s X 1  X 2  s 2p (
1 1 1 1
 )  1.9856(  )  0.4578 t36   1.747
n1 n2 18 20 0.4578

Για επίπεδο σημαντικότητας α=0.05 t36,α/2=Ζ36,0.0255=2.028


άρα |t36|<|t v,α/2| όπου σημαίνει ότι δεχόμαστε την Η0 δηλαδή δεν υπάρχει διαφορά
στην απόδοση βαμβακιού μεταξύ των δύο περιοχών.

Παρατηρούμενα και Πειραματικά δεδομένα

 Ερευνητική υπόθεση: Η κατανάλωση δημητριακών


με υψηλή περιεκτικότητα σε φυτικές ίνες για πρωινό,
καταναλώνουν λιγότερες θερμίδες για μεσημεριανό.
 Δείγμα 150 ατόμων
 Έλεγχος διαφοράς μέσων των πληθυσμών.
 Η0:μ1-μ2=0 Η1:μ1-μ2<0
 Ο έλεγχος για ίσες διασπορές έδωσε F=0.3845 και
τιμή p=0.0008
…αποτελέσματα Excel
A B C
1 t-Test: Two-Sample Assuming Unequal Variances
2
3 Consumers Nonconsumers
4 Mean 604.02 633.23
5 Variance 4103 10670
6 Observations 43 107
7 Hypothesized Mean Difference 0
8 df 123
9 t Stat -2.09
10 P(T<=t) one-tail 0.0193
11 t Critical one-tail 1.6573
12 P(T<=t) two-tail 0.0386
13 t Critical two-tail 1.9794

Βάση των αποτελεσμάτων συμπεραίνουμε ότι αυτοί που καταναλώνουν για πρωινό
δημητριακά με φυτικές ίνες, καταναλώνουν λιγότερες θερμίδες το μεσημεριανό.

Είναι αυτή η μοναδική ερμηνεία;

Πειραματικά δεδομένα
 Πρέπει να εξασφαλίσουμε ότι οι δύο πληθυσμοί έχουν παρόμοια
χαρακτηριστικά.
 Όσο μεγαλύτερο είναι το δείγμα τόσο πιθανότερη είναι η
ομοιομορφία των πληθυσμών.
 Τα πειραματικά δεδομένα απαιτούν περισσότερη προετοιμασία
και σημαντικό μεγαλύτερο κόστος.
 Πολλές φορές δεν είναι δυνατό να προκύψει ελεγχόμενο
περιβάλλον.
 Η διαφορά μεταξύ παρατηρούμενων και πειραματικών δεδομένων
επηρεάζει την ερμηνεία κάθε στατιστικού αποτελέσματος και όχι
μόνο τη διαφορά των μέσων δύο πληθυσμών.
Διαφορά Δύο Μέσων: Σύγκριση κατά
Ζεύγη
Προηγουμένως, όταν συγκρίναμε δύο πληθυσμούς
τα δύο δείγματα που εξετάζαμε ήταν ανεξάρτητα.

Εάν παρόλο αυτά, κάποιο πείραμα σχεδιαστεί με


τέτοιο τρόπο όπου κάθε παρατήρηση του ενός
δείγματος να αντιστοιχεί σε μία παρατήρηση του
άλλου δείγματος, αυτό λέγεται πείραμα σύγκρισης
κατά ζεύγη

Παράδειγμα
Ο Διευθυντής μιας εταιρείας προσφοράς καριέρας ενδιαφέρεται να ερευνήσει τις
προσφορές που δέχονται απόφοιτοι ΜΒΑ.

Ιδιαίτερα, θέλει να δει εάν κάτοχοι ΜΒΑ που προέρχονται από το Οικονομικά
Τμήματα αμείβονται περισσότερο από κατόχους ΜΒΑ που προέρχονται από το
Πολυτεχνείο .

Σε μία προκαταρκτική έρευνα επέλεξε ένα δείγμα 50 κατόχων ΜΒΑ όπου οι μισοί
προέρχονταν από Οικονομικά Τμήματα και οι υπόλοιποι από Πολυτεχνικές σχολές.

Μπορούμε από τα δεδομένα να συμπεράνουμε ότι οι κάτοχοι ΜΒΑ που


προέρχονται από οικονομικές σπουδές δέχονται καλύτερες προσφορές σε σύγκριση
με τους κάτοχους ΜΒΑ που προέρχονται από τεχνολογικές σπουδές;
Παράδειγμα Αναγνωρίζω την παράμετρο

Η παράμετρος είναι η διαφορά μεταξύ δύο μέσων (µ1 = μέσος μηνιαίος


προσφερόμενος μισθός για απόφοιτους οικονομικών σχολών και µ2 =
μέσος μηνιαίος προσφερόμενος μισθός για αποφοίτους Τμημάτων
Marketing) .

Επειδή ενδιαφερόμαστε να διαπιστώσουμε εάν κάτοχοι ΜΒΑ από


οικονομικές σχολές έχουν προσφορές με υψηλότερους μέσους μισθούς, η
εναλλακτική υπόθεση θα είναι μεγαλύτερη από…

Υπολογισμός της στατιστικής F για έλεγχο ίσων διακυμάνσεων


καταδεικνύει ότι ο έλεγχος των μέσων θα γίνει για ίσες διακυμάνσεις.
H 0 : (1   2 )  0
H1 : (1   2 )  0

Υπολογισμός

t-Test: Two-Sample Assuming Equal Variances

Finance Mark eting


Mean 65,624 60,423
Variance 360,433,294 262,228,559
Observations 25 25
Pooled Variance 311,330,926
Hypothesized Mean Difference 0
df 48
t Stat 1.04
P(T<=t) one-tail 0.1513
t Critical one-tail 1.6772
P(T<=t) two-tail 0.3026
t Critical two-tail 2.0106
Παράδειγμα Ερμηνεία

Η τιμή του ελέγχου είναι (t =1.04) και η τιμή p


0.1513.
Συνεπώς τα δεδομένα μας δεν μπορούν να
στηρίξουν την υπόθεση ότι οι μέσες προσφορές που
δέχονται οι κάτοχοι ΜΒΑ με οικονομικές σπουδές
είναι υψηλότερες από αυτές των κατόχων ΜΒΑ με
τεχνολογικές σπουδές.

Παράδειγμα
Επαναλαμβάνουμε το πείραμα με τον εξής τρόπο

Αποκτούμε πρόσβαση στις βαθμολογίες των κατόχων ΜΒΑ και βρίσκουμε τον
μέσο της βαθμολογίας του πτυχίου (οικονομικής και τεχνολογικής κατεύθυνσης).

Οι βαθμοί έχουν μέγιστο 10 και ελάχιστο 5 συνεπώς χωρίζουμε το διάστημα 5 σε


25 ζώνες βαθμολογίας 0.02.

Στη συνέχεια επιλέγουμε τυχαία έναν απόφοιτο κάθε κατεύθυνσης από κάθε ζώνη
βαθμολογίας.

Σε αυτό το παράδειγμα το πείραμα έχει σχεδιαστεί με τέτοιο τρόπο ώστε κάθε


παρατήρηση του ενός δείγματος να αντιστοιχεί με μία παρατήρηση από το άλλο
δείγμα. Η αντιστοιχία έχει γίνει με κριτήριο την βαθμολογία των αποφοίτων.

Για το έλεγχο της υπόθεσης αρχικά υπολογίζουμε την διαφορά μεταξύ των
παρατηρήσεων κάθε ζεύγους.
Παράδειγμα Αναγνωρίζω την παράμετρο

Οι αριθμοί με την μαύρη γραφή είναι τα δεδομένα των προσφορών για αρχικό
μισθό ενώ αυτά με την μπλε έχουν υπολογιστεί.

Polytechnic

Η διαφορά των μέσων είναι ίση με τον μέσο των διαφορών, και ως εκ τούτου θα
θεωρήσουμε τον «μέσο του πληθυσμού των διαφορών» ως την παράμετρο που πρέπει να
ελέγξουμε :

Έλεγχος των διαφορών


Αναγνωρίζω την παράμετρο

Ο έλεγχος για τον μέσο μD των διαφορών δύο


πληθυσμών υπολογίζεται από τον τύπο:

Που ακολουθεί κατανομή t-Student με nD–1


βαθμούς ελευθερίας, με την προϋπόθεση ότι ο
πληθυσμός των διαφορών έχει κανονική κατανομή..
Excel Αποτελέσματα Υπολογισμός

Data, Data Analysis, t-Test: Paired Two- Sample for


Means

Παράδειγμα Υπολογισμός

A B C
1 t-Test: Paired Two Sample for Means
2
3 Finance Marketing
4 Mean 65,438 60,374
5 Variance 444,981,810 469,441,785
6 Observations 25 25
7 Pearson Correlation 0.9520
8 Hypothesized Mean Difference 0
9 df 24
10 t Stat 3.81
11 P(T<=t) one-tail 0.0004
12 t Critical one-tail 1.7109
13 P(T<=t) two-tail 0.0009
14 t Critical two-tail 2.0639
Παράδειγμα Ερμηνεία

Η τιμή έλεγχου είναι ίση με t=3.81 ενώ η κριτική τιμή


t0.05, 24=1.7109 και η τιμή p ίση με 0.0004. Βρισκόμαστε
σε περιοχή απόρριψης άρα έχουμε επαρκή στατιστικά
στοιχεία για να απορρίψουμε την μηδενική υπόθεση.
Διαπιστώνουμε ότι με τη σύγκριση κατά ζεύγη
μπορέσαμε να εξάγουμε από τα δεδομένα μας την
πληροφορία ότι οι απόφοιτοι ΜΒΑ που προέρχονται
από οικονομικά Τμήματα δέχονται υψηλότερες
προσφορές από αποφοίτους ΜΒΑ που προέρχονται από
Τμήματα. Marketing

Έλεγχος Διαφοράς Δύο Ποσοστών: κριτήριο Ζ


Ελέγχουμε την διαφορά μεταξύ των ποσοστών π1 και π2 δύο πληθυσμών. Ο έλεγχος θα γίνει βάση των
ποσοστών p1 και p2 που έχουν προκύψει από δύο ανεξάρτητα δείγματα

Η μηδενική υπόθεση είναι ότι η διαφορά των ποσοστών μεταξύ δύο πληθυσμών έχει μια σταθερή τιμή θ 0.
Εάν το θ0 είναι ίσο με μηδέν οι πιθανοί έλεγχοι είναι:
Δικατάληκτο κριτήριο Μονοκατάληκτο κριτήριο Μονοκατάληκτο κριτήριο

Η0: π1-π2=0 Η0: π1-π2=0 Η0: π1-π2=0


Η1 π1-π2≠0 Η1: π1-π2>0 Η1: π1-π2<0
X 1  X 2 n1 p1  n2 p2
Κοινό ή συνδυασμένο (combined) ποσοστό pc: pc  
n1  n2 n1  n2
1 1
s p1  p2  pc (1  pc )(  )
n1 n2

( p1  p2 )
Z Εάν |Ζ|<|Ζα/2| τότε αποδεχόμαστε την Η0
s p1  p2
Παράδειγμα
Το τμήμα έκδοσης πιστωτικών καρτών της τράπεζας θέλει να διερευνήσει εάν η οικογενειακή
κατάσταση των κατόχων πιστωτικών καρτών επιδρά στο ποσοστό των κατόχων που έχουν
ανεξόφλητες ληξιπρόθεσμες υποχρεώσεις. Τα δύο τυχαία δείγματα 150 παντρεμένων και 200
ανύπαντρων κατόχων πιστωτικής κάρτας έδωσαν επίσης τα εξής αποτελέσματα:
Παντρεμένοι Ανύπαντροι

Μέγεθος δείγματος n1=150 n2=200

Αριθμός κατόχων με
ανεξόφλητες ληξιπρόθεσμες Χ1=4 Χ2=9
υποχρεώσεις
Εκτίμηση ποσοστού p1=4/150=0.027 p2=9/200=0.045

Η0: π1-π2=0 X1  X 2 49


pc    0.037
Η1 π1-π2≠0 n1  n2 150  200

1 1 1 1
s p1  p2  pc (1  pc )(  )  0.037(1  0.037)(  )  0.02
n1 n2 150 200

( p1  p2 ) (0.027  0.045) Για επίπεδο σημαντικότητας α=0.05


Z   0.90 Ζα/2=Ζ0.025=-1.96 δηλαδή |Ζ|>|Ζ0.025| που
s p1  p2 0.02
σημαίνει ότι δεχόμαστε την Η0

Έλεγχος Διαφοράς δύο Διακυμάνσεων: κριτήριο F


Ο Έλεγχος ισότητας των διακυμάνσεων δύο πληθυσμών βασίζεται στο λόγο των δύο
διακυμάνσεων και όχι στην διαφορά τους. Όταν τα δύο δείγματα προέρχονται από
κανονικούς πληθυσμούς, τότε ο λόγος των διακυμάνσεων ακολουθεί μία γνωστή
θεωρητική κατανομή που ονομάζεται κατανομή F.

2
s
F 1 2  1
2 Όπου ν1=η1-1 και ν2=η2-1
s 2
Δικατάληκτο κριτήριο Μονοκατάληκτο κριτήριο Μονοκατάληκτο κριτήριο

Η0: σ12=σ22 ή σ12/σ22=1 Η0: σ12=σ22 ή σ12/σ22=1 Η0: σ12=σ22 ή σ12/σ22=1


Η1 σ12≠σ22 ή σ12/σ22≠1 Η1 σ12>σ22 ή σ12/σ22>1 Η1 σ12<σ22 ή σ12/σ22<1
Κατανομές του Κριτηρίου Fν1,ν2
για Διάφορες Τιμές των ν1 και ν2

ν1=2, ν2=5

ν1=5, ν2=10

ν1=15, ν2=30


0

Κατανομή Δειγματοληψίας του Κριτηρίου F=s12/s22


και Περιοχές Απόρριψης και Αποδοχής της Η0

Περιοχή απόρριψης
Περιοχή αποδοχής της Ηο (α)
(1 - α)


0 Κριτική τιμή: Fν1,ν2,α

Εάν η τιμή του F είναι μεγαλύτερη από την κριτική τιμή Fv1v2,α δηλαδή Fv1v2> Fv1v2,α τότε απορρίπτουμε
την Η0 και γίνεται δεκτή η Η1
Έλεγχος Ανεξαρτησίας Ιδιοτήτων: κριτήριο x2
Χ1:ο αριθμός των παρατηρήσεων που έχουν το υπο εξέταση χαρακτηριστικό
p1=Χ1/n1: το ποσοστό των παρατηρήσεων
n1-X1: ο αριθμός των παρατηρήσεων που δεν έχουν το συγκεκριμένο χαρακτηριστικό

Το κριτήριο x2 ελέγχει την ίδια υπόθεση με το κριτήριο Ζ αλλά βασίζεται στις συχνότητες εμφάνισης
ή μή του χαρακτηριστικού δηλ. Τα Χ1, Χ2, n1-X1 και n2-X2 και όχι τις τιμές των ποσοστών p1 και p2.
Επίσης ο συγκεκριμένο κριτήριο μας επιτρέπει να επεκτείνουμε τον έλεγχο διαφοράς μεταξύ των
ποσοστών για περισσότερους από δύο πληθυσμούς
H0: π1=π2=...=πc
Ελέγχουμε εάν οι πραγματικές ή παρατηρούμενες συχνότητες (f0) διαφέρουν στατιστικά σημαντικά
από τις αναμενόμενες (fe). Εάν οι διαφορές είναι μικρές (στατιστικά ασήμαντες), τότε γίνεται δεκτή
η Η0 δηλ. Τα δύο χαρακτηριστικά είναι ανεξάρτητα.. Εάν η Η0 απορριφθεί, τότε οι πραγματικές
συχνότητες δεν συμβιβάζονται με την υπόθεση της ανεξαρτησίας.

( f  f ) 2 Όπου:
x2   0 e f0=πραγματικές ή παρατηρούμενες συχνότητες
fe=αναμενόμενες ή θεωρητικές συχνότητες
fe v= βαθμοί ελευθερίας: (αριθμός γραμμών-1)(αριθμός στηλών-1)

Η κατανομή του κριτηρίου x2 έχει σχήμα ανάλογο με εκείνο της κατανομής F και τείνει προς την
κανονική κατανομή για ν>30

Παράδειγμα
Το τμήμα έκδοσης πιστωτικών καρτών της τράπεζας θέλει να διερευνήσει εάν η οικογενειακή κατάσταση των
κατόχων πιστωτικών καρτών επιδρά στο ποσοστό των κατόχων που έχουν ανεξόφλητες ληξιπρόθεσμες
υποχρεώσεις. Τα δύο τυχαία δείγματα 150 παντρεμένων και 200 ανύπαντρων κατόχων πιστωτικής κάρτας έδωσαν
επίσης τα εξής αποτελέσματα:

Πίνακας ( f0  f e )2
x 
Οικογενειακή 2
κατάσταση
fo 
fe
Παντρεμένοι Ανύπαντροι Σύνολα
fo fe (fo-fe) (fo-fe)2 (fo-fe)2/fe
Ναι Χ1=4 X2=9 X=13 4 5.6 -1.6 2.56 0.457
Ανεξόφλητες
Υποχρεώσεις 9 7.4 1.6 2.56 0.346
Όχι n1-Χ1=146 n2-X2=191 n-X=337
146 144.4 1.6 2.56 0.018
191 192.6 -1.6 2.56 0.013
Σύνολα n1=150 n2=200 n=350

Πίνακας Οικογενειακή
x2= 0.834

fe κατάσταση X2 (2-1)(2-1)=0.834

X20.5, 1=3.841
Παντρεμένοι Ανύπαντροι Σύνολα
150*13/350= 200*13/350=
Ανεξόφλητες Ναι 5,6 7,4 X=13 X20.5, 1> X2(2-1)(2-1) άρα η Η0 γίνεται δεκτή
Υποχρεώσεις 150*337/350= 200*337/350= που σημαίνει ότι τα δύο χαρακτηριστικά (ή
Όχι
ιδιότητες) είναι ανεξάρτητα
144,4 192,6 n-X=337

Σύνολα n1=150 n2=200 n=350


Απλή Παλινδρόμηση
και Συσχέτιση

Πωλήσεις, Δαπάνες Διαφήμισης και Αριθμός


Πωλητών
Πωλήσεις Διαφήμιση Πωλητές Πωλήσεις Διαφήμιση Πωλητές
Έτος Έτος
(χιλ €) (χιλ €) (Άτομα) (χιλ €) (χιλ €) (Άτομα)

1981 1050 162 32 1989 3570 720 98

1982 1260 285 47 1990 4410 1140 43

1983 1470 540 23 1991 4500 1395 76

1984 2160 261 68 1992 5610 1560 89

1985 1950 360 32 1993 5190 1380 108

1986 2400 690 17 1994 5670 1260 76

1987 2370 495 58 1995 5160 1710 65

1988 3150 948 75 1996 6840 1860 93


Διάγραμμα Διασποράς Μεταξύ Πωλήσεων και
Διαφήμισης

Διάγραμμα Διασποράς Μεταξύ Πωλήσεων και Αριθμού


Πωλητών
Διαγράμματα Διασποράς

Τέλεια θετική συσχέτιση Τέλεια αρνητική συσχέτιση


(r = +1,0) (r = -1,0)

Έντονη θετική συσχέτιση Έντονη Αρνητική Συσχέτιση


(r = +0,9) (r= - 0,9)

Διαγράμματα Διασποράς

Ασθενής θετική συσχέτιση (r = +0,7) Ασθενής αρνητική συσχέτιση (r= - 0,7)

Μηδενική συσχέτιση (r= 0)


Συμμεταβολή
Την ύπαρξη γραμμικής σχέσης μεταξύ δύο μεταβλητών, την
κατεύθυνση συμμεταβολής των τιμών τους καθώς και την
από κοινού διασπορά των τιμών των δύο μεταβλητών από
τις αντίστοιχες μέσες τιμές τους δίνεται από ένα πολύ
σημαντικό στατιστικό μέτρο που καλείται συνδιακύμανση
(Covariance)

XY  cov( X , Y )  E((X  μX)(Y  μY))

 (x  X)(y  Y)
i i

sxy  i 1
n 1

Συσχέτιση
Την κατεύθυνση της συμμεταβολής των τιμών δύο μεταβλητών και
τον βαθμό της γραμμικής σχέσης των μεταβλητών, δίνει ο
συντελεστής συσχέτισης (correlation coefficient) που
χρησιμοποιείται κυρίως αντί της συνδιακύμανσης

XY
XY 
XY
n

sxy  ( x  X)(y  Y )
i i

rxy   i 1
sxsy n

 [
i 1
(xi  X ) 2
][(yi  Y ) 2
]
Έλεγχος Στατιστικής σημαντικότητας του r

Λόγω το ότι η τιμή του r βασίζεται σε δείγμα παρατηρήσεων,


υπόκειται στα σφάλματα της δειγματοληψίας. Το r αποτελεί μία
εκτίμηση του άγνωστου συντελεστή του πληθυσμού ρ
Η0: ρ=0 Η1: ρ0

Ο Έλεγχος γίνεται με την γνωστή κατανομή t

r
tn  2 
1 r2
n2

Εάν η τιμή |t n-2| > της κριτικής τιμής |t n-2,α/2| η Η0


απορρίπτεται και αντίστροφα

Διάγραμμα Διασποράς Καμπυλόγραμμης Σχέσης


(Συντελεστής Γραμμικής Συσχέτισης = 0,75)
Το υπόδειγμα της
Απλής Γραμμικής Παλινδρόμησης

The Simple Linear Regression Model

Εισαγωγή
Oικονομική θεωρία
Διατύπωση της αιτιώδους σχέσης μεταξύ
των οικονομικών μεταβλητών

Οικονομικά μαθηματικά
Καθορισμός της μορφής της συνάρτησης
που εκφράζει την συγκεκριμένη σχέση

Ανάλυση παλινδρόμησης
(α) Καθορισμός συγκεκριμένων τιμών για τις
παραμέτρους των συναρτήσεων με βάση τα στοιχεία
ενός δείγματος (εκτιμητική)
(β) Διατύπωση συμπερασμάτων για τις πραγματικές
τιμές των παραμέτρων (στατιστική επαγωγή)
Απλή παλινδρόμηση
(simple regression)
Διερεύνηση της σχέσης δύο μεταβλητών

Πολλαπλή παλινδρόμηση
(multiple regression)
Διερεύνηση της σχέσης μεταξύ
περισσότερων μεταβλητών

Σχέσεις μεταβλητών
Συναρτησιακές ή μαθηματικές
(functional relations)
Σε κάθε τιμή της Χ αντιστοιχεί μια τιμή της Υ

Στοχαστικές ή στατιστικές
(Stochastic or statistical relations)
Σε κάθε τιμή της Χ αντιστοιχεί μια κατανομή
τιμών της Υ

Η ανάλυση παλινδρόμησης ασχολείται με


στοχαστικές σχέσεις και έχει σαν σκοπό να
διερευνήσει την συναρτησιακή σχέση όχι πλέον
ανάμεσα στην X και την Y αλλά ανάμεσα στην X και
τον μέσο της κατανομής του Y για δεδομένο X ,
ανάμεσα δηλαδή στο X και στον δεσμευμένο
μέσο της κατανομής του Y η οποία διατυπώνεται
μαθηματικά σαν

E (Y X i )  f ( X i )
Οταν η σχέση μεταξύ των μεταβλητών είναι
γραμμική στις παραμέτρους η ανάλυση
παλινδρόμησης ονομάζεται γραμμική (linear),
π.χ. E (Y X i )  a  bX i ή E (Y Xi )  a  bXi2

Στην αντίθετη περίπτωση ονομάζεται μη γραμμική


(non-linear),
π.χ. E (Y X i )  a  X i
b

Υπόθεση
Στον πληθυσμό που μας ενδιαφέρει υπάρχει μια
γραμμική σχέση ανάμεσα στις τιμές του X και
στους δεσμευμένους μέσους του Y. Δηλαδή
E (Y X i )  a  bX i

Απλή Γραμμική Παλινδρόμηση στον


Πληθυσμό και στο Δείγμα

Παράδειγμα: Πληθυσμός όπου η σχέση


ανάμεσα στο Χ και τους δεσμευμένους
μέσους του Y είναι γραμμική.

Μηνιαίο
Εισόδημα
Μηνιαία 150 160 170 180 190 200
κατανάλωση 115 105 107 112 115 125
100 117 114 115 127 129
95 113 119 114 135 133
109 108 128 129 143 143
106 112 133 125 145
111 135 135
105 111 117 123 129 135
180
160
140
120
100
80
60
40
20
0
0 50 100 150 200 250

Αν η σχέση ανάμεσα στο X και στους


δεσμευμένους μέσους του Y είναι:
? E (Y X i )  a  bX i

ποια είναι η σχέση ανάμεσα στο Y και στο X ;

Ορίζουμε ui την διαφορά Yi  E (Y X i )


Yi  E (Y X i )  ui  a  bX i  ui

Υ = Συστηματικός όρος + Τυχαίος όρος


Το ui είναι τυχαία μεταβλητή και ονομάζεται
όρος σφάλματος (error term)
ή στοχαστικός (stochastic) όρος
ή διαταρακτικός (disturbance) όρος
Από τα προηγούμενα προκύπτει ότι
E (Yi X i )  E ( a  b X i  ui X i )  a  bX i  E ( ui X i )  E (Y X i )  E ( ui X i )

και αφού E (Yi X i )  E (Y X i )  E ( ui X i )  0

Η υπόθεση δηλαδή ότι η γραμμή παλινδρόμησης


περνάει από όλους τους δεσμευμένους μέσους
του Y συνεπάγεται ότι όλοι οι δεσμευμένοι μέσοι
του u είναι ίσοι με το μηδέν.

Το u, αντιπροσωπεύει όλες τις μεταβλητές που


επηρεάζουν το Y και δεν λήφθηκαν υπόψη στο
υπόδειγμα.

Γιατί δεν λήφθηκαν υπόψη ?

Δεν υπάρχουν διαθέσιμα στατιστικά στοιχεία

Ο ρόλος τους δεν είναι και τόσο σημαντικός και σ’


ένα βαθμό μπορεί να θεωρηθεί τυχαίος

Η συμμετοχή τους στο υπόδειγμα οδηγεί σε


πολύπλοκη μορφή συνάρτησης

Η προσέγγιση της πραγματικής μεταβλητής είναι


δύσκολη ή αδύνατη

Η μορφή της συνάρτησης δεν είναι η σωστή

κ.λ.π.
Ο πληθυσμός όμως
δεν είναι συνήθως γνωστός !
Στην αντίθετη περίπτωση η Στατιστική θα είχε
ελάχιστο ενδιαφέρον

Οι μόνες πληροφορίες που έχει ο ερευνητής


είναι αυτές που προέρχονται από το δείγμα

Παράδειγμα: Yi Xi
100 150
112 160
114 170
129 180
115 190
145 200

Σκοπός:
Η καλύτερη δυνατή προσέγγιση της
ευθείας του πληθυσμού

 Η εξίσωση της ευθείας που


Yi  a  bX i προκύπτει από τα στοιχεία του
δείγματος
Yi 
Η εκτιμήτρια(estimator) του E Y X i 
ή θεωρητική τιμή του Υ
a Η εκτιμήτρια του a
b Η εκτιμήτρια του b
Εκτιμήτρια - Εκτίμηση:
estimator - estimate
Ο όρος εκτιμήτρια αναφέρεται σε ένα μαθηματικό τύπο
που δίνει τον τρόπο εκτίμησης μιας παραμέτρου του
πληθυσμού με βάση τα στοιχεία του δείγματος.
Η εκτίμηση αντιπροσωπεύει μια συγκεκριμένη τιμή που
προκύπτει από την εφαρμογή αυτού του τύπου.

Yi  Yi  ui Η εκτιμήτρια του u


ή κατάλοιπο (residual)

έτσι
  u
Yi  a  bX i  ui  a  bX i i

Υ
Yi  a  b X i
Y4
u4  
E Yi X i  a  bX i
u4

u2 Y2 u2 a  bX 4

 
a  bX
a  bX 2 4

a  bX 2

Χ2 Χ4 Χ
Η μέθοδος των Ελαχίστων Τετραγώνων
Η μέθοδος των Ελαχίστων Τετραγώνων (Least
Squares) είναι μια από τις μεθόδους που
χρησιμοποιούνται για την εκτίμηση της γραμμής
παλινδρόμησης.
Είναι η μέθοδος που χρησιμοποιείται περισσότερο
επειδή (α) έχει σημαντικές στατιστικές ιδιότητες
(β) Είναι εύκολη στην εφαρμογή της.

Κριτήριο:
Επιλογή των a και b που ελαχιστοποιούν τα
τετράγωνα των αποκλίσεων της ευθείας
παλινδρόμησης από τις πραγματικές τιμές

   
n n

 u   Yi  a  bX
2
2   f a , b
i i
i 1 i 1

Ελαχιστοποίηση  u
i 1
2
i

n n

  u i
2
  ui2
i 1
i 1
0 0
a b
n
  ui2
 Y  a  bX
    1  0
n
i 1
2
a i 1
i i

n
  ui2
 Y  a  bX
   X   0
n
i 1
2
b i 1
i i i

n n

 Yi  na  b  X i
i 1 i 1
Σύστημα
n n n Κανονικών
 X Y  a  X
i 1
i i
i 1
i  b  X i2
i 1
Εξισώσεων

(Normal equations)
Επίλυση κανονικών εξισώσεων
n n

Y
i 1
i X
i 1
i

n n

XY X
n n n n

 X i2  Yi   X i  X iYi
2
i i i
i 1 i 1
a   a  i 1 i 1 i 1 i 1
2
 
n n n
n X
i 1
i n X    X i 
i 1  i 1  i
2

n n

X X
i 1
i
i 1
i
2

n
n Y
i 1
i

n n n n n

X XY
i 1
i
i 1
i i n X i Yi   X i  Yi
b   b  i 1 i 1 i 1
2
 
n n n
n X
i 1
i n X    X i 
 i 1  i
2

i 1
n n

X X
i 1
i
i 1
i
2


a  Y  bX

X  X Yi  Y 
n n

i x y i i
b  i 1
 i 1

X  X
n n

x
2 2
i i
i 1 i 1
n

 X Y  n XY i i
bˆ i 1
n

X
i 1
i
2
 nX 2

n n

xY i i y X i i
b  n
i 1
b  n
i 1

X i
2
 nX 2
X
i 1
i
2
 nX 2
i 1
Παράδειγμα:

Xi Yi X i Yi X i2 Yi u i
150 100 15000 22500 101,4 -1,4
160 112 17920 25600 108,5 3,5
170 114 19380 28900 115,6 -1,6
180 129 23220 32400 122,8 6,3
190 115 21850 36100 129,8 -14,8
200 145 290000 40000 137,0 8,0
Αθροίσματα 1050 715 126370 185500 715 0,0
Α. Μέσοι 175 119
n

 X Y  nXY
i i
126370  6 175 119
bˆ i 1
  0.7114
n
185500  6 175 2
X
i 1
i
2
 nX 2
a  119  0.7114  175   5.333

Μια αύξηση του εισοδήματος κατά μια νομισματική μονάδα επιφέρει μια
αύξηση στην κατανάλωση κατά 0.7114 νομισματικές μονάδες. Η Οριακή
Ροπή προς Κατανάλωση δηλαδή είναι 0.7114.

Οι υποθέσεις του Κλασσικού


Γραμμικού Υποδείγματος
Παλινδρόμησης

Το υπόδειγμα είναι γραμμικό στις παραμέτρους


Yi  a  bX i  u i

Οι τιμές της ανεξάρτητης μεταβλητής X


παραμένουν σταθερές σε επαναλαμβανόμενα
δείγματα. Έτσι
 
E Yi X i  a  bX i  
E ui X i  0 
Η διακύμανση του όρου σφάλματος για κάθε Xi
δεν εξαρτάται από το Yi και είναι σταθερή,
δηλαδή
   
var ui X i  E ui  E  ui  X i  E ui2 X i   2  
2

Η ιδιότητα αυτή ονομάζεται ομοσκεδαστικότητα


(homoscedasticity).
Στην αντίθετη περίπτωση έχουμε
ετεροσκεδαστικότητα (heteroscedasticity)
και
var ui X i   i2 

Μεταξύ των διαφόρων τιμών του όρου


σφάλματος δεν υπάρχει συσχέτιση ή όπως
αλλιώς λέγεται δεν υπάρχει αυτοσυσχέτιση
(autocorrelation).

  
cov ui u j X i , X j  E ui  E ui  X i  u j  E u j  X j  
 
 E ui X i  u j X j   0 i  j

Δεν υπάρχει συσχέτιση μεταξύ u και X. Δηλαδή

 
covui X i   E ui  E ui  X i X i  E  X i  X i  
   
E ui X i  E  X i  X i  E ui X i   E ui  E  X i   E ui X i   0
Ιδιότητες των εκτιμητριών a και b
Οι εκτιμήτριες a και b είναι τυχαίες μεταβλητές και τα
χαρακτηριστικά της κατανομής τους καθώς και οι
ιδιότητές τους είναι σημαντικές πληροφορίες για την
εξαγωγή συμπερασμάτων για τις αντίστοιχες τιμές
των παραμέτρων του πληθυσμού

Ο μέσος(mean) του b 
E b  b

Ο μέσος του a E  a   a

Η διακύμανση (variance) του b


var b    E b  E b

b
2
  
2

2
n
 
 2  E u2
i

x
i 1
2
i

Η τυπική απόκλιση (standard deviation) του b



b  n
 xi2 i 1

Ο υπολογισμός τόσο της διακύμανσης όσο και της τυπικής


απόκλισης βασίζεται στην διακύμανση του όρου σφάλματος
στον πληθυσμό (σ2).
Συνήθως η πληροφορία αυτή δεν είναι γνωστή γιαυτό
καταφεύγουμε στην εκτίμησή της από τις πληροφορίες του
δείγματος
τυπικό σφάλμα της εξίσωσης
(standard error of the regression)
n

 ui2
n

 uˆ 2
i
 2  S 2  i 1
ˆ  S  i 1
n2 n2
Εκτιμήτριες της διακύμανσης και του
τυπικού σφάλματος του b
  2 
Sb  n
2 Sb
 n

 xi 2
 xi2 i 1
i 1

 
 2 
1 X
Η διακύμανση (variance) του a  a2    n   2
n 2



i 1
xi 

1 X2
Η τυπική απόκλιση του â  a   
n n 2
(standard deviation)
 xi i 1

Εκτιμήτριες της διακύμανσης και του


τυπικού σφάλματος του a

 
 2  1 X2
1 X
Sa2    n   2 Sa   
n 2
n n 2


 xi 

 xi i 1
i 1

Η συνδιακύμανση του a και b

     
cov a , b  E  a  E  a   b  E b  X
2
 xi2
 2
ή  
cov a , b   X
x i
2
Παράδειγμα:
Xi Yi Yi u i2 xi2
150 100 101.38 1.907 625
160 112 108.50 12.283 225
170 114 115.61 2.590 25
180 129 122.72 39.391 25
190 115 129.84 220.170 225
200 145 136.95 64.764 625
341.105 1750
n

 u 2
i
.
341105
 2  i 1
  85.276   9.234
n2 4
 
cov a , b  175
85.276
1750
 8.527

 2 85.276
S 
2
b n   0.0487 Sb  0.2207
x 2 1750
i
i 1

 1 1752 
S  
2
 85.276  1506.55 Sa  38.81
a
 6 1750 

Το b που προκύπτει από την εφαρμογή


της μεθόδου των ελαχίστων τετραγώνων
είναι αμερόληπτη εκτιμήτρια (unbiased
estimator) του b αφού E b  b 
Το a που προκύπτει από την εφαρμογή
της μεθόδου των ελαχίστων τετραγώνων
είναι αμερόληπτη εκτιμήτρια (unbiased
estimator) του a αφού E  a   a
Αποδεικνύεται ότι τόσο η διακύμανση του a όσο
και του b είναι οι μικρότερες μεταξύ όλων των
αμερόληπτων εκτιμητριών του a και b.
Τα a και b είναι δηλαδή οι πιο αποτελεσματικές
εκτιμήτριες γι’ αυτό και ονομάζονται άριστες
εκτιμήτριες(best estimators).
Άριστες Γραμμικές Αμερόληπτες Εκτιμήσεις
Best Linear Unbiased Estimators - BLUE
Ιδιότητες της ευθείας παλινδρόµησης

Η ευθεία παλινδρόµησης περνάει από το σηµείο Y , X


αφού 
a = Y − bX

Y = Y  = Y − bX
Yi = a + bX i
 + bX
i (
 = Y + b( X − X )
i )
∑ Yi = nY + b∑ ( X i − X ) = nY
n n

i =1 i =1
n

∑ Y i
i =1
=Y ⇒ Y = Y
n

n
( )
n n n n

∑ u
i =1
i =0 ∑ ui = ∑ Yi − a − bX
i =1 i =1

i = ∑ Yi − na − b ∑ X i = 0
 
i =1 i =1

Αυτό όµως προϋποθέτει την ύπαρξη του a . Αν δηλαδή


υποχρεώσουµε την ευθεία παλινδρόµησης να περάσει
από την αρχή των αξόνων τότε η ιδιότητα αυτή δεν ισχύει


yi = bx  + u ⎫
Yi = a + bX
i ⎬ ⇒ Yi − Y = b( X i − X ) + ui
i i

Y = a + bX ⎭
 + u ⇒ y = bx
yi = bx 
i i i i

∑ y u
i =1
i i =0 n

∑ yi ui = ∑ bx
n

( )
n
 u = b ∑ x u = b ∑ x y − bx
i i i i i i
 =
i
n

( )
i =1 i =1 i =1 i =1

n n
⎛ n ⎞ n
= b ∑ xi yi − b 2 ∑ xi2 = b⎜ b ∑ xi2 ⎟ − b 2 ∑ xi2 = 0
i =1 i =1 ⎝ i =1 ⎠ i =1

∆εν υπάρχει συσχέτιση µεταξύ yi και ui

∑ ui X i = 0 ( )
n n

∑ ui X i = ∑ Yi − a − bX
i =1 i =1
 X =0
i i
i =1

∆εν υπάρχει συσχέτιση µεταξύ X i και ui


Συντελεστής προσδιορισµού

Ο συντελεστής προσδιορισµού (coefficient of


determination) είναι ένα µέτρο του βαθµού
προσαρµογής (goodness of fit) της ευθείας
παλινδρόµησης στις παρατηρήσεις του δείγµατος.
Συµβολίζεται µε r2 (στην περίπτωση της πολλαπλής
παλινδρόµησης µε R2).

Ο αριθµητικός µέσος µιας µεταβλητής (Y ) είναι η


καλλίτερη πρόβλεψη όταν η µόνη διαθέσιµη
πληροφορία είναι οι τιµές της ίδιας της µεταβλητής.

Η Χ µπορεί να θεωρηθεί ότι ερµηνεύει την Υ στον


βαθµό που συµβάλλει στην πρόβλεψή της πέρα από
τον µέσο Y

Υ Yi 
Yi = a + bX i
Yi − Yi = ui

Yi − Y

Yi − Y
Y

X Χi Χ

∑ (Y − Y )
2
i Συνολικό Άθροισµα Τετραγώνων (Total
Sum of Squares) - TSS .
Αντιπροσωπεύει την συνολική
διακύµανση του Υ.
∑ (Y − Y ) Ερµηνευόµενο Άθροισµα Τετραγώνων
2
i
(Regression Sum of Squares) - RSS .
Αντιπροσωπεύει την διακύµανση του Υ
που ερµηνεύεται από την ευθεία
παλινδρόµησης.

∑ (Y − Y ) To Άθροισµα Τετραγώνων των


2
i i
σφαλµάτων (Error Sum of Squares) -
= ∑ u i
2
ESS . Αντιπροσωπεύει την διακύµανση
του Υ που δεν ερµηνεύεται από την ευθεία
παλινδρόµησης.

Αποδεικνύεται ότι

TSS=RSS+ESS

Συντελεστής Προσδιορισµού

RSS ESS
r2 = = 1−
TSS TSS

∑( i )
 ∑( i i)
2 2
Y − Y Y − Y
r2 = = 1−
∑ (Y − Y ) ∑ (Y − Y )
2 2
i i

0 ≤ r2 ≤ 1

∑ (bx
 )
n n n n

∑ yi2 ∑ xi2 ∑x ( n − 1)
2
2
i i
S2
r = 2 i =1
n = i =1
n = b 2 i =1
n = b 2 i =1
n = b 2 X2
∑y ∑y ∑y ∑y
SY
2
i i
2 2
i
2
i
( n − 1)
i =1 i =1 i =1 i =1
Παράδειγµα:

(Y − Y ) (Y − Y )
Xi 2 2
Yi
i i i

150 100 1.907 367.361


160 112 12.283 51.361
170 114 2.590 26.694
180 129 39.391 96.694
190 115 220.170 17.361
200 145 64.764 667.361
341.105 1226.8

∑ (Y − Y )
n
2
i
i =1 341105
.
r2 = 1− = 1− = 0.722
∑ (Y − Y )
n
2 1226.8
i
i =1

S2 350
r 2 = b 2 X2 = 0.7112 = 0.722
SY 245.37

Συντελεστής συσχέτισης

Ο συντελεστής συσχέτισης (correlation coefficient)


µας δίνει τον βαθµό γραµµικής συσχέτισης
ανάµεσα σε δύο µεταβλητές χωρίς να ενδιαφέρεται
για την αιτιώδη σχέση που µπορεί να υπάρχει
µεταξύ τους.
Συµβολίζεται µε το r και συνδέεται άµεσα µε τον
συντελεστή προσδιορισµού αφού r = ± r 2
n n n n

∑x y
i =1
i i n∑ XiYi − ∑ Xi ∑Yi
i =1 i =1 i =1
r= n n
= 2 2
⎛ n ⎞ ⎛ n ⎞
∑x ∑ y
n n
n∑ Xi − ⎜ ∑ Xi ⎟ n∑Yi − ⎜ ∑Yi ⎟
2 2 2 2
i i
i =1 i =1 i =1 ⎝ i =1 ⎠ i =1 ⎝ i =1 ⎠

cov( X ,Y)
r=
var( X ) var( Y)
Ιδιότητες
1. −1≤ r ≤1

2. rX ,Y = rY, X

3. Είναι ένα µέτρο γραµµικής συσχέτισης. Έτσι


όταν r=0 δεν συνεπάγεται αναγκαστικά ότι οι
δύο µεταβλητές είναι ανεξάρτητες.

2
  2 SX
Yi = a + bX i
r= b 2
SY
 ′
r = bb
2
S
X i = a ′ + b ′Yi r = b ′ 2 Y
2
S X

Παράδειγµα:

Xi Yi xi yi xi yi x i2 y i2

150 100 -25 -19.17 479.167 625 367.361


160 112 -15 -7.17 107.500 225 51.361
170 114 -5 -5.17 25.833 25 26.694
180 129 5 9.83 49.167 25 96.694
190 115 15 -4.17 -62.500 225 17.361
200 145 25 25.83 645.833 625 667.361
1245 1750 1226.833

∑x y
i =1
i i
1245
r= = = 0.8496
n n
1750 ⋅ 1226.833
∑x ∑y
i =1
2
i
i =1
i
2

  ′ = 1.015 ⋅ 0.7114 = 0.8496 = 0.8496


r = bb
Έλεγχος υποθέσεων και διαστήµατα
εµπιστοσύνης για τα a και b

Υπόθεση: ut ~ N ( 0, σ 2 )

Επειδή κάθε γραµµικός µετασχηµατισµός µιας


τυχαίας µεταβλητής που ακολουθεί την κανονική
κατανοµή είναι επίσης τυχαία µεταβλητή µε κανονική
κατανοµή, το Yi ακολουθεί την κανονική κατανοµή
αφού Yi = a + bX i + ui

Για τον ίδιο λόγο τόσο το a όσο και το b είναι


τυχαίες µεταβλητές που ακολουθούν την κανονική
κατανοµή

⎛ ⎛ ⎞ ⎞
⎜ ⎜ 2 ⎟ ⎟
⎜ 1
a ~ N a , ⎜ + n
X ⎟σ ⎟
2
⎜ ⎜n ⎟ ⎟
⎜ ⎜
⎝ ⎝
∑i =1
xi2 ⎟ ⎟
⎠ ⎠

⎛ ⎞
⎜ 2 ⎟
σ ⎟
b ~ N ⎜ b, n
⎜ 2⎟
⎜ ∑ xi ⎟
⎝ i =1 ⎠
Στατιστικός έλεγχος του b

b − b0 b − b0
Z= =
σb Z ~ N ( 0,1)
n
σ 2
∑x
i =1
i
2

n
b − b0 b − b0 ∑ u
tn−2 = = i
Sb n σ =
2 i =1

σ 2 ∑ xi2
i =1
n−2

Παράδειγµα: Yi = −5.333 + 0.7114 X i S a = 38.81


Sb = 0.2207
H0 : b=0 (α=0.05)
b − b 0.7114 − 0
t= = = 3.222 Από τους πίνακες t 0.025/ 4 = 2.776
Sb 0.2207

Η υπόθεση H0 απορρίπτεται

Στατιστικός έλεγχος του a

a − a a − a
Z=
σ a
=
1 X2
Z ~ N ( 0,1)
σ +
n n 2
∑ xii =1

a − a a − a
t= =
Sb 1 X2
σ + n
∑ xi2
n
i =1

Παράδειγµα: Yi = −5.333 + 0.7114 X i S a = 38.81


Sb = 0.2207
H0 : a=0 (α=0.05)

a − a − 5.33 − 0 t 0.025/ 4 = 2.776


t= = = −0.1374 Από τους πίνακες
Sa 38.81

Η υπόθεση H0 δεν απορρίπτεται


∆ιαστήµατα εµπιστοσύνης για το a και b

P (− tα / 2 , n − 2 ≤ t ≤ tα / 2 , n − 2 ) = 1 − α

( )
P b − Sb ⋅ tα / 2 ,n − 2 ≤ b ≤ b + Sb ⋅ tα / 2 ,n − 2 = 1 − α

b ± Sb ⋅ tα / 2 ,n − 2 a ± Sa ⋅ tα / 2 ,n − 2

Παράδειγµα: Yi = −5.333 + 0.7114 X i S a = 38.81


Sb = 0.2207

b − Sb ⋅ tα / 2 ,n − 2 ≤ b ≤ b + Sb ⋅ tα / 2 ,n − 2 a − S a ⋅ tα / 2 ,n − 2 ≤ a ≤ a + S a ⋅ tα / 2 ,n − 2
0.7114 − 0.2207 ⋅ 2.776 ≤ b ≤ 0.7114 + 0.2207 ⋅ 2.776 − 5.33 − 38.81 ⋅ 2.776 ≤ a ≤ − 5.33 + 38.81 ⋅ 2.776

0.0987 ≤ b ≤ 1.324 − 113.07 ≤ a ≤ 102.41

Προβλέψεις

Ένα από τα πεδία εφαρµογής της ανάλυσης


παλινδρόµησης είναι και η πρόβλεψη (Forecasting)
της εξαρτηµένης µεταβλητής για συγκεκριµένη τιµή
της ανεξάρτητης. ∆ιακρίνουµε δύο είδη
προβλέψεων:
(α) Την πρόβλεψη της µέσης τιµής του Υ όταν
Χ=Χ0. Αυτό ισοδυναµεί µε κάποιο σηµείο πάνω
στην γραµµή παλινδρόµησης του πληθυσµού.
(β) Την πρόβλεψη της συγκεκριµένης τιµής του Υ
όταν Χ=Χ0 .
Και στις δύο περιπτώσεις υπολογίζεται ένα
διάστηµα εµπιστοσύνης µέσα στο οποίο βρίσκεται
η πραγµατική τιµή του πληθυσµού.
Πρόβλεψη της µέσης τιµής του Υ

X = X0 
Y0 = a + bX
Όταν 0

( ) (
E Yˆ X 0 = E Y X 0 ) Αρα το Y0 αποτελεί µια
αµερόληπτη εκτίµηση του E (Y X0 )
⎛ ⎞
⎜ 2 ⎟
όσο περισσότερο απέχει η Χ0
Var (Y0 ) = σ 2 ⎜ + n 0 ⎟
1 x
⎜n
⎜ ∑

xi2 ⎟ από την µέση τιµή τόσο
⎝ i =1 ⎠ µεγαλύτερη είναι η διακύµανση
xi = X i − X και λιγότερο ακριβής η
x0 = X 0 − X πρόβλεψη

Τα όρια µέσα στα οποία βρίσκεται το (


E Y X0 )
1 x02 1 x2

Y0 ± Zα / 2σ +
n n 2
ή Y0 ± tα / 2 ,n − 2σ + n 0
∑ xi2
n
∑ xi i =1 i =1

Παράδειγµα: Yi = −5.333 + 0.7114 X i


n

X = 175 σ = 9.234 ∑x
i =1
i
2
= 1750

Ζητείται η προβλεπόµενη µέση τιµή του Υ στον


πληθυσµό όταν Χ=165 και Χ=210. Η πρώτη τιµή
βρίσκεται κοντά στην µέση τιµή ενώ η δεύτερη βρίσκεται
σε µεγαλύτερη απόσταση.
Yi = −5.333 + 0.7114 ⋅ 165 = 112.048
1 (175 − 165)
( )
2

X 0 = 165 E Y X 0 = 165 = ±112.048 − 2.776 ⋅ 9.234 +


6 1750

(
99.921 ≤ E Y X 0 = 165 ≤ 124.175 )

Yi = −5.333 + 0.7114 ⋅ 210 = 144.061


1 (175 − 210)
( )
2

X 0 = 210 E Y X 0 = 210 = ±144.061 − 2.776 ⋅ 9.234 +


6 1750

(
120.197 ≤ E Y X 0 = 210 ≤ 167.924 )
Πρόβλεψη συγκεκριµένης τιµής του Υ

X = X0 
Y0 = a + bX
Όταν 0

και Y0 − Y0 το λάθος της πρόβλεψης

(
E (Y0 − Y0 ) = E ( a − a ) + E b − b X 0 + E (u0 ) = 0 )
Αρα το Y0 αποτελεί µια
αµερόληπτη εκτίµηση του Y0
⎛ ⎞ ⎛ ⎞
⎜ 2 ⎟ ⎜ 2 ⎟
1 x
σ Y2 −Y = σ 2 ⎜1 + + n 0 ⎟ 1 x
= σ 2 ⎜ 1 + + n 0 ⎟
⎜ n ⎟ ή SY2 −Y
⎜ n ⎟
∑ ∑
0 0 0 0
⎜ xi2 ⎟ ⎜ xi2 ⎟
⎝ i =1 ⎠ ⎝ i =1 ⎠

όσο περισσότερο απέχει η Χ0 από την µέση τιµή


τόσο µεγαλύτερη είναι η διακύµανση και λιγότερο
ακριβής η πρόβλέψη.

1 x2 1 x2
− tα / 2 ,n − 2 ⋅ σ 1 + + n 0 ≤ Y0 − Y ≤ tα / 2 ,n − 2 ⋅ σ 1 + + n 0
∑ xi2 ∑ xi2
n n
i =1 i =1

1 x2 1 x2
Y − tα / 2 ,n − 2 ⋅ σ 1 + + n 0 ≤ Y0 ≤ Y + tα / 2 ,n − 2 ⋅ σ 1 + + n 0
∑ xi2 ∑ xi2
n n
i =1 i =1

Η πρόβλεψη συγκεκριµένης τιµής γίνεται µε µικρότερη


ακρίβεια απ΄ότι η πρόβλεψη της µέσης τιµής

Παράδειγµα:
Yi = −5.333 + 0.7114 ⋅ 165 = 112.048

1 (175 − 165)
2

X 0 = 165 Y0 = ±112.048 − 2.776 ⋅ 9.234 1 + +


6 1750
83.69 ≤ Y0 ≤ 140.40
∆ιάγραµµα 8.9:
∆ιαστήµατα Εµπιστοσύνης των προβλέψεων της Υ

Y
Ŷ = b 0 + b1X
Ŷ0 ± t α / 2 s Ŷ
0

Ŷ0 ± t α / 2 s Ŷ
0

X
X

Ελαστικότητα
Η ελαστικότητα (της Υ ως προς την Χ) ισούται µε τον λόγο
µεταξύ της ποσοστιαίας µεταβολής της Υ ως προς τη
ποσοστιαία µεταβολή της Χ δηλαδή:

∆Y / Y ∆Y X X X
nY / X = = nY / X = b1 = b1
∆X / X ∆ X Y Y Yˆ

Μέση ελαστικότητα X
nY / X = b1
Y
Πίνακας 13.1: Κύκλος Εργασιών & Βραχ.
Υποχρεώσεις της εταιρίας (σε χιλ. ευρώ)

Έτος Κύκλος Εργασιών Βραχ. Υποχρεώσεις

1995 828 301

1996 936 391

1997 1300 583

1998 1306 668

1999 1194 523

2000 2348 720


Πίνακας 13.2: Κύκλος Εργασιών & Βραχ.
Υποχρεώσεις της εταιρίας (σε χιλ. ευρώ)
Κύκλος Εργασιών Βραχ. Υποχρεώσεις Βραχ. Υποχρ./Κ.Ε.
Έτος

Χιλ € ∆είκτης 1995=100 Χιλ € ∆είκτης 1995=100 ∆είκτης 1995=100

1995 828 (828/828)*100 100 301 (301/301)*100 100,0 (301/828)*100 36,3

1996 936 (936/828)*100 113,1 391 (391/301)*100 130,0 (391/936)*100 41,8

1997 1300 (1300/828)*100 157,1 583 (583/301)*100 193,9 (583/1300)*100 44,9

1998 1306 (1306/828)*100 157,8 668 (668/301)*100 222,1 (668/1306)*100 51,1

1999 1194 (1194/828)*100 144,3 523 (523/301)*100 174,0 (523/1194)*100 43,8

2000 2348 (2348/828)*100 283,7 720 (720/301)*100 239,4 (720/2348)*100 30,7

Οι αριθµοδείκτες (ή δείκτες) είναι στατιστικά


µέτρα που εκφράζουν ποσοστιαίες µεταβολές
σύνθετων κυρίως µεγεθών.

Μεταβολή απλού µεγέθους Σχετική τιµή


Μεταβολή σύνθετου µεγέθους ∆είκτης

Παραδείγµατα Οικονοµικών ∆εικτών


∆είκτες Τιµών
∆είκτες Όγκου
Άλλα Παραδείγµατα
∆είκτες αξίας
∆είκτες ακροαµατικότητας
∆είκτες εγκληµατικότητας
κ.λ.π.
Σχετικές τιµές

Ο λόγος της τιµής ενός προϊόντος σε µια χρονική περίοδο


t+i προς την τιµή του ίδιου προϊόντος στην χρονική
περίοδο t µας δίνει την σχετική τιµή του προϊόντος στην
περίοδο t+i ως προς την περίοδο t.

⎛ Pt +Ai ⎞
P A
t +i / t = ⎜⎜ A ⎟⎟
⎝ Pt ⎠

Pt +Ai
Ποσοστό µεταβολής A
−1
Pt

αν P0 , P1 , P2 , ... , Pn σειρά τιµών του προϊόντος Α


A A A A

∆είκτης τιµών ή σχετικές τιµές µε βάση την περίοδο 0

⎛ P0A ⎞ A ⎛ P1A ⎞ A ⎛ P2A ⎞ ⎛ PnA ⎞


P A
0/0 = ⎜⎜ A ⎟⎟ P1/ 0 = ⎜⎜ A ⎟⎟ P2 / 0 = ⎜⎜ A ⎟⎟ ... Pn / 0 = ⎜⎜ A ⎟⎟
A

⎝ P0 ⎠ ⎝ P0 ⎠ ⎝ P0 ⎠ ⎝ P0 ⎠

Με βάση την περίοδο t

⎛ P0A ⎞ A ⎛ P1A ⎞ A ⎛ P2A ⎞ ⎛ PnA ⎞


P = ⎜⎜ A ⎟⎟ P1/ t = ⎜⎜ A ⎟⎟ P2 / t = ⎜⎜ A ⎟⎟ ... Pn / t = ⎜⎜ A ⎟⎟
A
0/t
A

⎝ Pt ⎠ ⎝ Pt ⎠ ⎝ Pt ⎠ ⎝ Pt ⎠
Παράδειγµα:

Ετος Pi Pi/1990 Pi/1993 Pi/1994


1990 168 100.0 77.1 73.0
1991 187 111.3 85.8 81.3
1992 204 121.4 93.6 88.7
1993 218 129.8 100.0 94.8
1994 230 136.9 105.5 100.0
1995 240 142.9 110.1 104.3

Παρατήρηση
Για την αλλαγή του έτους βάσης δεν είναι απαραίτητο να γνωρίζουµε τις τιµές
του προϊόντος, αρκεί να γνωρίζουµε κάποιο δείκτη. ∆ιαιρώντας όλες τις τιµές
του δείκτη µε την τιµή του έτους βάσης προκύπτει ο νέος δείκτης.
Ο δείκτης δηλαδή Pi /1993 µπορεί να προκύψει είτε διαιρώντας το Pi µε το
218 είτε το Pi /1990 µε το 129.8.

Σχετικές Τιµές και Αριθµοδείκτες

Ο υπολογισµός ενός δείκτη που εκφράζει τις µεταβολές στις τιµές


ενός προϊόντος δεν παρουσιάζει ιδιαίτερες δυσκολίες αλλά ούτε
και ιδιαίτερο ενδιαφέρον.

Το ενδιαφέρον αλλά και τα προβλήµατα βρίσκονται στις


περιπτώσεις που ο δείκτης τιµών εκφράζει τις µεταβολές στην
τιµή όχι ενός προϊόντος αλλά στο επίπεδο τιµών µιας οµάδας
προϊόντων.

Παραδείγµατα: Επίπεδο τιµών των αγροτικών προϊόντων, των


καταναλωτικών αγαθών, των λαχανικών, των εξαγωγών, κ.λ.π.
Το βασικό πρόβληµα Ο τρόπος µε τον οποίο γίνεται η
υπολογισµού των σύνθεση των µεταβολών των τιµών
αριθµοδεικτών των επί µέρους αγαθών

θα πρέπει να χρησιµοποιηθεί κάποιος


µέσος όρος των µεταβολών αυτών

Ποιος µέσος όρος ;

∆ιαφορετικές µεθοδολογίες
υπολογισµού αριθµοδεικτών

Κατηγορίες Αριθµοδεικτών

Αστάθµητοι Σταθµικοί
όλα τα αγαθά που απαρτίζουν Λαµβάνουν υπόψη το πραγµατικό
ένα σύνθετο αγαθό έχουν το ίδιο γεγονός ότι συνήθως τα αγαθά δεν
ειδικό βάρος έχουν την ίδια σπουδαιότητα

Η µεταβολή του επιπέδου των


τιµών µπορεί να υπολογιστεί ∆ιαφορετικοί τρόποι
σαν ένας απλός µέσος στάθµισης
(αριθµητικός, γεωµετρικός ή
αρµονικός) των µεταβολών των
επι µέρους αγαθών διαφορετικές µέθοδοι
υπολογισµού των σταθµικών
αριθµοδεικτών
Αστάθµητοι Αριθµοδείκτες
Τιµών

1. Αστάθµητος συνολικός δείκτης


P0A , P1 A , P2A , ... , PnA
Τιµές των προϊόντων Α και Β
B B B B
P , P1 , P , ... , P
0 2 n

Περίοδος βάσης η περίοδος 0

P0A + P0B P1A + P1B P2A + P2B PnA + PnB


P0 / 0 = A , P1 / 0 = A , P2 / 0 = A , ... , Pn / 0 = A
P0 + P0B P0 + P0B P0 + P0B P0 + P0B

Γενικά ∑P i
Pi k/ 0 = i =1
k
* 100
∑P
i =1
0
2. Αριθµητικός Μέσος Σχετικών Τιµών

P0A , P1 A , P2A , ... , PnA


Τιµές των προϊόντων Α και Β
B B B B
P , P1 , P , ... , P
0 2 n

Περίοδος βάσης η περίοδος 0


P0A P0B P1A P1B P2A P2B PnA PnB
+ + + +
P0A P0B P0A P0B P0A P0B P0A P0B
P0 / 0 = , P1/ 0 = , P2 / 0 = , ... , Pn / 0 =
2 2 2 2

1 k Pt i
Γενικά Pt / o = ∑ i
k i =1 P0

Παράδειγµα

Ετος Pi A Pi B A
Pi /1990 B
Pi /1990 Pi /1990
1990 168 815 100.0 100.0 100.0
1991 187 864 111.3 106.0 108.7
1992 204 902 121.4 110.7 116.1
1993 218 935 129.8 114.7 122.2
1994 230 970 136.9 119.0 128.0
1995 240 1004 142.9 123.2 133.0
3. Γεωµετρικός Μέσος Σχετικών Τιµών

⎛ Pt i ⎞ 1 k ⎛ Pt i ⎞
ln Pt / 0 = ∑ ln⎜⎜ i ⎟⎟
k
Pt / 0 = k ∏ ⎜⎜ i ⎟⎟ ή
i =1 ⎝ P0 ⎠
k i =1 ⎝ P0 ⎠

Παράδειγµα

Ετος Pi A Pi B A
Pi /1990 B
Pi /1990 Pi /1990
1990 168 815 100.0 100.0 100.0
1991 187 864 111.3 106.0 108.6
1992 204 902 121.4 110.7 115.9
1993 218 935 129.8 114.7 122.0
1994 230 970 136.9 119.0 127.6
1995 240 1004 142.9 123.2 132.7

4. Αρµονικός Μέσος Σχετικών Τιµών

k
Pt / o = k
⎛ P0i ⎞
∑ ⎜⎜ i ⎟⎟
i =1 ⎝ Pt ⎠

Παράδειγµα

Ετος Pi A Pi B A
Pi /1990 B
Pi /1990 Pi/1990
1990 168 815 100.0 100.0 100.0
1991 187 864 111.3 106.0 108.6
1992 204 902 121.4 110.7 115.8
1993 218 935 129.8 114.7 121.8
1994 230 970 136.9 119.0 127.3
1995 240 1004 142.9 123.2 132.3
Σταθµικοί Αριθµοδείκτες
Τιµών

* Κάθε σειρά σχετικών τιµών σταθµίζεται ανάλογα µε την


σπουδαιότητά της

* Η σπουδαιότητα προσδιορίζεται µε το µερίδιο της ποσότητας


του κάθε προϊόντος στη συνολική ποσότητα

* Επειδή όµως πολλές φορές είναι αδύνατο να αθροιστούν οι


ποσότητες των διαφορετικών προϊόντων εκφράζονται αυτές
σε αξίες.

Γενικά, ένας σταθµικός αριθµοδείκτης υπολογίζεται σαν


k
Pt i i
Pt / 0 = ∑ i S
i =1 P0

Όπου Si η στάθµιση του προϊόντος i


Αν η στάθµιση 1 Αστάθµητος
είναι σταθερή και Si =
k Αριθµητικός
Μέσος
Συνήθως αυτό δεν ισχύει αφού τόσο οι ποσότητες
όσο και οι τιµές µεταβάλλονται.

Ο υπολογισµός µιας Η στάθµιση που αντιστοιχεί σ’


σχετικής τιµής αναφέρεται αυτήν µπορεί να αναφέρεται σε
στις τιµές δύο χρονικών οποιαδήποτε από τις δύο ή σε
περιόδων καµία

Οι διαφορετικοί τρόποι (τύποι) υπολογισµού σταθµικών


αριθµοδεικτών διαφέρουν ακριβώς σε αυτό το σηµείο. Κάθε
ένας επιλέγει και διαφορετική χρονική περίοδο στάθµισης.

1. ∆είκτης Τιµών Laspeyres

P0i Q0i
στάθµιση S =
i
k

∑P Q
i =1
0
i i
0

Στην περίπτωση των δύο προϊόντων Α και Β

Pt A P0AQ0A Pt B P0B Q0B Pt A A Pt B B


P = A⋅ A A
L
+ ⋅ = S + B ⋅S
P0 P0 Q0 + P0B Q0B P0B P0AQ0A + P0B Q0B P0A
t/0
P0

Pt A A A Pt B B B
P0 Q0 + B P0 Q0
P0A P0 Pt AQ0A + Pt B Q0B
= = A A
P0AQ0A + P0B Q0B P0 Q0 + P0B Q0B
Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 140 500

60 ⋅100 + 140 ⋅ 300


P95L / 90 = = 1.714
40 ⋅100 + 80 ⋅ 300

Στην περίπτωση των k προϊόντων


k
αξία των προϊόντων στην περίοδο βάσης
∑P Q t
i i
0
Pt L/ 0 = i =1
k

∑P Q
i =1
0
i i
0
απαιτούµενη δαπάνη για την αγορά των ίδιων
ποσοτήτων αλλά µε τις τιµές της τρέχουσας
περιόδου

Βασικό µειονέκτηµα του δείκτη Laspeyres είναι ότι


χρησιµοποιεί σαν συντελεστές στάθµισης τις ποσότητες
του έτους βάσης οι οποίοι µε την πάροδο του χρόνου
δεν αντιπροσωπεύουν την πραγµατικότητα.
Για τον λόγο αυτό θα πρέπει κατά καιρούς να
αναθεωρούνται.
2. ∆είκτης Τιµών Paasche

P0i Qti
στάθµιση S =
i
k

∑P Q
i =1
0
i
t
i

Στην περίπτωση των δύο προϊόντων Α και Β

Pt A P0AQtA Pt B P0B QtB Pt A A Pt B B


P = A⋅ A A
P
+ ⋅ = S + B ⋅S
P0 P0 Qt + P0B QtB P0B P0AQtA + P0B QtB P0A
t/0
P0

Pt A A A Pt B B B
P0 Qt + B P0 Qt
P0A P0 Pt AQtA + Pt B QtB
= = A A
P0 Qt + P0 Qt
A A B B
P0 Qt + P0B QtB

Παράδειγµα
Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 140 500

60 ⋅150 + 140 ⋅ 500


P95P / 90 = = 1.717
40 ⋅150 + 80 ⋅ 500

Στην περίπτωση των k προϊόντων


k
∆απάνη στην τρέχουσας περίοδο
∑P Q t
i
t
i

Pt P/ 0 = i =1

Απαιτούµενη δαπάνη για την αγορά των ίδιων


k

∑P Q
i =1
0
i
t
i
ποσοτήτων στην περίοδο βάσης
3. Σταθµικός Γεωµετρικός Μέσος

Στάθµιση Laspeyres

P0i Q0i
Si k P0i Q0i
k
⎛ Pt ⎞ i
⎛ Pt ⎞ ∑ P0i Q0i ∑
k i k
P0i Q0i k
⎛ Pt ⎞ i
P GL
t /0 = ∏ ⎜⎜ i ⎟⎟ = ∏ ⎜⎜ i ⎟⎟ i=1 = i=1 ∏ ⎜⎜ i ⎟⎟
i =1 ⎝ P0 ⎠ i =1 ⎝ P0 ⎠ i =1 ⎝ P0 ⎠

Παράδειγµα
Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 140 500

40⋅100 80⋅300
⎛ 60 ⎞ 40⋅100 +80⋅300 ⎛ 140 ⎞ 40⋅100 +80⋅300
P95GL/ 90 = ⎜ ⎟ ⋅⎜ ⎟ = 1.712
⎝ 40 ⎠ ⎝ 80 ⎠

Στάθµιση Paasche
P0i Qti
Si k P0i Qti
k
⎛ Pt ⎞i
⎛ Pt ⎞ ∑ P0i Qti ∑
k i k
Poi Qti k
⎛ Pt ⎞
i
Pt GP
/0 = ∏ ⎜ ⎟
⎜ Pi ⎟
i =1 ⎝ 0 ⎠
= ∏ ⎜⎜ i ⎟⎟ i=1
i =1 ⎝ P0 ⎠
= i=1 ∏ ⎜⎜ i ⎟⎟
i =1 ⎝ P0 ⎠

Παράδειγµα
Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 140 500

40⋅150 80⋅500
⎛ 60 ⎞ 40⋅150 +80⋅500 ⎛ 140 ⎞ 40⋅150 +80⋅500
P95GP/ 90 = ⎜ ⎟ ⎜ ⎟ = 1.715
⎝ 40 ⎠ ⎝ 80 ⎠
4. Σταθµικός Αρµονικός Μέσος

Στάθµιση Laspeyres
k

1 ∑P Q 0
i i
0

/0 =
Pt HL = k i =1 i
k
⎛ P0 ⎞ P0 Q0
i i i
⎛ P0 ⎞ i i
∑ ⎜ i ⎟ k i i ∑ ⎜⎜ P i ⎟⎟Po Q0

i =1 ⎝ Pt ⎠

∑ P0 Q0 i =1 ⎝ t ⎠
i =1

Παράδειγµα
Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 140 500

40 ⋅100 + 80 ⋅ 300
P95HL/ 90 = = 1.709
40 80
40 ⋅100 + 80 ⋅ 300
60 140

Στάθµιση Paasche

1 ∑P Q 0
i
t
i

/0 =
Pt HP = k i =1 i
k
⎛ P0 ⎞ P0 Qt
i i i
⎛ P0 ⎞ i i
∑ ⎜ P i ⎟ k i i ∑ ⎜⎜ P i ⎟⎟Po Qt

i =1 ⎝ t ⎠

∑ P0 Qt i =1 ⎝ t ⎠
i =1

Παράδειγµα
Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 140 500

40 ⋅150 + 80 ⋅ 500
P95HP/ 90 = = 1.713
40 80
40 ⋅150 + 80 ⋅ 500
60 140
5. ∆είκτης Edgeworth - Marshall

⎛ Q0i + Qti ⎞
P ⎜⎜ 0
i
⎟⎟
Si = k ⎝ ⎠
2
στάθµιση
i ⎛ Q0 + Qt ⎞
i i

∑ P0 ⎜⎜ ⎟⎟
i =1 ⎝ 2 ⎠

Στην περίπτωση των δύο προϊόντων Α και Β


Pt A A ⎛ QtA + Q0A ⎞ Pt B B ⎛ QtB + Q0B ⎞
P0 ⎜⎜ ⎟⎟ + B P0 ⎜⎜ ⎟⎟
P0A ⎝ 2 ⎠ 0P ⎝ 2 ⎠
Pt E/ 0− M =
A ⎛ Qt + Q0 ⎞ B ⎛ Qt + Q0 ⎞
A A B B
P0 ⎜⎜ ⎟⎟ + P0 ⎜⎜ ⎟⎟
⎝ 2 ⎠ ⎝ 2 ⎠
(
Pt A QtA + Q0A + Pt B QtB + Q0B
= A A
) ( )
(
P0 Qt + Q0A + P0B QtB + Q0B ) ( )

Παράδειγµα
Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 140 500

60(100 + 150) + 140(500 + 300)


P95E /−M
90 = = 1.716
40(100 + 150 ) + 80(500 + 300)

Στην περίπτωση των k προϊόντων

∑ P (Q )
k

t
i
t
i
+ Q0i
E −M
P = i =1

∑ P (Q )
t/0 k

0
i
t
i
+ Q0i
i =1
6. ∆είκτης Fisher (Ιδανικός)

Pt F/ 0 = Pt L/ 0 ⋅ Pt P/ 0

Παράδειγµα

P95F / 90 = 1.714 ⋅1.717 = 1.716

Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 140 100

P95L / 90 = 1.714
P95P / 90 = 1.643

P95GL/ 90 = 1.712 P95GP/ 90 = 1.638


P95HL/ 90 = 1.709 P95HP/ 90 = 1.633
P95E /−M
90 = 1.690

P95F / 90 = 1.678
Αριθµοδείκτες Όγκου

Οι αριθµοδείκτες όγκου εκφράζουν τις µεταβολές στον


όγκο µιας οµάδας αγαθών (π.χ. όγκος βιοµηχανικής
παραγωγής).

Υπολογίζονται µε τον ίδιο τρόπο που υπολογίζονται οι


αριθµοδείκτες τιµών και έχουν όλες τις ιδιότητες αλλά
και τα προβλήµατα που αναφέρθηκαν στην περίπτωση
των αριθµοδεικτών τιµών.
Αστάθµητοι Αριθµοδείκτες
Όγκου

1. Αριθµητικός Μέσος

1 k ⎛ Qti ⎞
Qt / 0 = ∑ ⎜⎜ i ⎟⎟
k i =1 ⎝ Q0 ⎠

Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

1 ⎛ 150 100 ⎞
Q95 / 90 = ⎜ + ⎟ = 0.917
2 ⎝ 100 300 ⎠
2. Γεωµετρικός Μέσος

k
⎛ Qti ⎞
Qt / 0 = k ∏ ⎜⎜ i ⎟⎟
i =1 ⎝ Q0 ⎠

Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

150 100
Q95 / 90 = = 0.707
100 300

3. Αρµονικός Μέσος

k
Qt / 0 = k
Q0i

i =1 Qt
i

Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

2
Q95 / 90 = = 0.546
100 300
+
150 100
Σταθµικοί Αριθµοδείκτες
Όγκου

1. ∆είκτης όγκου Laspeyres

k
Q i i
PQ i ∑P Q 0
i
t
i

Q L
t /0 =∑ t
i k
0 0
= i =1
k

∑P Q ∑P Q
i =1 Q0 i i i i
0 0 0 0
i i =1

Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

40 ⋅150 + 80 ⋅100
Q95L / 90 = = 0,500
40 ⋅100 + 80 ⋅ 300
2. ∆είκτης όγκου Paasche

k
Qi
Pt Qi i ∑P Q t
i
t
i

Q P
t /0 =∑ t
i k
0
= i =1
k

∑P Q ∑P Q
i =1 Q
0 i i i i
t 0 t 0
i i =1

Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

60 ⋅150 + 60 ⋅100
Q95P / 90 = = 0.625
60 ⋅100 + 60 ⋅ 300

3. Σταθµικός Γεωµετρικός Μέσος

Στάθµιση Laspeyres
k
⎛ Qti ⎞
∑ P Q ln⎜⎜ i ⎟⎟
P0iQ0i i i
k P0i Q0i
⎛ Qti ⎞ ∑k P0i Q0i ∑ P0iQ0i k ⎛ Qti ⎞
0 0
⎝ Q0 ⎠
k
QtGL
/0 = ∏ ⎜⎜ i ⎟⎟ i=1 = i=1 ∏ ⎜⎜ i ⎟⎟ ή ln QtGL
/0 =
i =1
k
i =1 ⎝ Q0 ⎠ i =1 ⎝ Q0 ⎠
∑ P0iQ0i
i =1

Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

40⋅100 80⋅300
⎛ 150 ⎞ ⎛ 100 ⎞
Q GL
95 / 90 = 40⋅100+80⋅300 ⎜ ⎟ ⎜ ⎟ = 0.413
⎝ 100 ⎠ ⎝ 300 ⎠
Στάθµιση Paasche
k
⎛ Qti ⎞
∑ Pt Q ln⎜⎜ i ⎟⎟
PtiQ0i i i
k Pti Q0i
⎛Q ⎞∑ ∑ PtiQ0i ⎛Q ⎞
0
⎝ Q0 ⎠
k i k k i

/0 = ∏⎜ ∏ ⎜⎜ Q
i =1
⎜ ⎟⎟ i=1 Pt Q0i
⎟⎟ ή =
i
QtGP t
i
= i=1 t
i
ln QtGP
/0 k
i =1 ⎝ Q0 ⎠ i =1 ⎝ ⎠ 0
∑ Pt iQ0i
i =1

Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

60⋅100 60⋅300
⎛ 150 ⎞ ⎛ 100 ⎞
Q GP
95 / 90 = 60⋅100+ 60⋅300 ⎜ ⎟ ⎜ ⎟ = 0.485
⎝ 100 ⎠ ⎝ 300 ⎠

4. Σταθµικός Αρµονικός Μέσος


Στάθµιση Laspeyres

1 ∑P Q 0
i i
0

/0 = = i =1
QtHL k
⎛ Q0i ⎞ P0i Q0i k
⎛ Q0i ⎞ i i
∑ ⎜⎜ i ⎟⎟ k
i =1 ⎝ Qt ⎠
∑ ⎜⎜ i ⎟⎟ P0 Q0
i =1 ⎝ Qt ⎠
∑ P0iQ0i
i =1

Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

40 ⋅100 + 80 ⋅ 300
Q95H / 90 = = 0.375
100 300
40 ⋅100 + 80 ⋅ 300
150 100
Στάθµιση Paasche

1 ∑P Q t
i i
0

/0 = = i =1
QtHP k
⎛ Q0i ⎞ Pt i Q0i k
⎛ Q0i ⎞ i i
∑ ⎜⎜ i ⎟⎟ k
i =1 ⎝ Qt ⎠
∑ ⎜⎜ i ⎟⎟ Pt Q0
i =1 ⎝ Qt ⎠
∑ Pt iQ0i
i =1

Παράδειγµα
Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

60 ⋅100 + 60 ⋅ 300
Q95HP/ 90 = = 0.414
100 300
60 ⋅100 + 60 ⋅ 300
150 100

5. ∆είκτης Όγκου Edgeworth - Marshall

∑ Q (P )
k

t
i
0
i
+ Pt i
QtE/ 0− M = i =1

∑ Q (P )
k
i
0 0
i
+ Pt i
i =1

Παράδειγµα

Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

150 ⋅ (40 + 60 ) + 100 ⋅ (60 + 80 )


Q95E −M
/ 90 = = 0.558
100 ⋅ (40 + 60 ) + 300 ⋅ (60 + 80 )
6. ∆είκτης Όγκου Fisher

QtF/ 0 = QtL/ 0QtP/ 0

Παράδειγµα
Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

Q95F / 90 = 0,500 ⋅ 0.625 = 0.559

∆είκτης Αξίας
k

∑P Q t
i
t
i

Vt / 0 = i =1
k

∑P Q
i =1
0
i i
0

Παράδειγµα
Ετος PA QA PB QB
1990 40 100 80 300
1995 60 150 60 100

60 ⋅150 + 60 ⋅100
V95 / 90 = = 0,525
40 ⋅100 + 80 ⋅ 300
Ονοµαστικός και Πραγµατικός Μισθός

Έτος Ετήσιες ∆ΤΚ Ετήσιες


Αποδοχές (1990=100) Αποδοχές
(1990=100)

1990 8305 100,0 8305


1991 8449 119,5 7070
1992 9516 138,5 6871
1993 10411 158,4 6571
1994 11475 175,4 6542
1995 12113 191,0 6342
1996 12814 206,7 6200
1997 14675 218,0 6731
1998 21687 228,0 9491
1999 22380 234,4 9546

∆ιάγραµµα 13.1
Ονοµαστικός και Πραγµατικός Μισθός

25.000

20.000

Μισθός σε
15.000 τρέχουσες τιµές
ΕΥΡ

10.000

5.000 Μισθός σε σταθερές


τιµές 1990

0
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Σύνδεση ∆εικτών σε Ενιαία Περίοδο Βάσης

Έτος ∆ΤΚ ∆ΤΚ ∆ΤΚ ∆ΤΚ


(1990=100) (1994=100) (1990=100) (1996=100)
1990 100,0 100,0 48,4
1991 119,5 119,5 57,8
1992 138,5 138,5 67,0
1993 158,4 158,4 76,7
1994 175,4 100,0 175,4 84,9
1995 108,9 191,0 92,4
1996 117,8 206,7 100,0
1997 124,3 218,0 105,5
1998 130,3 228,5 110,6
1999 133,7 234,4 113,4

You might also like