95 διαφορά διαστήματος εμπιστοσύνης από sd. Διάστημα εμπιστοσύνης

Συχνά ο εκτιμητής πρέπει να αναλύσει την αγορά ακινήτων του τμήματος στο οποίο βρίσκεται το ακίνητο που αξιολογείται. Εάν η αγορά είναι ανεπτυγμένη, μπορεί να είναι δύσκολο να αναλυθεί ολόκληρο το σύνολο των παρουσιαζόμενων αντικειμένων, επομένως ένα δείγμα αντικειμένων χρησιμοποιείται για ανάλυση. Αυτό το δείγμα δεν αποδεικνύεται πάντα ομοιογενές· μερικές φορές είναι απαραίτητο να το καθαρίσετε από ακραία σημεία - πολύ υψηλές ή πολύ χαμηλές προσφορές της αγοράς. Για το σκοπό αυτό χρησιμοποιείται διάστημα εμπιστοσύνης. Σκοπός αυτής της μελέτης είναι η διεξαγωγή συγκριτικής ανάλυσης δύο μεθόδων για τον υπολογισμό του διαστήματος εμπιστοσύνης και η επιλογή της βέλτιστης επιλογής υπολογισμού κατά την εργασία με διαφορετικά δείγματα στο σύστημα estimatica.pro.

Το διάστημα εμπιστοσύνης είναι ένα διάστημα τιμών χαρακτηριστικών που υπολογίζεται με βάση ένα δείγμα, το οποίο με γνωστή πιθανότητα περιέχει την εκτιμώμενη παράμετρο του γενικού πληθυσμού.

Το σημείο του υπολογισμού ενός διαστήματος εμπιστοσύνης είναι να κατασκευαστεί ένα τέτοιο διάστημα με βάση τα δεδομένα δείγματος έτσι ώστε να μπορεί να δηλωθεί με δεδομένη πιθανότητα ότι η τιμή της εκτιμώμενης παραμέτρου βρίσκεται σε αυτό το διάστημα. Με άλλα λόγια, το διάστημα εμπιστοσύνης περιέχει την άγνωστη τιμή της εκτιμώμενης τιμής με μια ορισμένη πιθανότητα. Όσο μεγαλύτερο είναι το διάστημα, τόσο μεγαλύτερη είναι η ανακρίβεια.

Υπάρχουν διάφορες μέθοδοι για τον προσδιορισμό του διαστήματος εμπιστοσύνης. Σε αυτό το άρθρο θα δούμε 2 μεθόδους:

  • μέσω της διάμεσης και τυπικής απόκλισης·
  • μέσω της κρίσιμης τιμής της στατιστικής t (συντελεστής μαθητή).

Στάδια συγκριτικής ανάλυσης διαφορετικών μεθόδων υπολογισμού CI:

1. σχηματίστε ένα δείγμα δεδομένων.

2. Το επεξεργαζόμαστε χρησιμοποιώντας στατιστικές μεθόδους: υπολογίζουμε τη μέση τιμή, διάμεσο, διακύμανση κ.λπ.

3. Υπολογίστε το διάστημα εμπιστοσύνης με δύο τρόπους.

4. αναλύστε τα καθαρισμένα δείγματα και τα προκύπτοντα διαστήματα εμπιστοσύνης.

Στάδιο 1. Δειγματοληψία δεδομένων

Το δείγμα σχηματίστηκε χρησιμοποιώντας το σύστημα estimatica.pro. Το δείγμα περιελάμβανε 91 προσφορές για πώληση διαμερισμάτων 1 δωματίου στην 3η ζώνη τιμών με διάταξη τύπου «Χρουστσόφ».

Πίνακας 1. Αρχικό δείγμα

Τιμή 1 τ.μ., μονάδα

Εικ.1. Αρχικό δείγμα



Στάδιο 2. Επεξεργασία του αρχικού δείγματος

Η επεξεργασία ενός δείγματος χρησιμοποιώντας στατιστικές μεθόδους απαιτεί τον υπολογισμό των παρακάτω τιμών:

1. Αριθμητικός μέσος όρος

2. Η διάμεσος είναι ένας αριθμός που χαρακτηρίζει το δείγμα: ακριβώς τα μισά από τα στοιχεία του δείγματος είναι μεγαλύτερα από τη διάμεση τιμή, τα άλλα μισά είναι μικρότερα από τη διάμεσο

(για δείγμα με περιττό αριθμό τιμών)

3. Εύρος - η διαφορά μεταξύ των μέγιστων και ελάχιστων τιμών στο δείγμα

4. Διακύμανση - χρησιμοποιείται για την ακριβέστερη εκτίμηση της διακύμανσης των δεδομένων

5. Η τυπική απόκλιση δείγματος (εφεξής - SD) είναι ο πιο συνηθισμένος δείκτης της διασποράς των τιμών προσαρμογής γύρω από τον αριθμητικό μέσο όρο.

6. Συντελεστής διακύμανσης - αντικατοπτρίζει τον βαθμό διασποράς των τιμών προσαρμογής

7. συντελεστής ταλάντωσης - αντικατοπτρίζει τη σχετική διακύμανση των ακραίων τιμών τιμής στο δείγμα γύρω από τον μέσο όρο

Πίνακας 2. Στατιστικοί δείκτες του αρχικού δείγματος

Ο συντελεστής διακύμανσης, που χαρακτηρίζει την ομοιογένεια των δεδομένων, είναι 12,29%, αλλά ο συντελεστής ταλάντωσης είναι πολύ υψηλός. Έτσι, μπορούμε να πούμε ότι το αρχικό δείγμα δεν είναι ομοιογενές, οπότε ας προχωρήσουμε στον υπολογισμό του διαστήματος εμπιστοσύνης.

Στάδιο 3. Υπολογισμός διαστήματος εμπιστοσύνης

Μέθοδος 1. Υπολογισμός με χρήση της διάμεσης και τυπικής απόκλισης.

Το διάστημα εμπιστοσύνης προσδιορίζεται ως εξής: ελάχιστη τιμή - η τυπική απόκλιση αφαιρείται από τη διάμεση τιμή. μέγιστη τιμή - η τυπική απόκλιση προστίθεται στη διάμεση τιμή.

Έτσι, το διάστημα εμπιστοσύνης (47179 CU; 60689 CU)

Ρύζι. 2. Τιμές που εμπίπτουν στο διάστημα εμπιστοσύνης 1.



Μέθοδος 2. Κατασκευή ενός διαστήματος εμπιστοσύνης χρησιμοποιώντας την κρίσιμη τιμή της στατιστικής t (συντελεστής σπουδαστών)

S.V. Ο Gribovsky στο βιβλίο του "Mathematical Methods for Estimating Property Value" περιγράφει μια μέθοδο για τον υπολογισμό του διαστήματος εμπιστοσύνης μέσω του συντελεστή Student. Κατά τον υπολογισμό χρησιμοποιώντας αυτή τη μέθοδο, ο εκτιμητής πρέπει να ορίσει ο ίδιος το επίπεδο σημαντικότητας ∝, το οποίο καθορίζει την πιθανότητα με την οποία θα κατασκευαστεί το διάστημα εμπιστοσύνης. Συνήθως, χρησιμοποιούνται επίπεδα σημαντικότητας 0,1. 0,05 και 0,01. Αντιστοιχούν σε πιθανότητες εμπιστοσύνης 0,9. 0,95 και 0,99. Με αυτή τη μέθοδο, οι πραγματικές τιμές της μαθηματικής προσδοκίας και της διακύμανσης υποτίθεται ότι είναι πρακτικά άγνωστες (κάτι που ισχύει σχεδόν πάντα όταν επιλύονται πρακτικά προβλήματα εκτίμησης).

Τύπος διαστήματος εμπιστοσύνης:

n - μέγεθος δείγματος.

Η κρίσιμη τιμή της t-statistics (Student κατανομή) με επίπεδο σημαντικότητας ∝, ο αριθμός των βαθμών ελευθερίας n-1, που προσδιορίζεται από ειδικούς στατιστικούς πίνακες ή χρησιμοποιώντας MS Excel (→"Στατιστική"→ STUDIST).

∝ - επίπεδο σημαντικότητας, πάρτε ∝=0,01.

Ρύζι. 2. Τιμές που εμπίπτουν στο διάστημα εμπιστοσύνης 2.

Στάδιο 4. Ανάλυση διαφορετικών μεθόδων για τον υπολογισμό του διαστήματος εμπιστοσύνης

Δύο μέθοδοι υπολογισμού του διαστήματος εμπιστοσύνης - μέσω της διάμεσης τιμής και του συντελεστή Student - οδήγησαν σε διαφορετικές τιμές των διαστημάτων. Αντίστοιχα, πήραμε δύο διαφορετικά καθαρισμένα δείγματα.

Πίνακας 3. Στατιστικά στοιχεία για τρία δείγματα.

Δείκτης

Αρχικό δείγμα

1 επιλογή

Επιλογή 2

Μέση αξία

Διασπορά

Συντ. παραλλαγές

Συντ. ταλαντώσεις

Αριθμός αποσυρόμενων αντικειμένων, τεμ.

Με βάση τους υπολογισμούς που πραγματοποιήθηκαν, μπορούμε να πούμε ότι οι τιμές του διαστήματος εμπιστοσύνης που λαμβάνονται με διαφορετικές μεθόδους τέμνονται, επομένως μπορείτε να χρησιμοποιήσετε οποιαδήποτε από τις μεθόδους υπολογισμού κατά την κρίση του εκτιμητή.

Ωστόσο, πιστεύουμε ότι όταν εργάζεστε στο σύστημα estimatica.pro, συνιστάται να επιλέξετε μια μέθοδο για τον υπολογισμό του διαστήματος εμπιστοσύνης ανάλογα με τον βαθμό ανάπτυξης της αγοράς:

  • εάν η αγορά δεν είναι ανεπτυγμένη, χρησιμοποιήστε τη μέθοδο υπολογισμού χρησιμοποιώντας τη διάμεσο και την τυπική απόκλιση, καθώς ο αριθμός των αντικειμένων που αποσύρθηκαν σε αυτήν την περίπτωση είναι μικρός.
  • εάν η αγορά είναι ανεπτυγμένη, εφαρμόστε τον υπολογισμό μέσω της κρίσιμης τιμής των στατιστικών t (συντελεστής σπουδαστή), καθώς είναι δυνατό να σχηματιστεί ένα μεγάλο αρχικό δείγμα.

Για την προετοιμασία του άρθρου χρησιμοποιήθηκαν τα ακόλουθα:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Μαθηματικές μέθοδοι για την εκτίμηση της αξίας του ακινήτου. Μόσχα, 2014

2. Δεδομένα συστήματος estimatica.pro

Διαστήματα εμπιστοσύνης ( Αγγλικά Διαστήματα εμπιστοσύνης) ένας από τους τύπους εκτιμήσεων διαστήματος που χρησιμοποιούνται στις στατιστικές, οι οποίοι υπολογίζονται για ένα δεδομένο επίπεδο σημαντικότητας. Μας επιτρέπουν να κάνουμε τη δήλωση ότι η πραγματική τιμή μιας άγνωστης στατιστικής παραμέτρου του πληθυσμού είναι εντός του ληφθέντος εύρους τιμών με πιθανότητα που καθορίζεται από το επιλεγμένο επίπεδο στατιστικής σημασίας.

Κανονική κατανομή

Όταν είναι γνωστή η διακύμανση (σ 2) του πληθυσμού των δεδομένων, η βαθμολογία z μπορεί να χρησιμοποιηθεί για τον υπολογισμό των ορίων εμπιστοσύνης (τα τελικά σημεία του διαστήματος εμπιστοσύνης). Σε σύγκριση με τη χρήση της κατανομής t, η χρήση της βαθμολογίας z θα σας επιτρέψει να δημιουργήσετε όχι μόνο ένα στενότερο διάστημα εμπιστοσύνης, αλλά και πιο αξιόπιστες εκτιμήσεις της αναμενόμενης τιμής και της τυπικής απόκλισης (σ), καθώς η βαθμολογία z βασίζεται σε κανονική κατανομή.

Τύπος

Για τον προσδιορισμό των οριακών σημείων του διαστήματος εμπιστοσύνης, με την προϋπόθεση ότι είναι γνωστή η τυπική απόκλιση του πληθυσμού των δεδομένων, χρησιμοποιείται ο ακόλουθος τύπος

L = X - Z α/2 σ
√n

Παράδειγμα

Ας υποθέσουμε ότι το μέγεθος του δείγματος είναι 25 παρατηρήσεις, η αναμενόμενη τιμή του δείγματος είναι 15 και η τυπική απόκλιση πληθυσμού είναι 8. Για ένα επίπεδο σημαντικότητας α=5%, η βαθμολογία Z είναι Z α/2 =1,96. Σε αυτήν την περίπτωση, το κατώτερο και το ανώτερο όριο του διαστήματος εμπιστοσύνης θα είναι

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Έτσι, μπορούμε να πούμε ότι με πιθανότητα 95% η μαθηματική προσδοκία του πληθυσμού θα πέσει στο εύρος από 11.864 έως 18.136.

Μέθοδοι για τον περιορισμό του διαστήματος εμπιστοσύνης

Ας υποθέσουμε ότι το εύρος είναι πολύ μεγάλο για τους σκοπούς της μελέτης μας. Υπάρχουν δύο τρόποι για να μειώσετε το εύρος του διαστήματος εμπιστοσύνης.

  1. Μειώστε το επίπεδο στατιστικής σημαντικότητας α.
  2. Αυξήστε το μέγεθος του δείγματος.

Μειώνοντας το επίπεδο στατιστικής σημαντικότητας σε α=10%, λαμβάνουμε βαθμολογία Ζ ίση με Ζ α/2 =1,64. Σε αυτή την περίπτωση, τα κάτω και τα ανώτερα όρια του διαστήματος θα είναι

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Και το ίδιο το διάστημα εμπιστοσύνης μπορεί να γραφτεί στη μορφή

Σε αυτή την περίπτωση, μπορούμε να κάνουμε την υπόθεση ότι με πιθανότητα 90% η μαθηματική προσδοκία του πληθυσμού θα είναι εντός του εύρους .

Αν θέλουμε να μην μειώσουμε το επίπεδο στατιστικής σημαντικότητας α, τότε η μόνη εναλλακτική είναι να αυξήσουμε το μέγεθος του δείγματος. Αυξάνοντάς το σε 144 παρατηρήσεις, λαμβάνουμε τις ακόλουθες τιμές ορίων εμπιστοσύνης

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Το ίδιο το διάστημα εμπιστοσύνης θα έχει την ακόλουθη μορφή

Έτσι, ο περιορισμός του διαστήματος εμπιστοσύνης χωρίς μείωση του επιπέδου στατιστικής σημαντικότητας είναι δυνατός μόνο με την αύξηση του μεγέθους του δείγματος. Εάν η αύξηση του μεγέθους του δείγματος δεν είναι δυνατή, τότε ο περιορισμός του διαστήματος εμπιστοσύνης μπορεί να επιτευχθεί αποκλειστικά με τη μείωση του επιπέδου στατιστικής σημαντικότητας.

Κατασκευή διαστήματος εμπιστοσύνης για κατανομή διαφορετική από την κανονική

Εάν η τυπική απόκλιση του πληθυσμού δεν είναι γνωστή ή η κατανομή είναι διαφορετική από την κανονική, η κατανομή t χρησιμοποιείται για την κατασκευή ενός διαστήματος εμπιστοσύνης. Αυτή η τεχνική είναι πιο συντηρητική, κάτι που αντικατοπτρίζεται σε μεγαλύτερα διαστήματα εμπιστοσύνης, σε σύγκριση με την τεχνική που βασίζεται στο Z-score.

Τύπος

Για να υπολογίσετε το κατώτερο και το ανώτερο όριο του διαστήματος εμπιστοσύνης με βάση την κατανομή t, χρησιμοποιήστε τους ακόλουθους τύπους

L = X - t α σ
√n

Η κατανομή Student ή η κατανομή t εξαρτάται μόνο από μία παράμετρο - τον αριθμό των βαθμών ελευθερίας, ο οποίος είναι ίσος με τον αριθμό των επιμέρους τιμών του χαρακτηριστικού (τον αριθμό των παρατηρήσεων στο δείγμα). Η τιμή του Student's t-test για έναν δεδομένο αριθμό βαθμών ελευθερίας (n) και το επίπεδο στατιστικής σημαντικότητας α βρίσκονται στους πίνακες αναφοράς.

Παράδειγμα

Ας υποθέσουμε ότι το μέγεθος του δείγματος είναι 25 μεμονωμένες τιμές, η αναμενόμενη τιμή του δείγματος είναι 50 και η τυπική απόκλιση του δείγματος είναι 28. Είναι απαραίτητο να κατασκευαστεί ένα διάστημα εμπιστοσύνης για το επίπεδο στατιστικής σημαντικότητας α=5%.

Στην περίπτωσή μας, ο αριθμός των βαθμών ελευθερίας είναι 24 (25-1), επομένως η αντίστοιχη τιμή πίνακα του Student’s t-test για το επίπεδο στατιστικής σημαντικότητας α=5% είναι 2,064. Επομένως, το κατώτερο και το ανώτερο όριο του διαστήματος εμπιστοσύνης θα είναι

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Και το ίδιο το διάστημα μπορεί να γραφτεί με τη μορφή

Έτσι, μπορούμε να πούμε ότι με πιθανότητα 95% η μαθηματική προσδοκία του πληθυσμού θα είναι στο εύρος .

Η χρήση της κατανομής t σάς επιτρέπει να περιορίσετε το διάστημα εμπιστοσύνης είτε μειώνοντας τη στατιστική σημασία είτε αυξάνοντας το μέγεθος του δείγματος.

Μειώνοντας τη στατιστική σημασία από 95% σε 90% στις συνθήκες του παραδείγματός μας, λαμβάνουμε την αντίστοιχη τιμή πίνακα του Student’s t-test 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

Σε αυτή την περίπτωση, μπορούμε να πούμε ότι με πιθανότητα 90% η μαθηματική προσδοκία του πληθυσμού θα είναι στο εύρος .

Εάν δεν θέλουμε να μειώσουμε τη στατιστική σημασία, τότε η μόνη εναλλακτική είναι να αυξήσουμε το μέγεθος του δείγματος. Ας πούμε ότι είναι 64 μεμονωμένες παρατηρήσεις, και όχι 25 όπως στην αρχική συνθήκη του παραδείγματος. Η τιμή του πίνακα του Student's t-test για 63 βαθμούς ελευθερίας (64-1) και το επίπεδο στατιστικής σημαντικότητας α=5% είναι 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Αυτό μας επιτρέπει να πούμε ότι με πιθανότητα 95% η μαθηματική προσδοκία του πληθυσμού θα είναι στο εύρος .

Μεγάλα δείγματα

Τα μεγάλα δείγματα είναι δείγματα από έναν πληθυσμό δεδομένων στον οποίο ο αριθμός των μεμονωμένων παρατηρήσεων υπερβαίνει τις 100. Στατιστικές μελέτες έχουν δείξει ότι μεγαλύτερα δείγματα τείνουν να κατανέμονται κανονικά, ακόμη και αν η κατανομή του πληθυσμού δεν είναι κανονική. Επιπλέον, για τέτοια δείγματα, η χρήση ενός z-score και μιας t-κατανομής δίνει περίπου τα ίδια αποτελέσματα κατά την κατασκευή διαστημάτων εμπιστοσύνης. Έτσι, για μεγάλα δείγματα, είναι αποδεκτή η χρήση του z-score για την κανονική κατανομή αντί για την t-κατανομή.

Ας το συνοψίσουμε

Διαστήματα εμπιστοσύνης.

Ο υπολογισμός του διαστήματος εμπιστοσύνης βασίζεται στο μέσο σφάλμα της αντίστοιχης παραμέτρου. Διάστημα εμπιστοσύνης δείχνει μέσα σε ποια όρια με πιθανότητα (1-α) βρίσκεται η πραγματική τιμή της εκτιμώμενης παραμέτρου. Εδώ το a είναι το επίπεδο σημαντικότητας, το (1-a) ονομάζεται επίσης πιθανότητα εμπιστοσύνης.

Στο πρώτο κεφάλαιο δείξαμε ότι, για παράδειγμα, για τον αριθμητικό μέσο όρο, ο πραγματικός μέσος όρος πληθυσμού σε περίπου 95% των περιπτώσεων βρίσκεται εντός 2 τυπικών σφαλμάτων από τον μέσο όρο. Έτσι, τα όρια του διαστήματος εμπιστοσύνης 95% για τον μέσο όρο θα διαχωρίζονται από τον μέσο όρο του δείγματος κατά το διπλάσιο του μέσου σφάλματος του μέσου όρου, δηλ. πολλαπλασιάζουμε το μέσο σφάλμα του μέσου όρου με έναν συγκεκριμένο συντελεστή ανάλογα με το επίπεδο εμπιστοσύνης. Για το μέσο όρο και τη διαφορά των μέσων όρων λαμβάνεται ο συντελεστής Student (κρίσιμη τιμή του τεστ Student), για το μερίδιο και η διαφορά μεριδίων η κρίσιμη τιμή του κριτηρίου z. Το γινόμενο του συντελεστή και του μέσου σφάλματος μπορεί να ονομαστεί μέγιστο σφάλμα μιας δεδομένης παραμέτρου, δηλ. το μέγιστο που μπορούμε να αποκτήσουμε κατά την αξιολόγηση.

Διάστημα εμπιστοσύνης για αριθμητικός μέσος όρος : .

Εδώ είναι το δείγμα μέσου όρου.

Μέσο σφάλμα του αριθμητικού μέσου όρου.

s –τυπική απόκλιση δείγματος.

n

f = n-1 (Συντελεστής μαθητή).

Διάστημα εμπιστοσύνης για διαφορές αριθμητικών μέσων :

Εδώ είναι η διαφορά μεταξύ των μέσων δειγμάτων.

- μέσο σφάλμα της διαφοράς μεταξύ αριθμητικών μέσων.

s 1 , s 2 -δείγμα τυπικών αποκλίσεων.

n1, n2

Η κρίσιμη τιμή της δοκιμασίας του Μαθητή για ένα δεδομένο επίπεδο σημασίας α και ο αριθμός των βαθμών ελευθερίας f=n 1 +n 2-2 (Συντελεστής μαθητή).

Διάστημα εμπιστοσύνης για μερίδια :

.

Εδώ d είναι το κλάσμα δείγματος.

– μέσο κλασματικό σφάλμα.

n– μέγεθος δείγματος (μέγεθος ομάδας).

Διάστημα εμπιστοσύνης για διαφορά μετοχών :

Εδώ είναι η διαφορά στα μερίδια δείγματος.

– μέσο σφάλμα της διαφοράς μεταξύ αριθμητικών μέσων.

n1, n2– όγκοι δειγμάτων (αριθμός ομάδων).

Η κρίσιμη τιμή του κριτηρίου z σε δεδομένο επίπεδο σημαντικότητας a ( , , ).

Υπολογίζοντας τα διαστήματα εμπιστοσύνης για τη διαφορά μεταξύ των δεικτών, καταρχάς βλέπουμε άμεσα τις πιθανές τιμές του αποτελέσματος και όχι μόνο την σημειακή του εκτίμηση. Δεύτερον, μπορούμε να βγάλουμε ένα συμπέρασμα σχετικά με την αποδοχή ή την απόρριψη της μηδενικής υπόθεσης και, τρίτον, μπορούμε να βγάλουμε ένα συμπέρασμα σχετικά με τη δύναμη του τεστ.

Όταν ελέγχετε υποθέσεις χρησιμοποιώντας διαστήματα εμπιστοσύνης, πρέπει να τηρείτε τον ακόλουθο κανόνα:

Εάν το 100(1-a) τοις εκατό διάστημα εμπιστοσύνης της διαφοράς των μέσων δεν περιέχει μηδέν, τότε οι διαφορές είναι στατιστικά σημαντικές σε επίπεδο σημαντικότητας α. Αντίθετα, αν αυτό το διάστημα περιέχει μηδέν, τότε οι διαφορές δεν είναι στατιστικά σημαντικές.

Πράγματι, εάν αυτό το διάστημα περιέχει μηδέν, σημαίνει ότι ο δείκτης που συγκρίνεται μπορεί να είναι είτε μεγαλύτερος είτε μικρότερος σε μία από τις ομάδες σε σύγκριση με την άλλη, δηλ. οι παρατηρούμενες διαφορές οφείλονται στην τύχη.

Η ισχύς της δοκιμής μπορεί να κριθεί από τη θέση του μηδέν εντός του διαστήματος εμπιστοσύνης. Εάν το μηδέν είναι κοντά στο κατώτερο ή το ανώτερο όριο του διαστήματος, τότε είναι πιθανό ότι με μεγαλύτερο αριθμό ομάδων που συγκρίνονται, οι διαφορές θα έφταναν σε στατιστική σημασία. Εάν το μηδέν είναι κοντά στο μέσο του διαστήματος, τότε σημαίνει ότι τόσο η αύξηση όσο και η μείωση του δείκτη στην πειραματική ομάδα είναι εξίσου πιθανές και, πιθανώς, δεν υπάρχουν πραγματικά διαφορές.

Παραδείγματα:

Για να συγκρίνετε τη χειρουργική θνησιμότητα κατά τη χρήση δύο διαφορετικών τύπων αναισθησίας: 61 άτομα χειρουργήθηκαν με τον πρώτο τύπο αναισθησίας, 8 πέθαναν, με τον δεύτερο τύπο – 67 άτομα, 10 πέθαναν.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Η διαφορά στη θνησιμότητα των μεθόδων σύγκρισης θα είναι στην περιοχή (-0,018 - 0,122; -0,018 + 0,122) ή (-0,14; 0,104) με πιθανότητα 100(1-a) = 95%. Το διάστημα περιέχει μηδέν, δηλ. η υπόθεση της ίσης θνησιμότητας με δύο διαφορετικούς τύπους αναισθησίας δεν μπορεί να απορριφθεί.

Έτσι, το ποσοστό θνησιμότητας μπορεί και θα μειωθεί στο 14% και θα αυξηθεί στο 10,4% με πιθανότητα 95%, δηλ. Το μηδέν βρίσκεται περίπου στο μέσο του διαστήματος, επομένως μπορεί να υποστηριχθεί ότι, πιθανότατα, αυτές οι δύο μέθοδοι πραγματικά δεν διαφέρουν ως προς τη θνησιμότητα.

Στο παράδειγμα που συζητήθηκε προηγουμένως, ο μέσος χρόνος πίεσης κατά τη διάρκεια της δοκιμασίας tapping συγκρίθηκε σε τέσσερις ομάδες μαθητών που διέφεραν στις βαθμολογίες των εξετάσεων. Ας υπολογίσουμε τα διαστήματα εμπιστοσύνης για το μέσο χρόνο πίεσης για μαθητές που πέτυχαν τις εξετάσεις με βαθμούς 2 και 5 και το διάστημα εμπιστοσύνης για τη διαφορά μεταξύ αυτών των μέσων.

Οι συντελεστές Student's βρίσκονται χρησιμοποιώντας τους πίνακες κατανομής Student (βλ. παράρτημα): για την πρώτη ομάδα: = t(0,05;48) = 2,011; για τη δεύτερη ομάδα: = t(0,05;61) = 2.000. Έτσι, διαστήματα εμπιστοσύνης για την πρώτη ομάδα: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), για τη δεύτερη ομάδα (156,55- 2,000*1,88; 156,200*) 160,3). Έτσι, για όσους πέρασαν την εξέταση με 2, ο μέσος χρόνος πίεσης κυμαίνεται από 157,8 ms έως 166,6 ms με πιθανότητα 95%, για όσους πέτυχαν την εξέταση με 5 – από 152,8 ms έως 160,3 ms με πιθανότητα 95% .

Μπορείτε επίσης να ελέγξετε τη μηδενική υπόθεση χρησιμοποιώντας διαστήματα εμπιστοσύνης για μέσα, και όχι μόνο για τη διαφορά στα μέσα. Για παράδειγμα, όπως στην περίπτωσή μας, εάν τα διαστήματα εμπιστοσύνης για τα μέσα αλληλοεπικαλύπτονται, τότε η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Για να απορριφθεί μια υπόθεση σε επιλεγμένο επίπεδο σημαντικότητας, τα αντίστοιχα διαστήματα εμπιστοσύνης δεν πρέπει να επικαλύπτονται.

Ας βρούμε το διάστημα εμπιστοσύνης για τη διαφορά του μέσου χρόνου πίεσης στις ομάδες που πέτυχαν τις εξετάσεις με βαθμούς 2 και 5. Διαφορά μέσου όρου: 162,19 – 156,55 = 5,64. Συντελεστής μαθητή: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Οι τυπικές αποκλίσεις ομάδας θα είναι ίσες με: ; . Υπολογίζουμε το μέσο σφάλμα της διαφοράς μεταξύ των μέσων: . Διάστημα εμπιστοσύνης: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Άρα, η διαφορά στο μέσο χρόνο πίεσης στις ομάδες που πέρασαν τις εξετάσεις με 2 και 5 θα κυμαίνεται από -0,044 ms έως 11,33 ms. Αυτό το διάστημα περιλαμβάνει το μηδέν, δηλ. Ο μέσος χρόνος πίεσης για όσους πέρασαν καλά τις εξετάσεις μπορεί είτε να αυξηθεί είτε να μειωθεί σε σύγκριση με εκείνους που πέρασαν τις εξετάσεις μη ικανοποιητικά, δηλ. η μηδενική υπόθεση δεν μπορεί να απορριφθεί. Αλλά το μηδέν είναι πολύ κοντά στο κατώτερο όριο και ο χρόνος πίεσης είναι πολύ πιο πιθανό να μειωθεί για όσους πέρασαν καλά. Έτσι, μπορούμε να συμπεράνουμε ότι εξακολουθούν να υπάρχουν διαφορές στο μέσο χρόνο πίεσης μεταξύ εκείνων που πέρασαν το 2 και το 5, απλώς δεν μπορέσαμε να τις εντοπίσουμε δεδομένης της αλλαγής στο μέσο χρόνο, την κατανομή του μέσου χρόνου και τα μεγέθη του δείγματος.



Η ισχύς ενός τεστ είναι η πιθανότητα απόρριψης μιας εσφαλμένης μηδενικής υπόθεσης, δηλ. βρείτε διαφορές εκεί που υπάρχουν στην πραγματικότητα.

Η ισχύς της δοκιμής προσδιορίζεται με βάση το επίπεδο σημαντικότητας, το μέγεθος των διαφορών μεταξύ των ομάδων, την εξάπλωση των τιμών σε ομάδες και το μέγεθος των δειγμάτων.

Για τη δοκιμή t Student και την ανάλυση διακύμανσης, μπορούν να χρησιμοποιηθούν διαγράμματα ευαισθησίας.

Η ισχύς του κριτηρίου μπορεί να χρησιμοποιηθεί για τον προκαταρκτικό προσδιορισμό του απαιτούμενου αριθμού ομάδων.

Το διάστημα εμπιστοσύνης δείχνει μέσα σε ποια όρια βρίσκεται η πραγματική τιμή της εκτιμώμενης παραμέτρου με μια δεδομένη πιθανότητα.

Χρησιμοποιώντας διαστήματα εμπιστοσύνης, μπορείτε να δοκιμάσετε στατιστικές υποθέσεις και να βγάλετε συμπεράσματα σχετικά με την ευαισθησία των κριτηρίων.

ΒΙΒΛΙΟΓΡΑΦΙΑ.

Glanz S. – Κεφάλαιο 6,7.

Rebrova O.Yu. – σ.112-114, σ.171-173, σ.234-238.

Sidorenko E.V. – σελ.32-33.

Ερωτήσεις για αυτοέλεγχο μαθητών.

1. Ποια είναι η ισχύς του κριτηρίου;

2. Σε ποιες περιπτώσεις είναι απαραίτητο να αξιολογηθεί η ισχύς των κριτηρίων;

3. Μέθοδοι υπολογισμού ισχύος.

6. Πώς να ελέγξετε μια στατιστική υπόθεση χρησιμοποιώντας ένα διάστημα εμπιστοσύνης;

7. Τι μπορεί να ειπωθεί για την ισχύ του κριτηρίου κατά τον υπολογισμό του διαστήματος εμπιστοσύνης;

Καθήκοντα.

Διάστημα εμπιστοσύνης για μαθηματική προσδοκία - αυτό είναι ένα διάστημα που υπολογίζεται από δεδομένα που, με γνωστή πιθανότητα, περιέχει τη μαθηματική προσδοκία του γενικού πληθυσμού. Μια φυσική εκτίμηση για τη μαθηματική προσδοκία είναι ο αριθμητικός μέσος όρος των παρατηρούμενων τιμών της. Επομένως, καθ' όλη τη διάρκεια του μαθήματος θα χρησιμοποιούμε τους όρους «μέσος όρος» και «μέση τιμή». Στα προβλήματα υπολογισμού ενός διαστήματος εμπιστοσύνης, μια απάντηση που απαιτείται πιο συχνά είναι κάτι σαν «Το διάστημα εμπιστοσύνης του μέσου αριθμού [τιμή σε ένα συγκεκριμένο πρόβλημα] είναι από [μικρότερη τιμή] σε [μεγαλύτερη τιμή]». Χρησιμοποιώντας ένα διάστημα εμπιστοσύνης, μπορείτε να αξιολογήσετε όχι μόνο τις μέσες τιμές, αλλά και την αναλογία ενός συγκεκριμένου χαρακτηριστικού του γενικού πληθυσμού. Οι μέσες τιμές, η διασπορά, η τυπική απόκλιση και το σφάλμα, μέσω των οποίων θα καταλήξουμε σε νέους ορισμούς και τύπους, συζητούνται στο μάθημα Χαρακτηριστικά του δείγματος και του πληθυσμού .

Σημειακές και διαστημικές εκτιμήσεις του μέσου όρου

Εάν η μέση τιμή του πληθυσμού εκτιμάται με έναν αριθμό (σημείο), τότε ένας συγκεκριμένος μέσος όρος, ο οποίος υπολογίζεται από ένα δείγμα παρατηρήσεων, λαμβάνεται ως εκτίμηση της άγνωστης μέσης τιμής του πληθυσμού. Σε αυτή την περίπτωση, η τιμή του μέσου όρου του δείγματος - μια τυχαία μεταβλητή - δεν συμπίπτει με τη μέση τιμή του γενικού πληθυσμού. Επομένως, όταν υποδεικνύετε τη μέση τιμή δείγματος, πρέπει ταυτόχρονα να υποδεικνύετε το σφάλμα δειγματοληψίας. Το μέτρο του δειγματοληπτικού σφάλματος είναι το τυπικό σφάλμα, το οποίο εκφράζεται στις ίδιες μονάδες με το μέσο όρο. Επομένως, χρησιμοποιείται συχνά ο ακόλουθος συμβολισμός: .

Εάν η εκτίμηση του μέσου όρου πρέπει να συσχετιστεί με μια ορισμένη πιθανότητα, τότε η παράμετρος που ενδιαφέρει τον πληθυσμό πρέπει να αξιολογηθεί όχι με έναν αριθμό, αλλά από ένα διάστημα. Ένα διάστημα εμπιστοσύνης είναι ένα διάστημα στο οποίο, με μια ορισμένη πιθανότητα Πβρίσκεται η τιμή του εκτιμώμενου δείκτη πληθυσμού. Το διάστημα εμπιστοσύνης στο οποίο είναι πιθανό Π = 1 - α Βρίσκεται η τυχαία μεταβλητή, η οποία υπολογίζεται ως εξής:

,

α = 1 - Π, το οποίο μπορείτε να βρείτε στο παράρτημα σχεδόν οποιουδήποτε βιβλίου για τις στατιστικές.

Στην πράξη, ο μέσος όρος του πληθυσμού και η διακύμανση δεν είναι γνωστοί, επομένως η διακύμανση του πληθυσμού αντικαθίσταται από τη διακύμανση του δείγματος και ο μέσος όρος του πληθυσμού από τον μέσο όρο του δείγματος. Έτσι, το διάστημα εμπιστοσύνης στις περισσότερες περιπτώσεις υπολογίζεται ως εξής:

.

Ο τύπος διαστήματος εμπιστοσύνης μπορεί να χρησιμοποιηθεί για την εκτίμηση του μέσου όρου του πληθυσμού εάν

  • η τυπική απόκλιση του πληθυσμού είναι γνωστή.
  • ή η τυπική απόκλιση του πληθυσμού είναι άγνωστη, αλλά το μέγεθος του δείγματος είναι μεγαλύτερο από 30.

Ο μέσος όρος του δείγματος είναι μια αμερόληπτη εκτίμηση του μέσου όρου του πληθυσμού. Με τη σειρά του, η διακύμανση του δείγματος δεν είναι μια αμερόληπτη εκτίμηση της διακύμανσης του πληθυσμού. Για να αποκτήσετε μια αμερόληπτη εκτίμηση της διακύμανσης του πληθυσμού στον τύπο διακύμανσης του δείγματος, μέγεθος δείγματος nπρέπει να αντικατασταθεί από n-1.

Παράδειγμα 1.Συλλέχθηκαν πληροφορίες από 100 τυχαία επιλεγμένα καφέ σε μια συγκεκριμένη πόλη ότι ο μέσος αριθμός εργαζομένων σε αυτά είναι 10,5 με τυπική απόκλιση 4,6. Προσδιορίστε το διάστημα εμπιστοσύνης 95% για τον αριθμό των εργαζομένων σε καφετέριες.

όπου είναι η κρίσιμη τιμή της τυπικής κανονικής κατανομής για το επίπεδο σημαντικότητας α = 0,05 .

Έτσι, το διάστημα εμπιστοσύνης 95% για τον μέσο αριθμό εργαζομένων σε καφετέριες κυμάνθηκε από 9,6 έως 11,4.

Παράδειγμα 2.Για ένα τυχαίο δείγμα από έναν πληθυσμό 64 παρατηρήσεων, υπολογίστηκαν οι ακόλουθες συνολικές τιμές:

άθροισμα τιμών σε παρατηρήσεις,

άθροισμα τετραγωνικών αποκλίσεων τιμών από το μέσο όρο .

Υπολογίστε το διάστημα εμπιστοσύνης 95% για τη μαθηματική προσδοκία.

Ας υπολογίσουμε την τυπική απόκλιση:

,

Ας υπολογίσουμε τη μέση τιμή:

.

Αντικαθιστούμε τις τιμές στην έκφραση για το διάστημα εμπιστοσύνης:

όπου είναι η κρίσιμη τιμή της τυπικής κανονικής κατανομής για το επίπεδο σημαντικότητας α = 0,05 .

Παίρνουμε:

Έτσι, το διάστημα εμπιστοσύνης 95% για τη μαθηματική προσδοκία αυτού του δείγματος κυμάνθηκε από 7.484 έως 11.266.

Παράδειγμα 3.Για ένα τυχαίο δείγμα πληθυσμού 100 παρατηρήσεων, ο υπολογισμένος μέσος όρος είναι 15,2 και η τυπική απόκλιση είναι 3,2. Υπολογίστε το διάστημα εμπιστοσύνης 95% για την αναμενόμενη τιμή και, στη συνέχεια, το διάστημα εμπιστοσύνης 99%. Εάν η ισχύς του δείγματος και η διακύμανσή της παραμείνουν αμετάβλητες και ο συντελεστής εμπιστοσύνης αυξηθεί, θα περιοριστεί ή θα διευρυνθεί το διάστημα εμπιστοσύνης;

Αντικαθιστούμε αυτές τις τιμές στην έκφραση για το διάστημα εμπιστοσύνης:

όπου είναι η κρίσιμη τιμή της τυπικής κανονικής κατανομής για το επίπεδο σημαντικότητας α = 0,05 .

Παίρνουμε:

.

Έτσι, το διάστημα εμπιστοσύνης 95% για τον μέσο όρο αυτού του δείγματος κυμαινόταν από 14,57 έως 15,82.

Αντικαθιστούμε και πάλι αυτές τις τιμές στην έκφραση για το διάστημα εμπιστοσύνης:

όπου είναι η κρίσιμη τιμή της τυπικής κανονικής κατανομής για το επίπεδο σημαντικότητας α = 0,01 .

Παίρνουμε:

.

Έτσι, το διάστημα εμπιστοσύνης 99% για τον μέσο όρο αυτού του δείγματος κυμαινόταν από 14,37 έως 16,02.

Όπως βλέπουμε, καθώς αυξάνεται ο συντελεστής εμπιστοσύνης, αυξάνεται επίσης η κρίσιμη τιμή της τυπικής κανονικής κατανομής και, κατά συνέπεια, τα σημεία έναρξης και λήξης του διαστήματος βρίσκονται πιο μακριά από τον μέσο όρο, και έτσι το διάστημα εμπιστοσύνης για τη μαθηματική προσδοκία αυξάνεται .

Σημειακές και διαστημικές εκτιμήσεις ειδικού βάρους

Το μερίδιο κάποιου χαρακτηριστικού δείγματος μπορεί να ερμηνευτεί ως σημειακή εκτίμηση του μεριδίου Πτου ίδιου χαρακτηριστικού στο γενικό πληθυσμό. Εάν αυτή η τιμή πρέπει να συσχετιστεί με την πιθανότητα, τότε θα πρέπει να υπολογιστεί το διάστημα εμπιστοσύνης του ειδικού βάρους Πχαρακτηριστικό στον πληθυσμό με πιθανότητα Π = 1 - α :

.

Παράδειγμα 4.Σε κάποια πόλη υπάρχουν δύο υποψήφιοι ΕΝΑΚαι σιδιεκδικούν δήμαρχο. 200 κάτοικοι της πόλης ερωτήθηκαν τυχαία, εκ των οποίων το 46% απάντησε ότι θα ψήφιζε τον υποψήφιο ΕΝΑ, 26% - για τον υποψήφιο σικαι το 28% δεν ξέρει ποιον θα ψηφίσει. Προσδιορίστε το διάστημα εμπιστοσύνης 95% για το ποσοστό των κατοίκων της πόλης που υποστηρίζουν τον υποψήφιο ΕΝΑ.

Οποιοδήποτε δείγμα δίνει μόνο μια κατά προσέγγιση ιδέα του γενικού πληθυσμού και όλα τα στατιστικά χαρακτηριστικά του δείγματος (μέσος όρος, τρόπος, διακύμανση...) είναι κάποια προσέγγιση ή ας πούμε μια εκτίμηση γενικών παραμέτρων, οι οποίες στις περισσότερες περιπτώσεις δεν είναι δυνατό να υπολογιστούν λόγω στο απρόσιτο του γενικού πληθυσμού (Εικόνα 20) .

Εικόνα 20. Σφάλμα δειγματοληψίας

Αλλά μπορείτε να καθορίσετε το διάστημα στο οποίο, με έναν ορισμένο βαθμό πιθανότητας, βρίσκεται η πραγματική (γενική) τιμή του στατιστικού χαρακτηριστικού. Αυτό το διάστημα ονομάζεται ρε διάστημα εμπιστοσύνης (CI).

Άρα η γενική μέση τιμή με πιθανότητα 95% βρίσκεται μέσα

από έως, (20)

Οπου t – Πίνακας τιμής της δοκιμής Student για α =0,05 και φά= n-1

Σε αυτήν την περίπτωση, μπορεί επίσης να βρεθεί CI 99%. t επιλεγμένο για α =0,01.

Ποια είναι η πρακτική σημασία ενός διαστήματος εμπιστοσύνης;

    Ένα μεγάλο διάστημα εμπιστοσύνης δείχνει ότι ο μέσος όρος του δείγματος δεν αντικατοπτρίζει με ακρίβεια τον μέσο όρο του πληθυσμού. Αυτό συνήθως οφείλεται σε ανεπαρκές μέγεθος δείγματος ή στην ετερογένειά του, δηλ. μεγάλη διασπορά. Και τα δύο δίνουν μεγαλύτερο σφάλμα του μέσου όρου και, κατά συνέπεια, ευρύτερο CI. Και αυτή είναι η βάση για την επιστροφή στο στάδιο του ερευνητικού σχεδιασμού.

    Τα άνω και κάτω όρια του CI παρέχουν μια εκτίμηση για το εάν τα αποτελέσματα θα είναι κλινικά σημαντικά

Ας σταθούμε λεπτομερώς στο ζήτημα της στατιστικής και κλινικής σημασίας των αποτελεσμάτων της μελέτης των ιδιοτήτων της ομάδας. Ας θυμηθούμε ότι το καθήκον της στατιστικής είναι να ανιχνεύσει τουλάχιστον κάποιες διαφορές στους γενικούς πληθυσμούς με βάση τα δεδομένα του δείγματος. Η πρόκληση για τους κλινικούς γιατρούς είναι να ανιχνεύσουν διαφορές (όχι οποιαδήποτε) που θα βοηθήσουν στη διάγνωση ή τη θεραπεία. Και τα στατιστικά συμπεράσματα δεν αποτελούν πάντα τη βάση για κλινικά συμπεράσματα. Έτσι, μια στατιστικά σημαντική μείωση της αιμοσφαιρίνης κατά 3 g/l δεν αποτελεί λόγο ανησυχίας. Και, αντίστροφα, αν κάποιο πρόβλημα στο ανθρώπινο σώμα δεν είναι διαδεδομένο σε επίπεδο ολόκληρου του πληθυσμού, αυτό δεν είναι λόγος να μην ασχοληθεί κανείς με αυτό το πρόβλημα.

Ας δούμε αυτή την κατάσταση παράδειγμα.

Οι ερευνητές αναρωτήθηκαν αν τα αγόρια που έχουν υποφέρει από κάποιο είδος μολυσματικής νόσου υστερούν σε σχέση με τους συνομηλίκους τους στην ανάπτυξη. Για το σκοπό αυτό πραγματοποιήθηκε δειγματοληπτική μελέτη στην οποία συμμετείχαν 10 αγόρια που είχαν υποστεί αυτή την ασθένεια. Τα αποτελέσματα παρουσιάζονται στον Πίνακα 23.

Πίνακας 23. Αποτελέσματα στατιστικής επεξεργασίας

κατώτερο όριο

ανώτατο όριο

Πρότυπα (cm)

μέση τιμή

Από αυτούς τους υπολογισμούς προκύπτει ότι το μέσο ύψος του δείγματος των 10χρονων αγοριών που έχουν υποφέρει από κάποια λοιμώδη νόσο είναι κοντά στο φυσιολογικό (132,5 cm). Ωστόσο, το κατώτερο όριο του διαστήματος εμπιστοσύνης (126,6 cm) δείχνει ότι υπάρχει 95% πιθανότητα το πραγματικό μέσο ύψος αυτών των παιδιών να αντιστοιχεί στην έννοια του «μικρού ύψους», δηλ. αυτά τα παιδιά έχουν καχυποψία.

Σε αυτό το παράδειγμα, τα αποτελέσματα των υπολογισμών του διαστήματος εμπιστοσύνης είναι κλινικά σημαντικά.

ΚΑΤΗΓΟΡΙΕΣ

Δημοφιλή ΑΡΘΡΑ

2023 "kingad.ru" - υπερηχογραφική εξέταση ανθρώπινων οργάνων