Εφόσον η νέα μεταβλητή κατανέμεται κανονικά, τα κάτω και άνω όρια του διαστήματος εμπιστοσύνης 95% για τη μεταβλητή φ θα είναι φ-1,96 και φ+1,96 αριστερά">

Αντί για 1,96 για μικρά δείγματα, συνιστάται η αντικατάσταση της τιμής t με N – 1 βαθμούς ελευθερίας. Αυτή η μέθοδος δεν παράγει αρνητικές τιμές και επιτρέπει πιο ακριβείς εκτιμήσεις των διαστημάτων εμπιστοσύνης για τις συχνότητες από τη μέθοδο Wald. Επιπλέον, περιγράφεται σε πολλά εγχώρια βιβλία αναφοράς για τις ιατρικές στατιστικές, κάτι που ωστόσο δεν έχει οδηγήσει στην ευρεία χρήση του στην ιατρική έρευνα. Ο υπολογισμός των διαστημάτων εμπιστοσύνης με χρήση γωνιακού μετασχηματισμού δεν συνιστάται για συχνότητες που πλησιάζουν το 0 ή το 1.

Εδώ συνήθως τελειώνει η περιγραφή των μεθόδων εκτίμησης των διαστημάτων εμπιστοσύνης στα περισσότερα βιβλία για τις βασικές στατιστικές για ιατρικούς ερευνητές και αυτό το πρόβλημα είναι χαρακτηριστικό όχι μόνο για την εγχώρια αλλά και για την ξένη βιβλιογραφία. Και οι δύο μέθοδοι βασίζονται στο θεώρημα του κεντρικού ορίου, το οποίο συνεπάγεται μεγάλο δείγμα.

Λαμβάνοντας υπόψη τις ελλείψεις στην εκτίμηση των διαστημάτων εμπιστοσύνης χρησιμοποιώντας τις παραπάνω μεθόδους, οι Clopper και Pearson πρότειναν το 1934 μια μέθοδο για τον υπολογισμό του λεγόμενου ακριβούς διαστήματος εμπιστοσύνης, δεδομένης της διωνυμικής κατανομής του χαρακτηριστικού που μελετάται. Αυτή η μέθοδος είναι διαθέσιμη σε πολλές ηλεκτρονικές αριθμομηχανές, αλλά τα διαστήματα εμπιστοσύνης που λαμβάνονται με αυτόν τον τρόπο είναι στις περισσότερες περιπτώσεις πολύ μεγάλα. Ταυτόχρονα, η μέθοδος αυτή συνιστάται για χρήση σε περιπτώσεις που απαιτείται συντηρητική αξιολόγηση. Ο βαθμός συντηρητικότητας της μεθόδου αυξάνεται όσο μειώνεται το μέγεθος του δείγματος, ειδικά όταν ο Ν< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Σύμφωνα με πολλούς στατιστικολόγους, η βέλτιστη αξιολόγηση των διαστημάτων εμπιστοσύνης για τις συχνότητες πραγματοποιείται με τη μέθοδο Wilson, που προτάθηκε το 1927, αλλά πρακτικά δεν χρησιμοποιείται στην εγχώρια βιοϊατρική έρευνα. Αυτή η μέθοδος όχι μόνο επιτρέπει την εκτίμηση των διαστημάτων εμπιστοσύνης τόσο για πολύ μικρές όσο και για πολύ μεγάλες συχνότητες, αλλά είναι επίσης εφαρμόσιμη για μικρό αριθμό παρατηρήσεων. Γενικά, το διάστημα εμπιστοσύνης σύμφωνα με τον τύπο του Wilson έχει τη μορφή

Ποια είναι η πιθανότητα του διαστήματος εμπιστοσύνης. Διάστημα εμπιστοσύνης

Η νοημοσύνη δεν συνίσταται μόνο στη γνώση, αλλά και στην ικανότητα εφαρμογής της γνώσης στην πράξη. (Αριστοτέλης)

Διαστήματα εμπιστοσύνης

Γενική επισκόπηση

Λαμβάνοντας ένα δείγμα από τον πληθυσμό, λαμβάνουμε μια σημειακή εκτίμηση της παραμέτρου που μας ενδιαφέρει και υπολογίζουμε το τυπικό σφάλμα για να υποδείξουμε την ακρίβεια της εκτίμησης.

Ωστόσο, για τις περισσότερες περιπτώσεις το τυπικό σφάλμα δεν είναι αποδεκτό. Είναι πολύ πιο χρήσιμο να συνδυαστεί αυτό το μέτρο ακρίβειας με μια εκτίμηση διαστήματος για την παράμετρο πληθυσμού.

Αυτό μπορεί να γίνει χρησιμοποιώντας τη γνώση της θεωρητικής κατανομής πιθανοτήτων του στατιστικού δείγματος (παράμετρος) προκειμένου να υπολογιστεί ένα διάστημα εμπιστοσύνης (CI - Διάστημα εμπιστοσύνης, CI - Διάστημα εμπιστοσύνης) για την παράμετρο.

Γενικά, ένα διάστημα εμπιστοσύνης επεκτείνει τις εκτιμήσεις και στις δύο κατευθύνσεις κατά ένα ορισμένο πολλαπλάσιο του τυπικού σφάλματος (μιας δεδομένης παραμέτρου). Οι δύο τιμές (όρια εμπιστοσύνης) που ορίζουν το διάστημα συνήθως χωρίζονται με κόμμα και περικλείονται σε παρενθέσεις.

Διάστημα εμπιστοσύνης για το μέσο όρο

Χρήση Κανονικής Κατανομής

Ο μέσος όρος του δείγματος κατανέμεται κανονικά εάν το μέγεθος του δείγματος είναι μεγάλο, επομένως μπορείτε να εφαρμόσετε τη γνώση της κανονικής κατανομής κατά την εξέταση του μέσου όρου του δείγματος.

Συγκεκριμένα, το 95% της κατανομής των μέσων δειγμάτων βρίσκεται εντός 1,96 τυπικών αποκλίσεων (SD) του μέσου όρου του πληθυσμού.

Όταν έχουμε μόνο ένα δείγμα, το ονομάζουμε τυπικό σφάλμα του μέσου όρου (SEM) και υπολογίζουμε το διάστημα εμπιστοσύνης 95% για τον μέσο όρο ως εξής:

Εάν επαναλάβουμε αυτό το πείραμα πολλές φορές, το διάστημα θα περιέχει τον πραγματικό μέσο πληθυσμό στο 95% του χρόνου.

Συνήθως αυτό είναι ένα διάστημα εμπιστοσύνης, όπως το διάστημα των τιμών εντός του οποίου ο πραγματικός μέσος όρος πληθυσμού (γενικός μέσος όρος) βρίσκεται με πιθανότητα εμπιστοσύνης 95%.

Αν και δεν είναι εντελώς αυστηρό (ο μέσος όρος του πληθυσμού είναι μια σταθερή τιμή και επομένως δεν μπορεί να συνδεθεί με μια πιθανότητα) να ερμηνεύσουμε ένα διάστημα εμπιστοσύνης με αυτόν τον τρόπο, είναι εννοιολογικά ευκολότερο να το κατανοήσουμε.

Χρήση t-διανομή

Μπορείτε να χρησιμοποιήσετε την κανονική κατανομή εάν γνωρίζετε την τιμή της διακύμανσης στον πληθυσμό. Επίσης, όταν το μέγεθος του δείγματος είναι μικρό, ο μέσος όρος του δείγματος ακολουθεί μια κανονική κατανομή εάν τα υποκείμενα δεδομένα πληθυσμού κατανέμονται κανονικά.

Εάν τα δεδομένα στα οποία βασίζεται ο πληθυσμός δεν είναι κανονικά κατανεμημένα και/ή η γενική διακύμανση (διακύμανση στον πληθυσμό) είναι άγνωστη, ο μέσος όρος του δείγματος υπακούει Κατανομή t του μαθητή.

Υπολογίζουμε το διάστημα εμπιστοσύνης 95% για το μέσο όρο του γενικού πληθυσμού ως εξής:

Πού είναι η ποσοστιαία μονάδα (εκατοστη εκατοστιαία μονάδα) t-Κατανομή t του Student με (n-1) βαθμούς ελευθερίας, η οποία δίνει πιθανότητα διπλής όψης 0,05.

Γενικά, παρέχει ευρύτερο εύρος από τη χρήση της κανονικής κατανομής επειδή λαμβάνει υπόψη την πρόσθετη αβεβαιότητα που εισάγεται με την εκτίμηση της τυπικής απόκλισης του πληθυσμού ή/και λόγω του μικρού μεγέθους του δείγματος.

Όταν το μέγεθος του δείγματος είναι μεγάλο (της τάξης του 100 ή περισσότερο), η διαφορά μεταξύ των δύο κατανομών ( τ-Μαθητήςκαι κανονικό) είναι ασήμαντο. Ωστόσο, χρησιμοποιούν πάντα t-κατανομή κατά τον υπολογισμό των διαστημάτων εμπιστοσύνης, ακόμη και αν το μέγεθος του δείγματος είναι μεγάλο.

Συνήθως αναφέρεται το 95% CI. Μπορούν να υπολογιστούν και άλλα διαστήματα εμπιστοσύνης, όπως το 99% CI για τη μέση τιμή.

Αντί για το γινόμενο του τυπικού σφάλματος και της τιμής του πίνακα t-κατανομή, η οποία αντιστοιχεί σε πιθανότητα διπλής όψης 0,05, πολλαπλασιάστε την (τυπικό σφάλμα) με την τιμή που αντιστοιχεί σε πιθανότητα διπλής όψης 0,01. Αυτό είναι ένα ευρύτερο διάστημα εμπιστοσύνης από το διάστημα εμπιστοσύνης 95%, επειδή αντανακλά αυξημένη εμπιστοσύνη ότι το διάστημα περιλαμβάνει πραγματικά τον μέσο όρο του πληθυσμού.

Διάστημα εμπιστοσύνης για την αναλογία

Η δειγματοληπτική κατανομή των αναλογιών έχει διωνυμική κατανομή. Ωστόσο, εάν το μέγεθος του δείγματος nείναι αρκετά μεγάλο, τότε η δειγματοληπτική κατανομή της αναλογίας είναι περίπου κανονική με τη μέση τιμή .

Αξιολογούμε με επιλεκτική στάση p=r/n(Οπου r- ο αριθμός των ατόμων στο δείγμα με τα χαρακτηριστικά γνωρίσματα που μας ενδιαφέρουν) και το τυπικό σφάλμα εκτιμάται:

Το διάστημα εμπιστοσύνης 95% για την αναλογία εκτιμάται:

Εάν το μέγεθος του δείγματος είναι μικρό (συνήθως όταν n.p.ή n(1-p)μείον 5 ), τότε είναι απαραίτητο να χρησιμοποιηθεί η διωνυμική κατανομή προκειμένου να υπολογιστούν ακριβή διαστήματα εμπιστοσύνης.

Σημειώστε ότι εάν σελεκφράζεται ως ποσοστό, λοιπόν (1-p)αντικαταστάθηκε από (100-p).

Ερμηνεία των διαστημάτων εμπιστοσύνης

Κατά την ερμηνεία ενός διαστήματος εμπιστοσύνης, μας ενδιαφέρουν οι ακόλουθες ερωτήσεις:

Πόσο μεγάλο είναι το διάστημα εμπιστοσύνης;

Ένα μεγάλο διάστημα εμπιστοσύνης δείχνει ότι η εκτίμηση είναι ανακριβής. narrow υποδηλώνει ακριβή εκτίμηση.

Το πλάτος του διαστήματος εμπιστοσύνης εξαρτάται από το μέγεθος του τυπικού σφάλματος, το οποίο με τη σειρά του εξαρτάται από το μέγεθος του δείγματος και, όταν εξετάζουμε μια αριθμητική μεταβλητή, η μεταβλητότητα των δεδομένων παράγει μεγαλύτερα διαστήματα εμπιστοσύνης από τις μελέτες ενός μεγάλου συνόλου δεδομένων λίγων μεταβλητών .

Το CI περιλαμβάνει αξίες ιδιαίτερου ενδιαφέροντος;

Μπορείτε να ελέγξετε εάν η πιθανή τιμή για μια παράμετρο πληθυσμού εμπίπτει στο διάστημα εμπιστοσύνης. Εάν ναι, τα αποτελέσματα είναι συνεπή με αυτήν την πιθανή τιμή. Εάν όχι, τότε είναι απίθανο (για ένα διάστημα εμπιστοσύνης 95%, η πιθανότητα είναι σχεδόν 5%) η παράμετρος να έχει αυτήν την τιμή.

Το «Katren-Style» συνεχίζει να δημοσιεύει τη σειρά του Konstantin Kravchik για τις ιατρικές στατιστικές. Σε δύο προηγούμενα άρθρα, ο συγγραφέας ασχολήθηκε με την εξήγηση εννοιών όπως και.

Konstantin Kravchik

Μαθηματικός-αναλυτής. Ειδικός στη στατιστική έρευνα στην ιατρική και τις ανθρωπιστικές επιστήμες

Πόλη: Μόσχα

Πολύ συχνά σε άρθρα σχετικά με κλινικές μελέτες μπορείτε να βρείτε μια μυστηριώδη φράση: «διάστημα εμπιστοσύνης» (95 % CI ή 95 % CI - διάστημα εμπιστοσύνης). Για παράδειγμα, ένα άρθρο μπορεί να γράφει: «Για να αξιολογηθεί η σημασία των διαφορών, χρησιμοποιήθηκε το Student’s t-test για τον υπολογισμό του διαστήματος εμπιστοσύνης 95 %.

Ποια είναι η τιμή του «95 % διαστήματος εμπιστοσύνης» και γιατί να το υπολογίσετε;

Τι είναι το διάστημα εμπιστοσύνης; - Αυτό είναι το εύρος εντός του οποίου ο αληθινός πληθυσμός σημαίνει ψέμα. Υπάρχουν «αναληθείς» μέσοι όροι; Κατά μία έννοια, ναι, το κάνουν. Στο εξηγήσαμε ότι είναι αδύνατο να μετρηθεί μια παράμετρος ενδιαφέροντος σε ολόκληρο τον πληθυσμό, επομένως οι ερευνητές αρκούνται σε ένα περιορισμένο δείγμα. Σε αυτό το δείγμα (για παράδειγμα, κατά βάρος σώματος) υπάρχει μία μέση τιμή (ένα ορισμένο βάρος), με βάση την οποία κρίνουμε τη μέση τιμή σε ολόκληρο τον πληθυσμό. Ωστόσο, είναι απίθανο το μέσο βάρος σε ένα δείγμα (ειδικά ένα μικρό) να συμπίπτει με το μέσο βάρος του γενικού πληθυσμού. Επομένως, είναι πιο σωστό να υπολογιστεί και να χρησιμοποιηθεί το εύρος των μέσων τιμών του πληθυσμού.

Για παράδειγμα, φανταστείτε ότι το διάστημα εμπιστοσύνης 95% (95% CI) για την αιμοσφαιρίνη είναι 110 έως 122 g/L. Αυτό σημαίνει ότι υπάρχει 95 % πιθανότητα η πραγματική μέση τιμή αιμοσφαιρίνης στον πληθυσμό να είναι μεταξύ 110 και 122 g/L. Με άλλα λόγια, δεν γνωρίζουμε τη μέση τιμή της αιμοσφαιρίνης στον πληθυσμό, αλλά μπορούμε, με 95 % πιθανότητα, να υποδείξουμε μια σειρά τιμών για αυτό το χαρακτηριστικό.

Τα διαστήματα εμπιστοσύνης είναι ιδιαίτερα σημαντικά για διαφορές στους μέσους όρους μεταξύ ομάδων ή μεγέθη εφέ όπως ονομάζονται.

Ας υποθέσουμε ότι συγκρίναμε την αποτελεσματικότητα δύο σκευασμάτων σιδήρου: ενός που κυκλοφορεί εδώ και πολύ καιρό στην αγορά και ενός που μόλις έχει καταγραφεί. Μετά την πορεία της θεραπείας, αξιολογήσαμε τη συγκέντρωση αιμοσφαιρίνης στις υπό μελέτη ομάδες ασθενών και το στατιστικό πρόγραμμα υπολόγισε ότι η διαφορά μεταξύ των μέσων τιμών των δύο ομάδων ήταν, με πιθανότητα 95 %, στο εύρος από 1,72 έως 14,36 g/l (Πίνακας 1).

Τραπέζι 1. Δοκιμή για ανεξάρτητα δείγματα
(Οι ομάδες συγκρίνονται με βάση το επίπεδο αιμοσφαιρίνης)

Αυτό θα πρέπει να ερμηνεύεται ως εξής: σε ορισμένους ασθενείς του γενικού πληθυσμού που λαμβάνουν ένα νέο φάρμακο, η αιμοσφαιρίνη θα είναι υψηλότερη κατά μέσο όρο κατά 1,72–14,36 g/l σε σχέση με αυτούς που έλαβαν ήδη γνωστό φάρμακο.

Με άλλα λόγια, στον γενικό πληθυσμό, η διαφορά στις μέσες τιμές αιμοσφαιρίνης μεταξύ των ομάδων είναι εντός αυτών των ορίων με πιθανότητα 95%. Εναπόκειται στον ερευνητή να κρίνει αν αυτό είναι πολύ ή λίγο. Το νόημα όλων αυτών είναι ότι δεν εργαζόμαστε με μια μέση τιμή, αλλά με ένα εύρος τιμών, επομένως, εκτιμούμε πιο αξιόπιστα τη διαφορά σε μια παράμετρο μεταξύ των ομάδων.

Στα στατιστικά πακέτα, κατά την κρίση του ερευνητή, μπορείτε να περιορίσετε ή να επεκτείνετε ανεξάρτητα τα όρια του διαστήματος εμπιστοσύνης. Μειώνοντας τις πιθανότητες του διαστήματος εμπιστοσύνης, περιορίζουμε το εύρος των μέσων. Για παράδειγμα, στο 90 % CI το εύρος των μέσων (ή η διαφορά στο μέσο όρο) θα είναι μικρότερο από το 95 %.

Αντίθετα, η αύξηση της πιθανότητας στο 99 % επεκτείνει το εύρος των τιμών. Κατά τη σύγκριση ομάδων, το κατώτερο όριο του CI μπορεί να υπερβεί το μηδέν. Για παράδειγμα, αν επεκτείναμε τα όρια του διαστήματος εμπιστοσύνης στο 99 %, τότε τα όρια του διαστήματος κυμαίνονταν από –1 έως 16 g/l. Αυτό σημαίνει ότι στον γενικό πληθυσμό υπάρχουν ομάδες, η διαφορά των μέσων μεταξύ των οποίων για το χαρακτηριστικό που μελετάται είναι ίση με 0 (M = 0).

Χρησιμοποιώντας ένα διάστημα εμπιστοσύνης, μπορείτε να δοκιμάσετε στατιστικές υποθέσεις. Εάν το διάστημα εμπιστοσύνης διασχίζει τη μηδενική τιμή, τότε η μηδενική υπόθεση, η οποία προϋποθέτει ότι οι ομάδες δεν διαφέρουν στην παράμετρο που μελετάται, είναι αληθής. Το παράδειγμα περιγράφεται παραπάνω όπου επεκτείναμε τα όρια στο 99 %. Κάπου στο γενικό πληθυσμό βρήκαμε ομάδες που δεν διέφεραν σε τίποτα.

95% διάστημα εμπιστοσύνης της διαφοράς στην αιμοσφαιρίνη, (g/l)


Το σχήμα δείχνει το διάστημα εμπιστοσύνης 95% για τη διαφορά στις μέσες τιμές αιμοσφαιρίνης μεταξύ των δύο ομάδων. Η γραμμή διέρχεται από το σημείο μηδέν, επομένως υπάρχει διαφορά μεταξύ των μέσων ίση με μηδέν, η οποία επιβεβαιώνει τη μηδενική υπόθεση ότι οι ομάδες δεν διαφέρουν. Το εύρος διαφοράς μεταξύ των ομάδων είναι από –2 έως 5 g/L Αυτό σημαίνει ότι η αιμοσφαιρίνη μπορεί είτε να μειωθεί κατά 2 g/L είτε να αυξηθεί κατά 5 g/L.

Το διάστημα εμπιστοσύνης είναι ένας πολύ σημαντικός δείκτης. Χάρη σε αυτό, μπορείτε να δείτε αν οι διαφορές στις ομάδες οφείλονταν όντως στη διαφορά μέσων ή σε μεγάλο δείγμα, αφού με ένα μεγάλο δείγμα οι πιθανότητες να βρεθούν διαφορές είναι μεγαλύτερες από ό,τι με ένα μικρό.

Στην πράξη μπορεί να μοιάζει με αυτό. Πήραμε δείγμα 1000 ατόμων, μετρήσαμε τα επίπεδα αιμοσφαιρίνης και διαπιστώσαμε ότι το διάστημα εμπιστοσύνης για τη διαφορά των μέσων κυμαίνεται από 1,2 έως 1,5 g/l. Το επίπεδο στατιστικής σημασίας σε αυτή την περίπτωση σελ

Βλέπουμε ότι η συγκέντρωση της αιμοσφαιρίνης αυξήθηκε, αλλά σχεδόν ανεπαίσθητα, επομένως, εμφανίστηκε στατιστική σημασία ακριβώς λόγω του μεγέθους του δείγματος.

Τα διαστήματα εμπιστοσύνης μπορούν να υπολογιστούν όχι μόνο για μέσα, αλλά και για αναλογίες (και αναλογίες κινδύνου). Για παράδειγμα, μας ενδιαφέρει το διάστημα εμπιστοσύνης των αναλογιών των ασθενών που πέτυχαν ύφεση ενώ έπαιρναν ένα αναπτυγμένο φάρμακο. Ας υποθέσουμε ότι το 95 % CI για τις αναλογίες, δηλαδή για την αναλογία τέτοιων ασθενών, βρίσκεται στην περιοχή 0,60-0,80. Έτσι, μπορούμε να πούμε ότι το φάρμακό μας έχει θεραπευτικό αποτέλεσμα στο 60 έως 80 % των περιπτώσεων.

Οποιοδήποτε δείγμα δίνει μόνο μια κατά προσέγγιση ιδέα του γενικού πληθυσμού και όλα τα στατιστικά χαρακτηριστικά του δείγματος (μέσος όρος, τρόπος, διασπορά...) είναι κάποια προσέγγιση ή ας πούμε μια εκτίμηση γενικών παραμέτρων, οι οποίες στις περισσότερες περιπτώσεις δεν είναι δυνατό να υπολογιστούν λόγω στο απρόσιτο του γενικού πληθυσμού (Εικόνα 20) .

Εικόνα 20. Σφάλμα δειγματοληψίας

Αλλά μπορείτε να καθορίσετε το διάστημα στο οποίο, με έναν ορισμένο βαθμό πιθανότητας, βρίσκεται η πραγματική (γενική) τιμή του στατιστικού χαρακτηριστικού. Αυτό το διάστημα ονομάζεται ρε διάστημα εμπιστοσύνης (CI).

Άρα η γενική μέση τιμή με πιθανότητα 95% βρίσκεται μέσα

από έως, (20)

Οπου t – Πίνακας τιμής της δοκιμής Student για α =0,05 και φά= n-1

Σε αυτήν την περίπτωση, μπορεί επίσης να βρεθεί CI 99%. t επιλεγμένο για α =0,01.

Ποια είναι η πρακτική σημασία ενός διαστήματος εμπιστοσύνης;

    Ένα μεγάλο διάστημα εμπιστοσύνης δείχνει ότι ο μέσος όρος του δείγματος δεν αντικατοπτρίζει με ακρίβεια τον μέσο όρο του πληθυσμού. Αυτό συνήθως οφείλεται σε ανεπαρκές μέγεθος δείγματος ή στην ετερογένειά του, δηλ. μεγάλη διασπορά. Και τα δύο δίνουν μεγαλύτερο σφάλμα του μέσου όρου και, κατά συνέπεια, ευρύτερο CI. Και αυτή είναι η βάση για την επιστροφή στο στάδιο του ερευνητικού σχεδιασμού.

    Τα άνω και κάτω όρια του CI παρέχουν μια εκτίμηση για το εάν τα αποτελέσματα θα είναι κλινικά σημαντικά

Ας σταθούμε λεπτομερώς στο ζήτημα της στατιστικής και κλινικής σημασίας των αποτελεσμάτων της μελέτης των ιδιοτήτων της ομάδας. Ας θυμηθούμε ότι το καθήκον της στατιστικής είναι να ανιχνεύσει τουλάχιστον κάποιες διαφορές στους γενικούς πληθυσμούς με βάση τα δεδομένα του δείγματος. Η πρόκληση για τους κλινικούς γιατρούς είναι να ανιχνεύσουν διαφορές (όχι οποιαδήποτε) που θα βοηθήσουν στη διάγνωση ή τη θεραπεία. Και τα στατιστικά συμπεράσματα δεν αποτελούν πάντα τη βάση για κλινικά συμπεράσματα. Έτσι, μια στατιστικά σημαντική μείωση της αιμοσφαιρίνης κατά 3 g/l δεν αποτελεί λόγο ανησυχίας. Και, αντίστροφα, αν κάποιο πρόβλημα στο ανθρώπινο σώμα δεν είναι διαδεδομένο σε επίπεδο ολόκληρου του πληθυσμού, αυτό δεν είναι λόγος να μην ασχοληθεί κανείς με αυτό το πρόβλημα.

Ας δούμε αυτή την κατάσταση παράδειγμα.

Οι ερευνητές αναρωτήθηκαν αν τα αγόρια που έχουν υποφέρει από κάποιο είδος μολυσματικής νόσου υστερούν σε σχέση με τους συνομηλίκους τους στην ανάπτυξη. Για το σκοπό αυτό διεξήχθη δειγματοληπτική μελέτη στην οποία συμμετείχαν 10 αγόρια που έπασχαν από αυτή την ασθένεια. Τα αποτελέσματα παρουσιάζονται στον Πίνακα 23.

Πίνακας 23. Αποτελέσματα στατιστικής επεξεργασίας

κατώτερο όριο

ανώτατο όριο

Πρότυπα (cm)

μέσος

Από αυτούς τους υπολογισμούς προκύπτει ότι το μέσο ύψος του δείγματος των 10χρονων αγοριών που έχουν υποφέρει από κάποια λοιμώδη νόσο είναι κοντά στο φυσιολογικό (132,5 cm). Ωστόσο, το κατώτερο όριο του διαστήματος εμπιστοσύνης (126,6 cm) δείχνει ότι υπάρχει 95% πιθανότητα το πραγματικό μέσο ύψος αυτών των παιδιών να αντιστοιχεί στην έννοια του «μικρού ύψους», δηλ. αυτά τα παιδιά έχουν καχυποψία.

Σε αυτό το παράδειγμα, τα αποτελέσματα των υπολογισμών του διαστήματος εμπιστοσύνης είναι κλινικά σημαντικά.

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΣΥΧΝΟΤΗΤΕΣ ΚΑΙ ΚΛΑΣΜΑΤΑ

© 2008

Εθνικό Ινστιτούτο Δημόσιας Υγείας, Όσλο, Νορβηγία

Το άρθρο περιγράφει και εξετάζει τον υπολογισμό των διαστημάτων εμπιστοσύνης για τις συχνότητες και τις αναλογίες χρησιμοποιώντας τις μεθόδους Wald, Wilson, Clopper - Pearson, χρησιμοποιώντας τον γωνιακό μετασχηματισμό και τη μέθοδο Wald με διόρθωση Agresti - Coull. Το παρουσιαζόμενο υλικό παρέχει γενικές πληροφορίες σχετικά με μεθόδους υπολογισμού διαστημάτων εμπιστοσύνης για συχνότητες και αναλογίες και προορίζεται να προκαλέσει το ενδιαφέρον των αναγνωστών περιοδικών όχι μόνο στη χρήση διαστημάτων εμπιστοσύνης κατά την παρουσίαση των αποτελεσμάτων της δικής τους έρευνας, αλλά και στην ανάγνωση εξειδικευμένης βιβλιογραφίας πριν από την έναρξη της εργασίας σε μελλοντικές δημοσιεύσεις.

Λέξεις-κλειδιά: διάστημα εμπιστοσύνης, συχνότητα, αναλογία

Μία από τις προηγούμενες δημοσιεύσεις ανέφερε εν συντομία την περιγραφή των ποιοτικών δεδομένων και ανέφερε ότι η εκτίμηση των διαστημάτων τους είναι προτιμότερη από την εκτίμηση σημείου για την περιγραφή της συχνότητας εμφάνισης του χαρακτηριστικού που μελετάται στον πληθυσμό. Πράγματι, εφόσον η έρευνα διεξάγεται με τη χρήση δειγματοληπτικών δεδομένων, η προβολή των αποτελεσμάτων στον πληθυσμό πρέπει να περιέχει ένα στοιχείο ανακρίβειας δειγματοληψίας. Το διάστημα εμπιστοσύνης είναι ένα μέτρο της ακρίβειας της παραμέτρου που εκτιμάται. Είναι ενδιαφέρον ότι ορισμένα βιβλία σχετικά με τις βασικές στατιστικές για τους γιατρούς αγνοούν εντελώς το θέμα των διαστημάτων εμπιστοσύνης για τις συχνότητες. Σε αυτό το άρθρο θα εξετάσουμε διάφορους τρόπους για τον υπολογισμό των διαστημάτων εμπιστοσύνης για τις συχνότητες, υπονοώντας χαρακτηριστικά δείγματος όπως η μη επανάληψη και η αντιπροσωπευτικότητα, καθώς και η ανεξαρτησία των παρατηρήσεων μεταξύ τους. Σε αυτό το άρθρο, η συχνότητα κατανοείται όχι ως ένας απόλυτος αριθμός που δείχνει πόσες φορές μια συγκεκριμένη τιμή εμφανίζεται συνολικά, αλλά ως μια σχετική τιμή που καθορίζει το ποσοστό των συμμετεχόντων στη μελέτη στους οποίους εμφανίζεται το χαρακτηριστικό που μελετήθηκε.

Στη βιοϊατρική έρευνα, χρησιμοποιούνται συχνότερα διαστήματα εμπιστοσύνης 95%. Αυτό το διάστημα εμπιστοσύνης είναι η περιοχή στην οποία η πραγματική αναλογία εμπίπτει στο 95% του χρόνου. Με άλλα λόγια, μπορούμε να πούμε με 95% αξιοπιστία ότι η πραγματική τιμή της συχνότητας εμφάνισης ενός χαρακτηριστικού στον πληθυσμό θα είναι εντός του διαστήματος εμπιστοσύνης 95%.

Τα περισσότερα εγχειρίδια στατιστικών για ιατρικούς ερευνητές αναφέρουν ότι το σφάλμα συχνότητας υπολογίζεται χρησιμοποιώντας τον τύπο

όπου p είναι η συχνότητα εμφάνισης του χαρακτηριστικού στο δείγμα (τιμή από 0 έως 1). Τα περισσότερα εγχώρια επιστημονικά άρθρα υποδεικνύουν την τιμή της συχνότητας εμφάνισης ενός χαρακτηριστικού σε ένα δείγμα (p), καθώς και το σφάλμα του (s) με τη μορφή p ± s. Είναι πιο σκόπιμο, ωστόσο, να παρουσιάζεται ένα διάστημα εμπιστοσύνης 95% για τη συχνότητα εμφάνισης ενός χαρακτηριστικού στον πληθυσμό, το οποίο θα περιλαμβάνει τιμές από

να.

Ορισμένα εγχειρίδια συνιστούν για μικρά δείγματα, να αντικαταστήσετε την τιμή 1,96 με την τιμή t για N – 1 βαθμούς ελευθερίας, όπου N είναι ο αριθμός των παρατηρήσεων στο δείγμα. Η τιμή t βρίσκεται από πίνακες για την κατανομή t, που είναι διαθέσιμοι σε όλα σχεδόν τα εγχειρίδια στατιστικών. Η χρήση της κατανομής t για τη μέθοδο Wald δεν παρέχει ορατά πλεονεκτήματα σε σύγκριση με άλλες μεθόδους που συζητούνται παρακάτω και επομένως δεν συνιστάται από ορισμένους συγγραφείς.

Η μέθοδος που παρουσιάστηκε παραπάνω για τον υπολογισμό των διαστημάτων εμπιστοσύνης για τις συχνότητες ή τις αναλογίες ονομάζεται Wald προς τιμήν του Abraham Wald (1902–1950), δεδομένου ότι η ευρεία χρήση της ξεκίνησε μετά τη δημοσίευση των Wald και Wolfowitz το 1939. Ωστόσο, η ίδια η μέθοδος προτάθηκε από τον Pierre Simon Laplace (1749–1827) το 1812.

Η μέθοδος Wald είναι πολύ δημοφιλής, αλλά η εφαρμογή της συνδέεται με σημαντικά προβλήματα. Η μέθοδος δεν συνιστάται για μικρά μεγέθη δειγμάτων, καθώς και σε περιπτώσεις όπου η συχνότητα εμφάνισης ενός χαρακτηριστικού τείνει στο 0 ή 1 (0% ή 100%) και είναι απλά αδύνατη για συχνότητες 0 και 1. Επιπλέον, η η προσέγγιση της κανονικής κατανομής, η οποία χρησιμοποιείται κατά τον υπολογισμό του σφάλματος , "δεν λειτουργεί" σε περιπτώσεις όπου n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.



όπου παίρνει την τιμή 1,96 κατά τον υπολογισμό του διαστήματος εμπιστοσύνης 95%, N είναι ο αριθμός των παρατηρήσεων και p είναι η συχνότητα εμφάνισης του χαρακτηριστικού στο δείγμα. Αυτή η μέθοδος είναι διαθέσιμη σε ηλεκτρονικές αριθμομηχανές, επομένως η χρήση της δεν είναι προβληματική. και δεν συνιστούμε τη χρήση αυτής της μεθόδου για n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Εκτός από τη μέθοδο Wilson, η μέθοδος Wald με διόρθωση Agresti–Coll πιστεύεται επίσης ότι παρέχει μια βέλτιστη εκτίμηση του διαστήματος εμπιστοσύνης για τις συχνότητες. Η διόρθωση Agresti-Coll είναι μια αντικατάσταση στον τύπο Wald της συχνότητας εμφάνισης ενός χαρακτηριστικού σε ένα δείγμα (p) με p», κατά τον υπολογισμό του οποίου 2 προστίθεται στον αριθμητή και 4 προστίθεται στον παρονομαστή, δηλαδή p` = (X + 2) / (N + 4), όπου X είναι ο αριθμός των συμμετεχόντων στη μελέτη που έχουν το υπό μελέτη χαρακτηριστικό και N είναι το μέγεθος του δείγματος. Αυτή η τροποποίηση παράγει αποτελέσματα πολύ παρόμοια με τον τύπο του Wilson, εκτός εάν η συχνότητα συμβάντος πλησιάζει το 0% ή το 100% και το δείγμα είναι μικρό. Εκτός από τις παραπάνω μεθόδους για τον υπολογισμό των διαστημάτων εμπιστοσύνης για τις συχνότητες, έχουν προταθεί διορθώσεις συνέχειας και για τις μεθόδους Wald και Wilson για μικρά δείγματα, αλλά μελέτες έχουν δείξει ότι η χρήση τους είναι ακατάλληλη.

Ας εξετάσουμε την εφαρμογή των παραπάνω μεθόδων για τον υπολογισμό των διαστημάτων εμπιστοσύνης χρησιμοποιώντας δύο παραδείγματα. Στην πρώτη περίπτωση, μελετάμε ένα μεγάλο δείγμα 1.000 τυχαία επιλεγμένων συμμετεχόντων στη μελέτη, εκ των οποίων οι 450 έχουν το υπό μελέτη χαρακτηριστικό (αυτό θα μπορούσε να είναι παράγοντας κινδύνου, αποτέλεσμα ή οποιοδήποτε άλλο χαρακτηριστικό), που αντιπροσωπεύει συχνότητα 0,45 ή 45 %. Στη δεύτερη περίπτωση, η μελέτη πραγματοποιείται χρησιμοποιώντας ένα μικρό δείγμα, ας πούμε, μόνο 20 άτομα, και μόνο 1 συμμετέχων στη μελέτη (5%) έχει το υπό μελέτη χαρακτηριστικό. Τα διαστήματα εμπιστοσύνης χρησιμοποιώντας τη μέθοδο Wald, τη μέθοδο Wald με διόρθωση Agresti–Coll και τη μέθοδο Wilson υπολογίστηκαν χρησιμοποιώντας μια ηλεκτρονική αριθμομηχανή που αναπτύχθηκε από τον Jeff Sauro (http://www. /wald. htm). Τα διαστήματα εμπιστοσύνης διορθωμένα ως προς τη συνέχεια του Wilson υπολογίστηκαν χρησιμοποιώντας την αριθμομηχανή που παρέχεται από το Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Οι υπολογισμοί μετασχηματισμού Angular Fisher πραγματοποιήθηκαν χειροκίνητα χρησιμοποιώντας την κρίσιμη τιμή t για 19 και 999 βαθμούς ελευθερίας, αντίστοιχα. Τα αποτελέσματα των υπολογισμών παρουσιάζονται στον πίνακα και για τα δύο παραδείγματα.

Τα διαστήματα εμπιστοσύνης υπολογίζονται με έξι διαφορετικούς τρόπους για δύο παραδείγματα που περιγράφονται στο κείμενο

Μέθοδος υπολογισμού διαστήματος εμπιστοσύνης

P=0,0500 ή 5%

95% CI για X=450, N=1000, P=0,4500 ή 45%

–0,0455–0,2541

Wald με διόρθωση Agresti–Coll

<,0001–0,2541

Wilson με διόρθωση συνέχειας

Clopper-Pearson "ακριβής μέθοδος"

Γωνιακός μετασχηματισμός

<0,0001–0,1967

Όπως φαίνεται από τον πίνακα, για το πρώτο παράδειγμα το διάστημα εμπιστοσύνης που υπολογίζεται χρησιμοποιώντας τη μέθοδο Wald "γενικά αποδεκτή" εισέρχεται στην αρνητική περιοχή, κάτι που δεν μπορεί να ισχύει για τις συχνότητες. Δυστυχώς, τέτοια περιστατικά δεν είναι ασυνήθιστα στη ρωσική λογοτεχνία. Ο παραδοσιακός τρόπος παρουσίασης δεδομένων ως προς τη συχνότητα και το σφάλμα τους καλύπτει εν μέρει αυτό το πρόβλημα. Για παράδειγμα, εάν η συχνότητα εμφάνισης ενός χαρακτηριστικού (σε ποσοστό) παρουσιάζεται ως 2,1 ± 1,4, τότε αυτό δεν είναι τόσο «προσβλητικό για το μάτι» όσο το 2,1% (95% CI: –0,7; 4,9), αν και σημαίνει το ίδιο πράγμα. Η μέθοδος Wald με διόρθωση Agresti–Coll και υπολογισμό με χρήση γωνιακού μετασχηματισμού δίνει ένα κατώτερο όριο που τείνει στο μηδέν. Η μέθοδος διόρθωσης της συνέχειας του Wilson και η «ακριβής μέθοδος» παράγουν μεγαλύτερα διαστήματα εμπιστοσύνης από τη μέθοδο του Wilson. Για το δεύτερο παράδειγμα, όλες οι μέθοδοι δίνουν περίπου τα ίδια διαστήματα εμπιστοσύνης (οι διαφορές εμφανίζονται μόνο σε χιλιοστά), κάτι που δεν προκαλεί έκπληξη, καθώς η συχνότητα εμφάνισης του γεγονότος σε αυτό το παράδειγμα δεν διαφέρει πολύ από το 50% και το μέγεθος του δείγματος είναι αρκετά μεγάλο.

Για τους αναγνώστες που ενδιαφέρονται για αυτό το πρόβλημα, μπορούμε να προτείνουμε τα έργα των R. G. Newcombe και Brown, Cai και Dasgupta, τα οποία παρέχουν τα πλεονεκτήματα και τα μειονεκτήματα της χρήσης 7 και 10 διαφορετικών μεθόδων για τον υπολογισμό των διαστημάτων εμπιστοσύνης, αντίστοιχα. Μεταξύ των εγχώριων εγχειριδίων, προτείνουμε το βιβλίο και, το οποίο, εκτός από μια λεπτομερή περιγραφή της θεωρίας, παρουσιάζει τις μεθόδους των Wald και Wilson, καθώς και μια μέθοδο για τον υπολογισμό των διαστημάτων εμπιστοσύνης λαμβάνοντας υπόψη τη διωνυμική κατανομή συχνοτήτων. Εκτός από τις δωρεάν ηλεκτρονικές αριθμομηχανές (http://www. /wald. htm και http://faculty. vassar. edu/lowry/prop1.html), τα διαστήματα εμπιστοσύνης για τις συχνότητες (και όχι μόνο!) μπορούν να υπολογιστούν χρησιμοποιώντας το Πρόγραμμα CIA ( Ανάλυση Διαστημάτων Εμπιστοσύνης), το οποίο μπορείτε να κατεβάσετε από τη διεύθυνση http://www. ιατρείο. σώτον. ακ. uk/cia/ .

Το επόμενο άρθρο θα εξετάσει μονομεταβλητούς τρόπους σύγκρισης ποιοτικών δεδομένων.

Αναφορές

Μπανέρτζι Α.Ιατρικές στατιστικές σε σαφή γλώσσα: ένα εισαγωγικό μάθημα / A. Banerjee. – Μ.: Πρακτική Ιατρική, 2007. – 287 σελ. Ιατρικές στατιστικές / . – Μ.: Πρακτορείο Ιατρικών Πληροφοριών, 2007. – 475 σελ. Γκλανζ Σ.Ιατρικές και βιολογικές στατιστικές / S. Glanz. – Μ.: Πρακτικά, 1998. Τύποι δεδομένων, δοκιμές διανομής και περιγραφικές στατιστικές // Human Ecology – 2008. – No. 1. – P. 52–58. Zhizhin K. S.. Ιατρικές στατιστικές: σχολικό βιβλίο / . – Rostov n/d: Phoenix, 2007. – 160 p. Εφαρμοσμένες ιατρικές στατιστικές / , . – Αγία Πετρούπολη. : Foliot, 2003. – 428 σελ. Lakin G. F. Βιομετρικά / . – Μ.: Ανώτατο Σχολείο, 1990. – 350 σελ. Γιατρός V. A. Μαθηματική στατιστική στην ιατρική / , . – Μ.: Οικονομικά και Στατιστική, 2007. – 798 σελ. Μαθηματική στατιστική στην κλινική έρευνα / , . – Μ.: GEOTAR-MED, 2001. – 256 σελ. Junkerov V. ΚΑΙ. Ιατρική και στατιστική επεξεργασία δεδομένων ιατρικής έρευνας / , . – Αγία Πετρούπολη. : VmedA, 2002. – 266 σελ. Αγρέστη Α.Η κατά προσέγγιση είναι καλύτερη από την ακριβή για την εκτίμηση διαστήματος των διωνυμικών αναλογιών / A. Agresti, B. Coull // Αμερικανός στατιστικολόγος. – 1998. – Ν 52. – Σ. 119–126. Άλτμαν Δ.Στατιστικά στοιχεία με σιγουριά // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Λονδίνο: BMJ Books, 2000. – 240 σελ. Brown L.D.Εκτίμηση διαστήματος για διωνυμική αναλογία / L. D. Brown, T. T. Cai, A. Dasgupta // Στατιστική επιστήμη. – 2001. – Ν 2. – Σ. 101–133. Clopper C.J.Η χρήση της εμπιστοσύνης ή των πιστών ορίων που απεικονίζονται στην περίπτωση του διωνύμου / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – Ν 26. – Σ. 404–413. Garcia-Perez M.A. Σχετικά με το διάστημα εμπιστοσύνης για τη διωνυμική παράμετρο / M. A. Garcia-Perez // Ποιότητα και ποσότητα. – 2005. – Ν 39. – Σ. 467–481. Μοτούλσκι Χ.Διαισθητική βιοστατιστική // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 p. Newcombe R. G.Διαστήματα εμπιστοσύνης δύο όψεων για τη μοναδική αναλογία: Σύγκριση επτά μεθόδων / R. G. Newcombe // Statistics in Medicine. – 1998. – Ν. 17. – Σ. 857–872. Σάουρο Τζ.Εκτίμηση των ρυθμών ολοκλήρωσης από μικρά δείγματα με χρήση διωνυμικών διαστημάτων εμπιστοσύνης: συγκρίσεις και συστάσεις / J. Sauro, J. R. Lewis // Ετήσια συνάντηση της εταιρείας Proceedings of the human factor and ergonomics society. – Ορλάντο, Φλόριντα, 2005. Wald A.Όρια εμπιστοσύνης για συναρτήσεις συνεχούς διανομής // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – Ν 10. – Σ. 105–118. Wilson E.B. Πιθανό συμπέρασμα, ο νόμος της διαδοχής και το στατιστικό συμπέρασμα / E. B. Wilson // Journal of American Statistical Association. – 1927. – Ν 22. – Σ. 209–212.

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΑΝΑΛΟΓΙΑ

ΕΝΑ. Μ. Γκριμπόφσκι

Εθνικό Ινστιτούτο Δημόσιας Υγείας, Όσλο, Νορβηγία

Το άρθρο παρουσιάζει διάφορες μεθόδους για υπολογισμούς διαστημάτων εμπιστοσύνης για διωνυμικές αναλογίες, συγκεκριμένα, μεθόδους Wald, Wilson, arcsine, Agresti-Coull και ακριβείς Clopper-Pearson. Η εργασία δίνει μόνο μια γενική εισαγωγή στο πρόβλημα της εκτίμησης του διαστήματος εμπιστοσύνης μιας διωνυμικής αναλογίας και στόχος της δεν είναι μόνο να παρακινήσει τους αναγνώστες να χρησιμοποιούν διαστήματα εμπιστοσύνης κατά την παρουσίαση των αποτελεσμάτων της δικής τους εμπειρικής έρευνας, αλλά και να τους ενθαρρύνει να συμβουλεύονται βιβλία στατιστικής πριν από την ανάλυση των δεδομένων και την προετοιμασία χειρογράφων.

Λέξεις κλειδιά: διάστημα εμπιστοσύνης, αναλογία

Στοιχεία επικοινωνίας:

Ανώτερος Σύμβουλος, Εθνικό Ινστιτούτο Δημόσιας Υγείας, Όσλο, Νορβηγία

Στις προηγούμενες υποενότητες εξετάσαμε το ζήτημα της εκτίμησης μιας άγνωστης παραμέτρου ΕΝΑένας αριθμός. Αυτό ονομάζεται εκτίμηση «σημείου». Σε μια σειρά εργασιών, δεν χρειάζεται μόνο να βρείτε την παράμετρο ΕΝΑκατάλληλη αριθμητική τιμή, αλλά και για την αξιολόγηση της ακρίβειας και της αξιοπιστίας της. Πρέπει να γνωρίζετε σε ποια σφάλματα μπορεί να οδηγήσει η αντικατάσταση μιας παραμέτρου ΕΝΑσημειακή του εκτίμηση ΕΝΑκαι με ποιο βαθμό εμπιστοσύνης μπορούμε να περιμένουμε ότι αυτά τα σφάλματα δεν θα ξεπεράσουν τα γνωστά όρια;

Προβλήματα αυτού του είδους είναι ιδιαίτερα σχετικά με έναν μικρό αριθμό παρατηρήσεων, όταν η σημειακή εκτίμηση και μέσαείναι σε μεγάλο βαθμό τυχαία και η κατά προσέγγιση αντικατάσταση του a από το a μπορεί να οδηγήσει σε σοβαρά σφάλματα.

Για να δώσετε μια ιδέα για την ακρίβεια και την αξιοπιστία της εκτίμησης ΕΝΑ,

Στη μαθηματική στατιστική, χρησιμοποιούνται τα λεγόμενα διαστήματα εμπιστοσύνης και οι πιθανότητες εμπιστοσύνης.

Αφήστε για την παράμετρο ΕΝΑαμερόληπτη εκτίμηση που προκύπτει από την εμπειρία ΕΝΑ.Θέλουμε να εκτιμήσουμε το πιθανό σφάλμα σε αυτήν την περίπτωση. Ας αντιστοιχίσουμε κάποια αρκετά μεγάλη πιθανότητα p (για παράδειγμα, p = 0,9, 0,95 ή 0,99) έτσι ώστε ένα γεγονός με πιθανότητα p να μπορεί να θεωρηθεί πρακτικά αξιόπιστο και να βρούμε μια τιμή s για την οποία

Στη συνέχεια, το εύρος των πρακτικά πιθανών τιμών του σφάλματος που προκύπτει κατά την αντικατάσταση ΕΝΑεπί ΕΝΑ, θα είναι ± s; Τα μεγάλα σφάλματα σε απόλυτη τιμή θα εμφανιστούν μόνο με μικρή πιθανότητα a = 1 - p. Ας ξαναγράψουμε το (14.3.1) ως εξής:

Ισότητα (14.3.2) σημαίνει ότι με πιθανότητα p η άγνωστη τιμή της παραμέτρου ΕΝΑεμπίπτει στο διάστημα

Είναι απαραίτητο να σημειώσουμε μια περίσταση. Προηγουμένως, έχουμε επανειλημμένα εξετάσει την πιθανότητα μιας τυχαίας μεταβλητής να πέσει σε ένα δεδομένο μη τυχαίο διάστημα. Εδώ η κατάσταση είναι διαφορετική: το μέγεθος ΕΝΑδεν είναι τυχαίο, αλλά το διάστημα / p είναι τυχαίο. Η θέση του στον άξονα x είναι τυχαία, καθορίζεται από το κέντρο του ΕΝΑ; Γενικά, το μήκος του διαστήματος 2s είναι επίσης τυχαίο, αφού η τιμή του s υπολογίζεται, κατά κανόνα, από πειραματικά δεδομένα. Επομένως, σε αυτήν την περίπτωση θα ήταν καλύτερο να ερμηνεύσουμε την τιμή p όχι ως την πιθανότητα να «χτυπήσουμε» το σημείο ΕΝΑστο διάστημα / p, και ως η πιθανότητα ότι ένα τυχαίο διάστημα / p θα καλύψει το σημείο ΕΝΑ(Εικ. 14.3.1).

Ρύζι. 14.3.1

Η πιθανότητα p ονομάζεται συνήθως πιθανότητα εμπιστοσύνης, και διάστημα / p - διάστημα εμπιστοσύνης.Όρια διαστημάτων Αν. a x = a- s και a 2 = a +και καλούνται όρια εμπιστοσύνης.

Ας δώσουμε μια άλλη ερμηνεία στην έννοια του διαστήματος εμπιστοσύνης: μπορεί να θεωρηθεί ως ένα διάστημα τιμών παραμέτρων ΕΝΑ,συμβατό με πειραματικά δεδομένα και δεν έρχεται σε αντίθεση με αυτά. Πράγματι, εάν συμφωνήσουμε να θεωρήσουμε ένα γεγονός με πιθανότητα a = 1-p πρακτικά αδύνατο, τότε αυτές οι τιμές της παραμέτρου a για τις οποίες α - α> s πρέπει να αναγνωρίζονται ως αντικρουόμενα πειραματικά δεδομένα και εκείνα για τα οποία |a - ΕΝΑ a t na 2 .

Αφήστε για την παράμετρο ΕΝΑυπάρχει μια αμερόληπτη εκτίμηση ΕΝΑ.Αν γνωρίζαμε τον νόμο κατανομής της ποσότητας ΕΝΑ, το έργο της εύρεσης ενός διαστήματος εμπιστοσύνης θα ήταν πολύ απλό: θα αρκούσε να βρείτε μια τιμή s για την οποία

Η δυσκολία είναι ότι ο νόμος της κατανομής των εκτιμήσεων ΕΝΑεξαρτάται από τον νόμο κατανομής της ποσότητας Χκαι, επομένως, στις άγνωστες παραμέτρους του (ιδίως στην ίδια την παράμετρο ΕΝΑ).

Για να ξεπεράσετε αυτή τη δυσκολία, μπορείτε να χρησιμοποιήσετε την ακόλουθη κατά προσέγγιση τεχνική: αντικαταστήστε τις άγνωστες παραμέτρους στην έκφραση για το s με τις σημειακές εκτιμήσεις τους. Με σχετικά μεγάλο αριθμό πειραμάτων n(περίπου 20...30) αυτή η τεχνική συνήθως δίνει αποτελέσματα που είναι ικανοποιητικά όσον αφορά την ακρίβεια.

Ως παράδειγμα, εξετάστε το πρόβλημα ενός διαστήματος εμπιστοσύνης για τη μαθηματική προσδοκία.

Αφήστε το να παραχθεί n X,των οποίων τα χαρακτηριστικά είναι η μαθηματική προσδοκία Τκαι διακύμανση ρε- άγνωστο. Λήφθηκαν οι ακόλουθες εκτιμήσεις για αυτές τις παραμέτρους:

Απαιτείται να κατασκευαστεί ένα διάστημα εμπιστοσύνης / p που αντιστοιχεί στην πιθανότητα εμπιστοσύνης p για τη μαθηματική προσδοκία Τποσότητες Χ.

Κατά την επίλυση αυτού του προβλήματος, θα χρησιμοποιήσουμε το γεγονός ότι η ποσότητα Ταντιπροσωπεύει το άθροισμα nανεξάρτητες πανομοιότυπα κατανεμημένες τυχαίες μεταβλητές Xhκαι σύμφωνα με το κεντρικό οριακό θεώρημα, για ένα αρκετά μεγάλο nο νόμος κατανομής του είναι κοντά στο κανονικό. Στην πράξη, ακόμη και με έναν σχετικά μικρό αριθμό όρων (περίπου 10...20), ο νόμος κατανομής του αθροίσματος μπορεί να θεωρηθεί περίπου κανονικός. Θα υποθέσουμε ότι η τιμή Τκατανέμονται σύμφωνα με τον κανονικό νόμο. Τα χαρακτηριστικά αυτού του νόμου - μαθηματική προσδοκία και διακύμανση - είναι ίσα, αντίστοιχα ΤΚαι

(βλ. κεφάλαιο 13 υποενότητα 13.3). Ας υποθέσουμε ότι η τιμή ρεγνωρίζουμε και θα βρούμε μια τιμή Ep για την οποία

Χρησιμοποιώντας τον τύπο (6.3.5) του κεφαλαίου 6, εκφράζουμε την πιθανότητα στην αριστερή πλευρά του (14.3.5) μέσω της συνάρτησης κανονικής κατανομής

όπου είναι η τυπική απόκλιση της εκτίμησης Τ.

Από την εξ.

βρείτε την τιμή του Sp:

όπου arg Ф* (х) είναι η αντίστροφη συνάρτηση του Φ* (Χ),εκείνοι. μια τέτοια τιμή του ορίσματος για το οποίο η συνάρτηση κανονικής κατανομής είναι ίση με Χ.

Διασπορά ΡΕ,μέσω του οποίου εκφράζεται η ποσότητα ΕΝΑ 1P, δεν γνωρίζουμε ακριβώς? ως κατά προσέγγιση τιμή του, μπορείτε να χρησιμοποιήσετε την εκτίμηση ρε(14.3.4) και βάλτε περίπου:

Έτσι, το πρόβλημα της κατασκευής ενός διαστήματος εμπιστοσύνης έχει περίπου λυθεί, το οποίο ισούται με:

όπου το gp προσδιορίζεται από τον τύπο (14.3.7).

Για να αποφευχθεί η αντίστροφη παρεμβολή στους πίνακες της συνάρτησης Ф* (l) κατά τον υπολογισμό του s p, είναι βολικό να συντάσσεται ένας ειδικός πίνακας (Πίνακας 14.3.1), ο οποίος δίνει τις τιμές της ποσότητας

ανάλογα με το r. Η τιμή (p καθορίζει για τον κανονικό νόμο τον αριθμό των τυπικών αποκλίσεων που πρέπει να αποτυπωθούν δεξιά και αριστερά από το κέντρο διασποράς έτσι ώστε η πιθανότητα να εισέλθει στην προκύπτουσα περιοχή είναι ίση με p.

Μέσω της τιμής του 7 p, το διάστημα εμπιστοσύνης εκφράζεται ως:

Πίνακας 14.3.1

Παράδειγμα 1. Διεξήχθησαν 20 πειράματα επί της ποσότητας X;τα αποτελέσματα φαίνονται στον πίνακα. 14.3.2.

Πίνακας 14.3.2

Απαιτείται να βρεθεί μια εκτίμηση για τη μαθηματική προσδοκία της ποσότητας Χκαι να κατασκευάσετε ένα διάστημα εμπιστοσύνης που αντιστοιχεί στην πιθανότητα εμπιστοσύνης p = 0,8.

Διάλυμα.Έχουμε:

Επιλέγοντας l: = 10 ως σημείο αναφοράς, χρησιμοποιώντας τον τρίτο τύπο (14.2.14) βρίσκουμε την αμερόληπτη εκτίμηση ρε :

Σύμφωνα με τον πίνακα 14.3.1 βρίσκουμε

Όρια εμπιστοσύνης:

Διάστημα εμπιστοσύνης:

Τιμές παραμέτρων Τ,που βρίσκονται σε αυτό το διάστημα είναι συμβατά με τα πειραματικά δεδομένα που δίνονται στον πίνακα. 14.3.2.

Ένα διάστημα εμπιστοσύνης για τη διακύμανση μπορεί να κατασκευαστεί με παρόμοιο τρόπο.

Αφήστε το να παραχθεί nανεξάρτητα πειράματα σε μια τυχαία μεταβλητή Χμε άγνωστες παραμέτρους τόσο για το Α όσο και για τη διασπορά ρελήφθηκε μια αμερόληπτη εκτίμηση:

Απαιτείται να κατασκευαστεί περίπου ένα διάστημα εμπιστοσύνης για τη διακύμανση.

Από τον τύπο (14.3.11) είναι σαφές ότι η ποσότητα ρεαντιπροσωπεύει

ποσό nτυχαίες μεταβλητές της φόρμας . Αυτές οι αξίες δεν είναι

ανεξάρτητο, αφού οποιοδήποτε από αυτά περιλαμβάνει την ποσότητα Τ,εξαρτάται από όλους τους άλλους. Ωστόσο, μπορεί να αποδειχθεί ότι με την αύξηση nο νόμος κατανομής του αθροίσματος τους προσεγγίζει επίσης το κανονικό. Σχεδόν στο n= 20...30 μπορεί ήδη να θεωρηθεί φυσιολογικό.

Ας υποθέσουμε ότι είναι έτσι και να βρούμε τα χαρακτηριστικά αυτού του νόμου: μαθηματική προσδοκία και διασπορά. Από την αξιολόγηση ρε- αμερόληπτο, λοιπόν Μ[Δ] = Δ.

Υπολογισμός διακύμανσης Δ Δσχετίζεται με σχετικά σύνθετους υπολογισμούς, επομένως παρουσιάζουμε την έκφρασή του χωρίς παράγωγο:

όπου q 4 είναι η τέταρτη κεντρική ροπή του μεγέθους Χ.

Για να χρησιμοποιήσετε αυτήν την έκφραση, πρέπει να αντικαταστήσετε τις τιμές \u003d 4 και ρε(τουλάχιστον οι κοντινοί). Αντί για ρεμπορείτε να χρησιμοποιήσετε την αξιολόγησή του ΡΕ.Κατ 'αρχήν, η τέταρτη κεντρική στιγμή μπορεί επίσης να αντικατασταθεί από μια εκτίμηση, για παράδειγμα, μια τιμή της φόρμας:

αλλά μια τέτοια αντικατάσταση θα δώσει εξαιρετικά χαμηλή ακρίβεια, αφού γενικά, με περιορισμένο αριθμό πειραμάτων, οι ροπές υψηλής τάξης προσδιορίζονται με μεγάλα σφάλματα. Ωστόσο, στην πράξη συμβαίνει συχνά ότι ο τύπος του νόμου διανομής ποσότητας Χγνωστό εκ των προτέρων: μόνο οι παράμετροί του είναι άγνωστες. Στη συνέχεια, μπορείτε να προσπαθήσετε να εκφράσετε μ 4 έως ΡΕ.

Ας πάρουμε την πιο συνηθισμένη περίπτωση, όταν η τιμή Χκατανέμονται σύμφωνα με τον κανονικό νόμο. Τότε η τέταρτη κεντρική ροπή του εκφράζεται με όρους διασποράς (βλ. Κεφάλαιο 6, υποενότητα 6.2).

και ο τύπος (14.3.12) δίνει ή

Αντικατάσταση του αγνώστου στην (14.3.14) ρετην εκτίμησή του ρε, παίρνουμε: από πού

Η στιγμή μ 4 μπορεί να εκφραστεί μέσω ρεεπίσης σε ορισμένες άλλες περιπτώσεις, όταν η κατανομή της αξίας Χδεν είναι φυσιολογικό, αλλά η εμφάνισή του είναι γνωστή. Για παράδειγμα, για τον νόμο της ομοιόμορφης πυκνότητας (βλ. Κεφάλαιο 5) έχουμε:

όπου (a, P) είναι το διάστημα στο οποίο προσδιορίζεται ο νόμος.

Οθεν,

Χρησιμοποιώντας τον τύπο (14.3.12) παίρνουμε: που βρίσκουμε περίπου

Σε περιπτώσεις όπου ο τύπος του νόμου διανομής για την ποσότητα 26 είναι άγνωστος, όταν γίνεται μια κατά προσέγγιση εκτίμηση της τιμής α/) εξακολουθεί να συνιστάται η χρήση του τύπου (14.3.16), εκτός εάν υπάρχουν ειδικοί λόγοι να πιστεύουμε ότι αυτός ο νόμος είναι πολύ διαφορετικό από το κανονικό (έχει αισθητή θετική ή αρνητική κύρτωση) .

Εάν η κατά προσέγγιση τιμή a/) λαμβάνεται με τον ένα ή τον άλλο τρόπο, τότε μπορούμε να κατασκευάσουμε ένα διάστημα εμπιστοσύνης για τη διακύμανση με τον ίδιο τρόπο όπως το δημιουργήσαμε για τη μαθηματική προσδοκία:

όπου η τιμή ανάλογα με τη δεδομένη πιθανότητα p βρίσκεται σύμφωνα με τον πίνακα. 14.3.1.

Παράδειγμα 2. Βρείτε περίπου 80% διάστημα εμπιστοσύνης για τη διακύμανση μιας τυχαίας μεταβλητής Χυπό τις συνθήκες του παραδείγματος 1, εάν είναι γνωστό ότι η τιμή Χδιανέμονται σύμφωνα με νόμο κοντά στο κανονικό.

Διάλυμα.Η τιμή παραμένει η ίδια όπως στον πίνακα. 14.3.1:

Σύμφωνα με τον τύπο (14.3.16)

Χρησιμοποιώντας τον τύπο (14.3.18) βρίσκουμε το διάστημα εμπιστοσύνης:

Το αντίστοιχο εύρος τιμών τυπικής απόκλισης: (0,21; 0,29).

14.4. Ακριβείς μέθοδοι για την κατασκευή διαστημάτων εμπιστοσύνης για τις παραμέτρους μιας τυχαίας μεταβλητής που κατανέμεται σύμφωνα με έναν κανονικό νόμο

Στην προηγούμενη υποενότητα, εξετάσαμε κατά προσέγγιση μεθόδους για την κατασκευή διαστημάτων εμπιστοσύνης για μαθηματικές προσδοκίες και διακύμανση. Εδώ θα δώσουμε μια ιδέα για τις ακριβείς μεθόδους επίλυσης του ίδιου προβλήματος. Τονίζουμε ότι για την ακριβή εύρεση των διαστημάτων εμπιστοσύνης είναι απολύτως απαραίτητο να γνωρίζουμε εκ των προτέρων τη μορφή του νόμου κατανομής της ποσότητας X,ενώ για την εφαρμογή κατά προσέγγιση μεθόδων αυτό δεν είναι απαραίτητο.

Η ιδέα των ακριβών μεθόδων για την κατασκευή διαστημάτων εμπιστοσύνης καταλήγει στα εξής. Οποιοδήποτε διάστημα εμπιστοσύνης βρίσκεται από μια συνθήκη που εκφράζει την πιθανότητα εκπλήρωσης ορισμένων ανισοτήτων, οι οποίες περιλαμβάνουν την εκτίμηση που μας ενδιαφέρει ΕΝΑ.Νόμος της κατανομής της αποτίμησης ΕΝΑστη γενική περίπτωση εξαρτάται από άγνωστες παραμέτρους της ποσότητας Χ.Ωστόσο, μερικές φορές είναι δυνατό να περάσει σε ανισότητες από μια τυχαία μεταβλητή ΕΝΑσε κάποια άλλη συνάρτηση παρατηρούμενων τιμών X p X 2, ..., Χ σελ.ο νόμος κατανομής του οποίου δεν εξαρτάται από άγνωστες παραμέτρους, αλλά εξαρτάται μόνο από τον αριθμό των πειραμάτων και από τον τύπο του νόμου κατανομής της ποσότητας Χ.Αυτού του είδους οι τυχαίες μεταβλητές παίζουν σημαντικό ρόλο στις μαθηματικές στατιστικές. έχουν μελετηθεί λεπτομερέστερα για την περίπτωση κανονικής κατανομής της ποσότητας Χ.

Για παράδειγμα, έχει αποδειχθεί ότι με κανονική κατανομή της τιμής Χτυχαία μεταβλητή

υπακούει στο λεγόμενο Νόμος διανομής φοιτητώνΜε n- 1 βαθμός ελευθερίας η πυκνότητα αυτού του νόμου έχει τη μορφή

όπου G(x) είναι η γνωστή συνάρτηση γάμμα:

Έχει επίσης αποδειχθεί ότι η τυχαία μεταβλητή

έχει "%2 κατανομή" με n- 1 βαθμός ελευθερίας (βλ. Κεφάλαιο 7), η πυκνότητα του οποίου εκφράζεται με τον τύπο

Χωρίς να σταθούμε στις παραγώγους των κατανομών (14.4.2) και (14.4.4), θα δείξουμε πώς μπορούν να εφαρμοστούν κατά την κατασκευή διαστημάτων εμπιστοσύνης για παραμέτρους ty D.

Αφήστε το να παραχθεί nανεξάρτητα πειράματα σε μια τυχαία μεταβλητή X,κανονικά κατανεμημένο με άγνωστες παραμέτρους ΝΑ.Για αυτές τις παραμέτρους ελήφθησαν εκτιμήσεις

Απαιτείται η κατασκευή διαστημάτων εμπιστοσύνης και για τις δύο παραμέτρους που αντιστοιχούν στην πιθανότητα εμπιστοσύνης p.

Ας κατασκευάσουμε πρώτα ένα διάστημα εμπιστοσύνης για τη μαθηματική προσδοκία. Είναι φυσικό να λαμβάνεται αυτό το διάστημα συμμετρικό σε σχέση με Τ; έστω το s p συμβολίζει το μισό μήκος του διαστήματος. Η τιμή s p πρέπει να επιλεγεί έτσι ώστε να ικανοποιείται η συνθήκη

Ας προσπαθήσουμε να κινηθούμε στην αριστερή πλευρά της ισότητας (14.4.5) από την τυχαία μεταβλητή Τσε μια τυχαία μεταβλητή Τ,κατανέμεται σύμφωνα με το νόμο του Φοιτητή. Για να το κάνετε αυτό, πολλαπλασιάστε και τις δύο πλευρές της ανισότητας |m-w?|

με θετική τιμή: ή, χρησιμοποιώντας σημειογραφία (14.4.1),

Ας βρούμε έναν αριθμό / p έτσι ώστε η τιμή / p να μπορεί να βρεθεί από τη συνθήκη

Από τον τύπο (14.4.2) είναι σαφές ότι η (1) είναι άρτια συνάρτηση, επομένως η (14.4.8) δίνει

Η ισότητα (14.4.9) καθορίζει την τιμή / p ανάλογα με το p. Εάν έχετε στη διάθεσή σας πίνακα με ακέραιες τιμές

τότε η τιμή του /p μπορεί να βρεθεί με αντίστροφη παρεμβολή στον πίνακα. Ωστόσο, είναι πιο βολικό να συντάξετε έναν πίνακα τιμών /p εκ των προτέρων. Ένας τέτοιος πίνακας δίνεται στο Παράρτημα (Πίνακας 5). Αυτός ο πίνακας δείχνει τις τιμές ανάλογα με το επίπεδο εμπιστοσύνης p και τον αριθμό των βαθμών ελευθερίας n- 1. Έχοντας καθορίσει / p από τον πίνακα. 5 και υποθέτοντας

θα βρούμε το μισό πλάτος του διαστήματος εμπιστοσύνης / p και το ίδιο το διάστημα

Παράδειγμα 1. Πραγματοποιήθηκαν 5 ανεξάρτητα πειράματα σε μια τυχαία μεταβλητή X,κανονικά κατανεμημένο με άγνωστες παραμέτρους Τκαι ο. Τα αποτελέσματα των πειραμάτων δίνονται στον πίνακα. 14.4.1.

Πίνακας 14.4.1

Βρείτε βαθμολογία Τγια τη μαθηματική προσδοκία και κατασκευάστε ένα διάστημα εμπιστοσύνης 90% / p για αυτήν (δηλαδή, το διάστημα που αντιστοιχεί στην πιθανότητα εμπιστοσύνης p = 0,9).

Διάλυμα.Έχουμε:

Σύμφωνα με τον πίνακα 5 της αίτησης για p - 1 = 4 και p = 0,9 βρίσκουμε όπου

Το διάστημα εμπιστοσύνης θα είναι

Παράδειγμα 2. Για τις συνθήκες του παραδείγματος 1 της υποενότητας 14.3, υποθέτοντας την τιμή Χκανονικά κατανεμημένο, βρείτε το ακριβές διάστημα εμπιστοσύνης.

Διάλυμα.Σύμφωνα με τον πίνακα 5 του παραρτήματος βρίσκουμε το πότε p - 1 = 19ir =

0,8 / p = 1,328; από εδώ

Συγκρίνοντας με τη λύση του παραδείγματος 1 της υποενότητας 14.3 (e p = 0,072), είμαστε πεπεισμένοι ότι η απόκλιση είναι πολύ ασήμαντη. Εάν διατηρήσουμε την ακρίβεια στο δεύτερο δεκαδικό ψηφίο, τότε τα διαστήματα εμπιστοσύνης που βρέθηκαν με τις ακριβείς και κατά προσέγγιση μεθόδους συμπίπτουν:

Ας προχωρήσουμε στην κατασκευή ενός διαστήματος εμπιστοσύνης για τη διακύμανση. Εξετάστε τον αμερόληπτο εκτιμητή διασποράς

και εκφράστε την τυχαία μεταβλητή ρεμέσω του μεγέθους V(14.4.3), με κατανομή x 2 (14.4.4):

Γνωρίζοντας το νόμο της κατανομής της ποσότητας V,μπορείτε να βρείτε το διάστημα /(1) στο οποίο εμπίπτει με δεδομένη πιθανότητα p.

Νόμος της διανομής kn_x(v)το μέγεθος I 7 έχει τη μορφή που φαίνεται στο Σχ. 14.4.1.

Ρύζι. 14.4.1

Τίθεται το ερώτημα: πώς να επιλέξετε το διάστημα / p; Αν ο νόμος της κατανομής του μεγέθους Vήταν συμμετρικό (όπως ο κανονικός νόμος ή η κατανομή Student), θα ήταν φυσικό να ληφθεί το διάστημα /p συμμετρικό σε σχέση με τη μαθηματική προσδοκία. Σε αυτή την περίπτωση ο νόμος k p_x (v)ασύμμετρη. Ας συμφωνήσουμε να επιλέξουμε το διάστημα /p έτσι ώστε η πιθανότητα να είναι η τιμή Vπέρα από το διάστημα δεξιά και αριστερά (σκιασμένες περιοχές στο Σχ. 14.4.1) ήταν ίδιες και ίσες

Για να δημιουργήσουμε ένα διάστημα /p με αυτήν την ιδιότητα, χρησιμοποιούμε τον πίνακα. 4 εφαρμογές: περιέχει αριθμούς y)τέτοια που

για την αξία V,έχοντας x 2 -κατανομή με r βαθμούς ελευθερίας. Στην περίπτωσή μας r = n- 1. Ας φτιάξουμε r = n- 1 και βρείτε στην αντίστοιχη σειρά του πίνακα. 4 δύο έννοιες x 2 -το ένα αντιστοιχεί σε πιθανότητα το άλλο - πιθανότητα Ας τα υποδηλώσουμε

αξίες στις 2Και xl;Το διάστημα έχει y 2,με το αριστερό σου, και y~δεξί άκρο.

Τώρα ας βρούμε από το διάστημα / p το επιθυμητό διάστημα εμπιστοσύνης /|, για τη διασπορά με τα όρια D, και D2,που καλύπτει το σημείο ρεμε πιθανότητα p:

Ας κατασκευάσουμε ένα διάστημα / (, = (?> ь А) που καλύπτει το σημείο ρεεάν και μόνο εάν η αξία Vεμπίπτει στο διάστημα /r. Ας δείξουμε ότι το διάστημα

ικανοποιεί αυτή την προϋπόθεση. Πράγματι, οι ανισότητες ισοδυναμούν με ανισότητες

και αυτές οι ανισότητες ικανοποιούνται με πιθανότητα p. Έτσι, το διάστημα εμπιστοσύνης για τη διακύμανση έχει βρεθεί και εκφράζεται με τον τύπο (14.4.13).

Παράδειγμα 3. Βρείτε το διάστημα εμπιστοσύνης για τη διακύμανση υπό τις συνθήκες του παραδείγματος 2 της υποενότητας 14.3, εάν είναι γνωστό ότι η τιμή Χδιανέμονται κανονικά.

Διάλυμα.έχουμε . Σύμφωνα με τον πίνακα 4 του παραρτήματος

βρίσκουμε στο r = n - 1 = 19

Χρησιμοποιώντας τον τύπο (14.4.13) βρίσκουμε το διάστημα εμπιστοσύνης για τη διακύμανση

Το αντίστοιχο διάστημα για την τυπική απόκλιση είναι (0,21; 0,32). Αυτό το διάστημα υπερβαίνει ελαφρώς μόνο το διάστημα (0,21; 0,29) που λήφθηκε στο παράδειγμα 2 της υποενότητας 14.3 χρησιμοποιώντας την κατά προσέγγιση μέθοδο.

  • Το σχήμα 14.3.1 θεωρεί ένα διάστημα εμπιστοσύνης συμμετρικό ως προς το α. Γενικά, όπως θα δούμε στη συνέχεια, αυτό δεν είναι απαραίτητο.


ΚΑΤΗΓΟΡΙΕΣ

Δημοφιλή ΑΡΘΡΑ

2024 "kingad.ru" - υπερηχογραφική εξέταση ανθρώπινων οργάνων