Εφόσον η νέα μεταβλητή κατανέμεται κανονικά, τα κάτω και άνω όρια του διαστήματος εμπιστοσύνης 95% για τη μεταβλητή φ θα είναι φ-1,96 και φ+1,96 αριστερά">

Αντί για 1,96 για μικρά δείγματα, συνιστάται η αντικατάσταση της τιμής t με N - 1 βαθμούς ελευθερίας. Αυτή η μέθοδος δεν δίνει αρνητικές τιμές και σας επιτρέπει να εκτιμήσετε με μεγαλύτερη ακρίβεια τα διαστήματα εμπιστοσύνης για τις συχνότητες από τη μέθοδο Wald. Επιπλέον, περιγράφεται σε πολλά εγχώρια βιβλία αναφοράς για τις ιατρικές στατιστικές, κάτι που ωστόσο δεν οδήγησε στην ευρεία χρήση του στην ιατρική έρευνα. Ο υπολογισμός των διαστημάτων εμπιστοσύνης με χρήση μετασχηματισμού γωνίας δεν συνιστάται για συχνότητες που πλησιάζουν το 0 ή το 1.

Εδώ συνήθως τελειώνει η περιγραφή των μεθόδων για την εκτίμηση των διαστημάτων εμπιστοσύνης στα περισσότερα βιβλία σχετικά με τις βασικές στατιστικές για ιατρικούς ερευνητές και αυτό το πρόβλημα είναι χαρακτηριστικό όχι μόνο για την εγχώρια, αλλά και για την ξένη βιβλιογραφία. Και οι δύο μέθοδοι βασίζονται στο θεώρημα του κεντρικού ορίου, το οποίο συνεπάγεται μεγάλο δείγμα.

Δεδομένων των αδυναμιών εκτίμησης των διαστημάτων εμπιστοσύνης με τη χρήση των παραπάνω μεθόδων, οι Clopper (Clopper) και Pearson (Pearson) πρότειναν το 1934 μια μέθοδο για τον υπολογισμό του λεγόμενου ακριβούς διαστήματος εμπιστοσύνης, λαμβάνοντας υπόψη τη διωνυμική κατανομή του χαρακτηριστικού που μελετήθηκε. Αυτή η μέθοδος είναι διαθέσιμη σε πολλές ηλεκτρονικές αριθμομηχανές, ωστόσο, τα διαστήματα εμπιστοσύνης που λαμβάνονται με αυτόν τον τρόπο είναι στις περισσότερες περιπτώσεις πολύ μεγάλα. Ταυτόχρονα, αυτή η μέθοδος συνιστάται για χρήση σε περιπτώσεις όπου απαιτείται συντηρητική εκτίμηση. Ο βαθμός συντηρητικότητας της μεθόδου αυξάνεται όσο μειώνεται το μέγεθος του δείγματος, ειδικά για το Ν< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Σύμφωνα με πολλούς στατιστικολόγους, η βέλτιστη εκτίμηση των διαστημάτων εμπιστοσύνης για τις συχνότητες πραγματοποιείται με τη μέθοδο Wilson, που προτάθηκε το 1927, αλλά πρακτικά δεν χρησιμοποιείται στην εγχώρια βιοϊατρική έρευνα. Αυτή η μέθοδος όχι μόνο καθιστά δυνατή την εκτίμηση των διαστημάτων εμπιστοσύνης τόσο για πολύ μικρές όσο και για πολύ υψηλές συχνότητες, αλλά είναι επίσης εφαρμόσιμη σε μικρό αριθμό παρατηρήσεων. Γενικά, το διάστημα εμπιστοσύνης σύμφωνα με τον τύπο Wilson έχει τη μορφή από

Ποια είναι η πιθανότητα του διαστήματος εμπιστοσύνης. Διάστημα εμπιστοσύνης

Ο νους δεν βρίσκεται μόνο στη γνώση, αλλά και στην ικανότητα να εφαρμόζει τη γνώση στην πράξη. (Αριστοτέλης)

Διαστήματα εμπιστοσύνης

γενική αναθεώρηση

Λαμβάνοντας ένα δείγμα από τον πληθυσμό, θα λάβουμε μια σημειακή εκτίμηση της παραμέτρου που μας ενδιαφέρει και θα υπολογίσουμε το τυπικό σφάλμα για να υποδείξουμε την ακρίβεια της εκτίμησης.

Ωστόσο, για τις περισσότερες περιπτώσεις, το τυπικό σφάλμα δεν είναι αποδεκτό. Είναι πολύ πιο χρήσιμο να συνδυαστεί αυτό το μέτρο ακρίβειας με μια εκτίμηση διαστήματος για την παράμετρο πληθυσμού.

Αυτό μπορεί να γίνει χρησιμοποιώντας τη γνώση της θεωρητικής κατανομής πιθανοτήτων του στατιστικού δείγματος (παράμετρος) προκειμένου να υπολογιστεί ένα διάστημα εμπιστοσύνης (CI - Διάστημα εμπιστοσύνης, CI - Διάστημα εμπιστοσύνης) για την παράμετρο.

Γενικά, το διάστημα εμπιστοσύνης επεκτείνει τις εκτιμήσεις και προς τις δύο κατευθύνσεις κατά κάποιο πολλαπλάσιο του τυπικού σφάλματος (μιας δεδομένης παραμέτρου). Οι δύο τιμές (όρια εμπιστοσύνης) που ορίζουν το διάστημα συνήθως χωρίζονται με κόμμα και περικλείονται σε παρένθεση.

Διάστημα εμπιστοσύνης για τη μέση

Χρησιμοποιώντας την κανονική κατανομή

Ο μέσος όρος του δείγματος έχει κανονική κατανομή εάν το μέγεθος του δείγματος είναι μεγάλο, επομένως η γνώση της κανονικής κατανομής μπορεί να εφαρμοστεί κατά την εξέταση του μέσου όρου του δείγματος.

Συγκεκριμένα, το 95% της κατανομής του μέσου όρου του δείγματος βρίσκεται εντός 1,96 τυπικών αποκλίσεων (SD) του μέσου όρου του πληθυσμού.

Όταν έχουμε μόνο ένα δείγμα, το ονομάζουμε τυπικό σφάλμα του μέσου όρου (SEM) και υπολογίζουμε το διάστημα εμπιστοσύνης 95% για τον μέσο όρο ως εξής:

Εάν αυτό το πείραμα επαναληφθεί πολλές φορές, τότε το διάστημα θα περιέχει τον πραγματικό μέσο πληθυσμό στο 95% του χρόνου.

Αυτό είναι συνήθως ένα διάστημα εμπιστοσύνης, όπως το εύρος τιμών εντός του οποίου ο πραγματικός μέσος όρος πληθυσμού (γενικός μέσος όρος) βρίσκεται με ένα επίπεδο εμπιστοσύνης 95%.

Αν και δεν είναι αρκετά αυστηρό (ο μέσος όρος του πληθυσμού είναι μια σταθερή τιμή και επομένως δεν μπορεί να έχει μια πιθανότητα που να σχετίζεται με αυτό) να ερμηνεύσουμε το διάστημα εμπιστοσύνης με αυτόν τον τρόπο, είναι εννοιολογικά πιο κατανοητό.

Χρήση t-διανομή

Μπορείτε να χρησιμοποιήσετε την κανονική κατανομή εάν γνωρίζετε την τιμή της διακύμανσης στον πληθυσμό. Επίσης, όταν το μέγεθος του δείγματος είναι μικρό, ο μέσος όρος του δείγματος ακολουθεί μια κανονική κατανομή εάν τα δεδομένα στα οποία βασίζεται ο πληθυσμός είναι κανονικά κατανεμημένα.

Εάν τα δεδομένα στα οποία βασίζεται ο πληθυσμός δεν είναι κανονικά κατανεμημένα και/ή η γενική διακύμανση (διακύμανση πληθυσμού) είναι άγνωστη, ο μέσος όρος του δείγματος υπακούει Κατανομή t του μαθητή.

Υπολογίστε το διάστημα εμπιστοσύνης 95% για τον μέσο όρο του πληθυσμού ως εξής:

Πού - ποσοστιαία μονάδα (εκατοστη εκατοστιαία μονάδα) t-Κατανομή μαθητή με (n-1) βαθμούς ελευθερίας, που δίνει μια πιθανότητα δύο ουρών 0,05.

Γενικά, παρέχει ένα ευρύτερο διάστημα από ό,τι όταν χρησιμοποιείται μια κανονική κατανομή, επειδή λαμβάνει υπόψη την πρόσθετη αβεβαιότητα που εισάγεται με την εκτίμηση της τυπικής απόκλισης του πληθυσμού ή/και λόγω του μικρού μεγέθους δείγματος.

Όταν το μέγεθος του δείγματος είναι μεγάλο (της τάξης των 100 ή περισσότερο), η διαφορά μεταξύ των δύο κατανομών ( t-μαθητήςκαι κανονικό) είναι αμελητέο. Ωστόσο, χρησιμοποιείτε πάντα t-κατανομή κατά τον υπολογισμό των διαστημάτων εμπιστοσύνης, ακόμη και αν το μέγεθος του δείγματος είναι μεγάλο.

Συνήθως δίνεται 95% CI. Μπορούν να υπολογιστούν και άλλα διαστήματα εμπιστοσύνης, όπως 99% CI για τη μέση τιμή.

Αντί για γινόμενο τυπικού σφάλματος και τιμή πίνακα t-κατανομή που αντιστοιχεί σε πιθανότητα δύο ουρών 0,05 πολλαπλασιάστε την (τυπικό σφάλμα) με μια τιμή που αντιστοιχεί σε πιθανότητα δύο ουρών 0,01. Αυτό είναι ένα ευρύτερο διάστημα εμπιστοσύνης από την περίπτωση του 95%, επειδή αντικατοπτρίζει αυξημένη εμπιστοσύνη ότι το διάστημα περιλαμβάνει όντως τη μέση τιμή του πληθυσμού.

Διάστημα εμπιστοσύνης για την αναλογία

Η δειγματοληπτική κατανομή των αναλογιών έχει διωνυμική κατανομή. Ωστόσο, εάν το μέγεθος του δείγματος nλογικά μεγάλη, τότε η κατανομή του δείγματος αναλογίας είναι περίπου κανονική με μέσο όρο .

Εκτίμηση με αναλογία δειγματοληψίας p=r/n(όπου r- ο αριθμός των ατόμων στο δείγμα με τα χαρακτηριστικά που μας ενδιαφέρουν) και το τυπικό σφάλμα εκτιμάται:

Το διάστημα εμπιστοσύνης 95% για την αναλογία εκτιμάται:

Εάν το μέγεθος του δείγματος είναι μικρό (συνήθως όταν npή n(1-p)πιο λιγο 5 ), τότε πρέπει να χρησιμοποιηθεί η διωνυμική κατανομή για να υπολογιστούν τα ακριβή διαστήματα εμπιστοσύνης.

Σημειώστε ότι εάν Πεκφράζεται ως ποσοστό, λοιπόν (1-p)αντικαταστάθηκε από (100p).

Ερμηνεία των διαστημάτων εμπιστοσύνης

Κατά την ερμηνεία του διαστήματος εμπιστοσύνης, μας ενδιαφέρουν οι ακόλουθες ερωτήσεις:

Πόσο μεγάλο είναι το διάστημα εμπιστοσύνης;

Ένα μεγάλο διάστημα εμπιστοσύνης δείχνει ότι η εκτίμηση είναι ανακριβής. το στενό υποδηλώνει μια ακριβή εκτίμηση.

Το πλάτος του διαστήματος εμπιστοσύνης εξαρτάται από το μέγεθος του τυπικού σφάλματος, το οποίο, με τη σειρά του, εξαρτάται από το μέγεθος του δείγματος και, όταν εξετάζουμε μια αριθμητική μεταβλητή από τη μεταβλητότητα των δεδομένων, δίνουμε ευρύτερα διαστήματα εμπιστοσύνης από τις μελέτες ενός μεγάλου συνόλου δεδομένων από λίγες μεταβλητές.

Το CI περιλαμβάνει αξίες ιδιαίτερου ενδιαφέροντος;

Μπορείτε να ελέγξετε εάν η πιθανή τιμή για μια παράμετρο πληθυσμού εμπίπτει σε ένα διάστημα εμπιστοσύνης. Εάν ναι, τότε τα αποτελέσματα είναι συνεπή με αυτήν την πιθανή τιμή. Εάν όχι, τότε είναι απίθανο (για ένα διάστημα εμπιστοσύνης 95%, η πιθανότητα είναι σχεδόν 5%) η παράμετρος να έχει αυτήν την τιμή.

Το "Katren-Style" συνεχίζει να δημοσιεύει έναν κύκλο του Konstantin Kravchik για τις ιατρικές στατιστικές. Σε δύο προηγούμενα άρθρα, ο συγγραφέας έθιξε την εξήγηση εννοιών όπως και.

Konstantin Kravchik

Μαθηματικός-αναλυτής. Ειδικός στον τομέα της στατιστικής έρευνας στην ιατρική και τις ανθρωπιστικές επιστήμες

Πόλη της Μόσχας

Πολύ συχνά σε άρθρα για κλινικές δοκιμές μπορείτε να βρείτε μια μυστηριώδη φράση: "διάστημα εμπιστοσύνης" (95% CI ή 95% CI - διάστημα εμπιστοσύνης). Για παράδειγμα, ένα άρθρο μπορεί να λέει: "Το τεστ t-test του μαθητή χρησιμοποιήθηκε για την αξιολόγηση της σημασίας των διαφορών, με υπολογισμένο διάστημα εμπιστοσύνης 95%.

Ποια είναι η τιμή του «διαστήματος εμπιστοσύνης 95%» και γιατί να το υπολογίσετε;

Τι είναι το διάστημα εμπιστοσύνης; - Αυτό είναι το εύρος στο οποίο εμπίπτουν οι πραγματικές μέσες τιμές στον πληθυσμό. Και τι, υπάρχουν «αναληθείς» μέσοι όροι; Κατά μία έννοια, ναι, το κάνουν. Στο εξηγήσαμε ότι είναι αδύνατο να μετρηθεί η παράμετρος ενδιαφέροντος σε ολόκληρο τον πληθυσμό, επομένως οι ερευνητές αρκούνται σε ένα περιορισμένο δείγμα. Σε αυτό το δείγμα (για παράδειγμα, κατά βάρος σώματος) υπάρχει μία μέση τιμή (ένα ορισμένο βάρος), με βάση την οποία κρίνουμε τη μέση τιμή σε ολόκληρο τον γενικό πληθυσμό. Ωστόσο, είναι απίθανο το μέσο βάρος του δείγματος (ειδικά ενός μικρού) να συμπίπτει με το μέσο βάρος του γενικού πληθυσμού. Επομένως, είναι πιο σωστό να υπολογιστεί και να χρησιμοποιηθεί το εύρος των μέσων τιμών του γενικού πληθυσμού.

Για παράδειγμα, ας υποθέσουμε ότι το διάστημα εμπιστοσύνης 95% (95% CI) για την αιμοσφαιρίνη είναι μεταξύ 110 και 122 g/L. Αυτό σημαίνει ότι με πιθανότητα 95 %, η πραγματική μέση τιμή για την αιμοσφαιρίνη στο γενικό πληθυσμό θα είναι στην περιοχή από 110 έως 122 g/L. Με άλλα λόγια, δεν γνωρίζουμε τη μέση αιμοσφαιρίνη στο γενικό πληθυσμό, αλλά μπορούμε να υποδείξουμε το εύρος τιμών για αυτό το χαρακτηριστικό με πιθανότητα 95%.

Τα διαστήματα εμπιστοσύνης σχετίζονται ιδιαίτερα με τη διαφορά των μέσων μεταξύ των ομάδων ή αυτό που ονομάζεται μέγεθος εφέ.

Ας υποθέσουμε ότι συγκρίναμε την αποτελεσματικότητα δύο σκευασμάτων σιδήρου: ενός που κυκλοφορεί στην αγορά για μεγάλο χρονικό διάστημα και ενός που μόλις έχει καταχωρηθεί. Μετά την πορεία της θεραπείας, αξιολογήθηκε η συγκέντρωση της αιμοσφαιρίνης στις υπό μελέτη ομάδες ασθενών και το στατιστικό πρόγραμμα υπολόγισε για εμάς ότι η διαφορά μεταξύ των μέσων τιμών των δύο ομάδων με πιθανότητα 95% είναι στο εύρος από 1,72 έως 14,36 g/l (Πίνακας 1).

Αυτί. 1. Κριτήριο για ανεξάρτητα δείγματα
(Οι ομάδες συγκρίνονται με βάση το επίπεδο αιμοσφαιρίνης)

Αυτό θα πρέπει να ερμηνευθεί ως εξής: σε ένα μέρος των ασθενών του γενικού πληθυσμού που λαμβάνουν ένα νέο φάρμακο, η αιμοσφαιρίνη θα είναι υψηλότερη κατά μέσο όρο κατά 1,72–14,36 g/l σε σχέση με αυτούς που έλαβαν ήδη γνωστό φάρμακο.

Με άλλα λόγια, στον γενικό πληθυσμό, η διαφορά στις μέσες τιμές της αιμοσφαιρίνης σε ομάδες με πιθανότητα 95% είναι εντός αυτών των ορίων. Εναπόκειται στον ερευνητή να κρίνει αν αυτό είναι πολύ ή λίγο. Το νόημα όλων αυτών είναι ότι δεν εργαζόμαστε με μια μέση τιμή, αλλά με ένα εύρος τιμών, επομένως, υπολογίζουμε πιο αξιόπιστα τη διαφορά σε μια παράμετρο μεταξύ των ομάδων.

Στα στατιστικά πακέτα, κατά την κρίση του ερευνητή, μπορεί κανείς να περιορίσει ή να διευρύνει ανεξάρτητα τα όρια του διαστήματος εμπιστοσύνης. Μειώνοντας τις πιθανότητες του διαστήματος εμπιστοσύνης, περιορίζουμε το εύρος των μέσων. Για παράδειγμα, στο 90% CI, το εύρος των μέσων (ή οι μέσες διαφορές) θα είναι μικρότερο από το 95% CI.

Αντίθετα, η αύξηση της πιθανότητας στο 99% διευρύνει το εύρος των τιμών. Κατά τη σύγκριση ομάδων, το κατώτερο όριο του CI μπορεί να υπερβεί το μηδέν. Για παράδειγμα, αν επεκτείναμε τα όρια του διαστήματος εμπιστοσύνης στο 99 %, τότε τα όρια του διαστήματος κυμαίνονταν από –1 έως 16 g/L. Αυτό σημαίνει ότι στον γενικό πληθυσμό υπάρχουν ομάδες, η διαφορά μεταξύ των μέσων όρων μεταξύ των οποίων για το υπό μελέτη χαρακτηριστικό είναι 0 (Μ=0).

Τα διαστήματα εμπιστοσύνης μπορούν να χρησιμοποιηθούν για τον έλεγχο στατιστικών υποθέσεων. Εάν το διάστημα εμπιστοσύνης διασχίζει τη μηδενική τιμή, τότε η μηδενική υπόθεση, η οποία προϋποθέτει ότι οι ομάδες δεν διαφέρουν στην υπό μελέτη παράμετρο, είναι αληθής. Ένα παράδειγμα περιγράφεται παραπάνω, όταν επεκτείναμε τα όρια στο 99%. Κάπου στον γενικό πληθυσμό, βρήκαμε ομάδες που δεν διέφεραν σε καμία περίπτωση.

95% διάστημα εμπιστοσύνης διαφοράς στην αιμοσφαιρίνη, (g/l)


Το σχήμα δείχνει το διάστημα εμπιστοσύνης 95% της μέσης διαφοράς αιμοσφαιρίνης μεταξύ των δύο ομάδων ως γραμμή. Η γραμμή περνά το μηδέν, επομένως, υπάρχει διαφορά μεταξύ των μέσων ίση με μηδέν, η οποία επιβεβαιώνει τη μηδενική υπόθεση ότι οι ομάδες δεν διαφέρουν. Η διαφορά μεταξύ των ομάδων κυμαίνεται από -2 έως 5 g/l, που σημαίνει ότι η αιμοσφαιρίνη μπορεί είτε να μειωθεί κατά 2 g/l είτε να αυξηθεί κατά 5 g/l.

Το διάστημα εμπιστοσύνης είναι ένας πολύ σημαντικός δείκτης. Χάρη σε αυτό, μπορείτε να δείτε αν οι διαφορές στις ομάδες οφείλονταν όντως στη διαφορά των μέσων ή σε ένα μεγάλο δείγμα, γιατί με ένα μεγάλο δείγμα, οι πιθανότητες να βρεθούν διαφορές είναι μεγαλύτερες από ό,τι με ένα μικρό.

Στην πράξη, μπορεί να μοιάζει με αυτό. Πήραμε δείγμα 1000 ατόμων, μετρήσαμε το επίπεδο αιμοσφαιρίνης και διαπιστώσαμε ότι το διάστημα εμπιστοσύνης για τη διαφορά των μέσων κυμαίνεται από 1,2 έως 1,5 g/L. Το επίπεδο στατιστικής σημασίας σε αυτή την περίπτωση σελ

Βλέπουμε ότι η συγκέντρωση της αιμοσφαιρίνης αυξήθηκε, αλλά σχεδόν ανεπαίσθητα, επομένως, η στατιστική σημασία εμφανίστηκε ακριβώς λόγω του μεγέθους του δείγματος.

Τα διαστήματα εμπιστοσύνης μπορούν να υπολογιστούν όχι μόνο για τους μέσους όρους, αλλά και για τις αναλογίες (και τους δείκτες κινδύνου). Για παράδειγμα, μας ενδιαφέρει το διάστημα εμπιστοσύνης των αναλογιών των ασθενών που πέτυχαν ύφεση ενώ έπαιρναν το φάρμακο που αναπτύχθηκε. Ας υποθέσουμε ότι το 95% CI για τις αναλογίες, δηλαδή για το ποσοστό τέτοιων ασθενών, είναι στην περιοχή 0,60–0,80. Έτσι, μπορούμε να πούμε ότι το φάρμακό μας έχει θεραπευτικό αποτέλεσμα στο 60 με 80% των περιπτώσεων.

Οποιοδήποτε δείγμα δίνει μόνο μια κατά προσέγγιση ιδέα του γενικού πληθυσμού και όλα τα στατιστικά χαρακτηριστικά του δείγματος (μέσος όρος, τρόπος, διακύμανση ...) είναι κάποια προσέγγιση ή ας πούμε μια εκτίμηση των γενικών παραμέτρων, η οποία στις περισσότερες περιπτώσεις δεν μπορεί να υπολογιστεί λόγω η απροσβασιμότητα του γενικού πληθυσμού (Εικόνα 20) .

Εικόνα 20. Σφάλμα δειγματοληψίας

Αλλά μπορείτε να καθορίσετε το διάστημα στο οποίο, με έναν ορισμένο βαθμό πιθανότητας, βρίσκεται η πραγματική (γενική) τιμή του στατιστικού χαρακτηριστικού. Αυτό το διάστημα ονομάζεται ρε διάστημα εμπιστοσύνης (CI).

Άρα ο γενικός μέσος όρος με πιθανότητα 95% βρίσκεται μέσα

από έως, (20)

όπου t - πίνακας τιμής κριτηρίου Student για α =0,05 και φά= n-1

Μπορεί να βρεθεί και 99% CI, σε αυτήν την περίπτωση t επιλεγμένο για α =0,01.

Ποια είναι η πρακτική σημασία ενός διαστήματος εμπιστοσύνης;

    Ένα μεγάλο διάστημα εμπιστοσύνης δείχνει ότι ο μέσος όρος του δείγματος δεν αντικατοπτρίζει με ακρίβεια τον μέσο όρο του πληθυσμού. Αυτό συνήθως οφείλεται σε ανεπαρκές μέγεθος δείγματος ή στην ετερογένειά του, δηλ. μεγάλη διασπορά. Και τα δύο δίνουν μεγάλο σφάλμα στη μέση τιμή και, κατά συνέπεια, ευρύτερο CI. Και αυτός είναι ο λόγος για να επιστρέψουμε στο στάδιο του ερευνητικού σχεδιασμού.

    Τα ανώτερα και κατώτερα όρια CI αξιολογούν εάν τα αποτελέσματα θα είναι κλινικά σημαντικά

Ας σταθούμε λεπτομερέστερα στο ζήτημα της στατιστικής και κλινικής σημασίας των αποτελεσμάτων της μελέτης των ιδιοτήτων της ομάδας. Υπενθυμίζεται ότι το καθήκον της στατιστικής είναι να ανιχνεύει τουλάχιστον κάποιες διαφορές στους γενικούς πληθυσμούς, με βάση τα δεδομένα του δείγματος. Είναι καθήκον του κλινικού γιατρού να βρει τέτοιες (όχι οποιεσδήποτε) διαφορές που θα βοηθήσουν στη διάγνωση ή τη θεραπεία. Και όχι πάντα τα στατιστικά συμπεράσματα αποτελούν τη βάση για κλινικά συμπεράσματα. Έτσι, μια στατιστικά σημαντική μείωση της αιμοσφαιρίνης κατά 3 g/l δεν αποτελεί λόγο ανησυχίας. Και, αντίστροφα, αν κάποιο πρόβλημα στο ανθρώπινο σώμα δεν έχει μαζικό χαρακτήρα σε επίπεδο ολόκληρου του πληθυσμού, αυτό δεν είναι λόγος να μην ασχοληθεί κανείς με αυτό το πρόβλημα.

Θα εξετάσουμε αυτή τη θέση σε παράδειγμα.

Οι ερευνητές αναρωτήθηκαν αν τα αγόρια που είχαν κάποιο είδος μολυσματικής νόσου υστερούσαν σε σχέση με τους συνομηλίκους τους στην ανάπτυξη. Για το σκοπό αυτό διεξήχθη επιλεκτική μελέτη, στην οποία συμμετείχαν 10 αγόρια που είχαν αυτή τη νόσο. Τα αποτελέσματα παρουσιάζονται στον πίνακα 23.

Πίνακας 23. Στατιστικά αποτελέσματα

κατώτερο όριο

ανώτατο όριο

Προδιαγραφές (cm)

Μέσης

Από αυτούς τους υπολογισμούς προκύπτει ότι το επιλεκτικό μέσο ύψος των 10χρονων αγοριών που είχαν κάποιο είδος λοιμώδους νόσου είναι κοντά στο φυσιολογικό (132,5 cm). Ωστόσο, το κατώτερο όριο του διαστήματος εμπιστοσύνης (126,6 cm) υποδηλώνει ότι υπάρχει 95% πιθανότητα το πραγματικό μέσο ύψος αυτών των παιδιών να αντιστοιχεί στην έννοια του «κοντού αναστήματος», δηλ. αυτά τα παιδιά έχουν καχυποψία.

Σε αυτό το παράδειγμα, τα αποτελέσματα των υπολογισμών του διαστήματος εμπιστοσύνης είναι κλινικά σημαντικά.

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΣΥΧΝΟΤΗΤΕΣ ΚΑΙ ΑΝΤΑΛΛΑΚΤΙΚΑ

© 2008

Εθνικό Ινστιτούτο Δημόσιας Υγείας, Όσλο, Νορβηγία

Το άρθρο περιγράφει και εξετάζει τον υπολογισμό των διαστημάτων εμπιστοσύνης για τις συχνότητες και τις αναλογίες χρησιμοποιώντας τις μεθόδους Wald, Wilson, Klopper-Pearson, χρησιμοποιώντας τον γωνιακό μετασχηματισμό και τη μέθοδο Wald με διόρθωση Agresti-Cowll. Το παρουσιαζόμενο υλικό παρέχει γενικές πληροφορίες σχετικά με μεθόδους υπολογισμού διαστημάτων εμπιστοσύνης για συχνότητες και αναλογίες και προορίζεται να προκαλέσει το ενδιαφέρον των αναγνωστών του περιοδικού όχι μόνο στη χρήση διαστημάτων εμπιστοσύνης κατά την παρουσίαση των αποτελεσμάτων της δικής τους έρευνας, αλλά και στην ανάγνωση εξειδικευμένης βιβλιογραφίας πριν την έναρξη εργαστεί σε μελλοντικές δημοσιεύσεις.

Λέξεις-κλειδιά: διάστημα εμπιστοσύνης, συχνότητα, αναλογία

Σε μία από τις προηγούμενες δημοσιεύσεις, αναφέρθηκε εν συντομία η περιγραφή των ποιοτικών δεδομένων και αναφέρθηκε ότι η εκτίμηση των διαστημάτων τους είναι προτιμότερη από μια σημειακή εκτίμηση για την περιγραφή της συχνότητας εμφάνισης του χαρακτηριστικού που μελετήθηκε στον γενικό πληθυσμό. Πράγματι, εφόσον οι μελέτες διεξάγονται με τη χρήση δειγματοληπτικών δεδομένων, η προβολή των αποτελεσμάτων στον γενικό πληθυσμό πρέπει να περιέχει ένα στοιχείο ανακρίβειας στην εκτίμηση του δείγματος. Το διάστημα εμπιστοσύνης είναι ένα μέτρο της ακρίβειας της εκτιμώμενης παραμέτρου. Είναι ενδιαφέρον ότι σε ορισμένα βιβλία σχετικά με τα βασικά στοιχεία της στατιστικής για τους γιατρούς, το θέμα των διαστημάτων εμπιστοσύνης για τις συχνότητες αγνοείται εντελώς. Σε αυτό το άρθρο, θα εξετάσουμε αρκετούς τρόπους για τον υπολογισμό των διαστημάτων εμπιστοσύνης για τις συχνότητες, υποθέτοντας χαρακτηριστικά δείγματος όπως η μη επανάληψη και η αντιπροσωπευτικότητα, καθώς και η ανεξαρτησία των παρατηρήσεων μεταξύ τους. Η συχνότητα σε αυτό το άρθρο δεν κατανοείται ως ένας απόλυτος αριθμός που δείχνει πόσες φορές αυτή ή εκείνη η τιμή εμφανίζεται συνολικά, αλλά μια σχετική τιμή που καθορίζει το ποσοστό των συμμετεχόντων στη μελέτη που έχουν το υπό μελέτη χαρακτηριστικό.

Στη βιοϊατρική έρευνα, χρησιμοποιούνται συχνότερα διαστήματα εμπιστοσύνης 95%. Αυτό το διάστημα εμπιστοσύνης είναι η περιοχή εντός της οποίας το πραγματικό ποσοστό πέφτει στο 95% των περιπτώσεων. Με άλλα λόγια, μπορεί να ειπωθεί με βεβαιότητα 95% ότι η πραγματική τιμή της συχνότητας εμφάνισης ενός χαρακτηριστικού στον γενικό πληθυσμό θα είναι εντός του διαστήματος εμπιστοσύνης 95%.

Τα περισσότερα στατιστικά εγχειρίδια για ιατρικούς ερευνητές αναφέρουν ότι το σφάλμα συχνότητας υπολογίζεται χρησιμοποιώντας τον τύπο

όπου p είναι η συχνότητα εμφάνισης του χαρακτηριστικού στο δείγμα (τιμή από 0 έως 1). Στα περισσότερα εγχώρια επιστημονικά άρθρα, υποδεικνύεται η τιμή της συχνότητας εμφάνισης ενός χαρακτηριστικού στο δείγμα (p), καθώς και το σφάλμα (s) του με τη μορφή p ± s. Ωστόσο, είναι πιο σκόπιμο να παρουσιαστεί ένα διάστημα εμπιστοσύνης 95% για τη συχνότητα εμφάνισης ενός χαρακτηριστικού στον γενικό πληθυσμό, το οποίο θα περιλαμβάνει τιμές από

πριν.

Σε ορισμένα σχολικά βιβλία, για μικρά δείγματα, συνιστάται η αντικατάσταση της τιμής του 1,96 με την τιμή του t για N - 1 βαθμούς ελευθερίας, όπου N είναι ο αριθμός των παρατηρήσεων στο δείγμα. Η τιμή του t βρίσκεται στους πίνακες για την κατανομή t, οι οποίοι είναι διαθέσιμοι σχεδόν σε όλα τα εγχειρίδια στατιστικής. Η χρήση της κατανομής του t για τη μέθοδο Wald δεν παρέχει ορατά πλεονεκτήματα σε σχέση με άλλες μεθόδους που συζητούνται παρακάτω, και επομένως δεν είναι ευπρόσδεκτη από ορισμένους συγγραφείς.

Η παραπάνω μέθοδος για τον υπολογισμό των διαστημάτων εμπιστοσύνης για τις συχνότητες ή τα κλάσματα πήρε το όνομά της από τον Abraham Wald (Abraham Wald, 1902–1950), αφού άρχισε να χρησιμοποιείται ευρέως μετά τη δημοσίευση των Wald και Wolfowitz το 1939. Ωστόσο, η ίδια η μέθοδος προτάθηκε από τον Pierre Simon Laplace (1749–1827) ήδη από το 1812.

Η μέθοδος Wald είναι πολύ δημοφιλής, αλλά η εφαρμογή της συνδέεται με σημαντικά προβλήματα. Η μέθοδος δεν συνιστάται για μικρά μεγέθη δειγμάτων, καθώς και σε περιπτώσεις όπου η συχνότητα εμφάνισης ενός χαρακτηριστικού τείνει στο 0 ή 1 (0% ή 100%) και απλά δεν είναι δυνατή για συχνότητες 0 και 1. Επιπλέον, η προσέγγιση της κανονικής κατανομής, η οποία χρησιμοποιείται κατά τον υπολογισμό του σφάλματος , "δεν λειτουργεί" σε περιπτώσεις όπου n p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.



όπου παίρνει την τιμή 1,96 κατά τον υπολογισμό του διαστήματος εμπιστοσύνης 95%, N είναι ο αριθμός των παρατηρήσεων και p είναι η συχνότητα του χαρακτηριστικού στο δείγμα. Αυτή η μέθοδος είναι διαθέσιμη σε ηλεκτρονικές αριθμομηχανές, επομένως η εφαρμογή της δεν είναι προβληματική. και δεν συνιστούμε τη χρήση αυτής της μεθόδου για n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Εκτός από τη μέθοδο Wilson, η μέθοδος Wald διορθωμένη με Agresti–Caull πιστεύεται επίσης ότι παρέχει μια βέλτιστη εκτίμηση του διαστήματος εμπιστοσύνης για τις συχνότητες. Η διόρθωση Agresti-Coulle είναι μια αντικατάσταση στον τύπο Wald για τη συχνότητα εμφάνισης ενός χαρακτηριστικού στο δείγμα (p) με p», κατά τον υπολογισμό του οποίου 2 προστίθεται στον αριθμητή και 4 προστίθεται στον παρονομαστή, δηλαδή , p` = (X + 2) / (N + 4), όπου X είναι ο αριθμός των συμμετεχόντων στη μελέτη που έχουν το υπό μελέτη χαρακτηριστικό και N είναι το μέγεθος του δείγματος. Αυτή η τροποποίηση παράγει αποτελέσματα πολύ παρόμοια με εκείνα του τύπου Wilson, εκτός εάν το ποσοστό συμβάντων πλησιάζει το 0% ή το 100% και το δείγμα είναι μικρό. Εκτός από τις παραπάνω μεθόδους για τον υπολογισμό των διαστημάτων εμπιστοσύνης για τις συχνότητες, έχουν προταθεί διορθώσεις συνέχειας τόσο για τη μέθοδο Wald όσο και για τη μέθοδο Wilson για μικρά δείγματα, αλλά μελέτες έχουν δείξει ότι η χρήση τους είναι ακατάλληλη.

Εξετάστε την εφαρμογή των παραπάνω μεθόδων για τον υπολογισμό των διαστημάτων εμπιστοσύνης χρησιμοποιώντας δύο παραδείγματα. Στην πρώτη περίπτωση, μελετάμε ένα μεγάλο δείγμα 1.000 τυχαία επιλεγμένων συμμετεχόντων στη μελέτη, εκ των οποίων οι 450 έχουν το υπό μελέτη χαρακτηριστικό (είτε είναι παράγοντας κινδύνου, αποτέλεσμα ή οποιοδήποτε άλλο χαρακτηριστικό), που είναι συχνότητα 0,45 ή 45%. Στη δεύτερη περίπτωση, η μελέτη διεξάγεται χρησιμοποιώντας ένα μικρό δείγμα, ας πούμε, μόνο 20 άτομα, και μόνο 1 συμμετέχων στη μελέτη (5%) έχει το υπό μελέτη χαρακτηριστικό. Τα διαστήματα εμπιστοσύνης για τη μέθοδο Wald, για τη μέθοδο Wald με διόρθωση Agresti-Coll, για τη μέθοδο Wilson υπολογίστηκαν χρησιμοποιώντας μια ηλεκτρονική αριθμομηχανή που αναπτύχθηκε από τον Jeff Sauro (http://www./wald.htm). Τα διαστήματα εμπιστοσύνης Wilson διορθωμένα ως προς τη συνέχεια υπολογίστηκαν χρησιμοποιώντας την αριθμομηχανή που παρέχεται από το Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Οι υπολογισμοί με τη χρήση του γωνιακού μετασχηματισμού Fisher πραγματοποιήθηκαν «χειροκίνητα» χρησιμοποιώντας την κρίσιμη τιμή του t για 19 και 999 βαθμούς ελευθερίας, αντίστοιχα. Τα αποτελέσματα των υπολογισμών παρουσιάζονται στον πίνακα και για τα δύο παραδείγματα.

Τα διαστήματα εμπιστοσύνης υπολογίζονται με έξι διαφορετικούς τρόπους για τα δύο παραδείγματα που περιγράφονται στο κείμενο

Μέθοδος υπολογισμού διαστήματος εμπιστοσύνης

P=0,0500 ή 5%

95% CI για X=450, N=1000, P=0,4500 ή 45%

–0,0455–0,2541

Walda με διόρθωση Agresti-Coll

<,0001–0,2541

Wilson με διόρθωση συνέχειας

Η «ακριβής μέθοδος» των Klopper-Pearson

Γωνιακός μετασχηματισμός

<0,0001–0,1967

Όπως φαίνεται από τον πίνακα, για το πρώτο παράδειγμα, το διάστημα εμπιστοσύνης που υπολογίζεται με τη "γενικά αποδεκτή" μέθοδο Wald πηγαίνει στην αρνητική περιοχή, κάτι που δεν μπορεί να ισχύει για τις συχνότητες. Δυστυχώς, τέτοια περιστατικά δεν είναι ασυνήθιστα στη ρωσική λογοτεχνία. Ο παραδοσιακός τρόπος αναπαράστασης δεδομένων ως συχνότητας και το σφάλμα τους καλύπτει εν μέρει αυτό το πρόβλημα. Για παράδειγμα, εάν η συχνότητα εμφάνισης ενός χαρακτηριστικού (σε ποσοστό) παρουσιάζεται ως 2,1 ± 1,4, τότε αυτό δεν είναι τόσο "ερεθιστικό" όσο το 2,1% (95% CI: –0,7; 4,9), αν και σημαίνει το ίδιο. Η μέθοδος Wald με τη διόρθωση Agresti-Coulle και ο υπολογισμός με τη χρήση του γωνιακού μετασχηματισμού δίνουν ένα κατώτερο όριο που τείνει στο μηδέν. Η μέθοδος Wilson με διόρθωση συνέχειας και η «ακριβής μέθοδος» δίνουν μεγαλύτερα διαστήματα εμπιστοσύνης από τη μέθοδο Wilson. Για το δεύτερο παράδειγμα, όλες οι μέθοδοι δίνουν περίπου τα ίδια διαστήματα εμπιστοσύνης (οι διαφορές εμφανίζονται μόνο σε χιλιοστά), κάτι που δεν προκαλεί έκπληξη, καθώς η συχνότητα του συμβάντος σε αυτό το παράδειγμα δεν διαφέρει πολύ από 50% και το μέγεθος του δείγματος είναι αρκετά μεγάλο .

Για τους αναγνώστες που ενδιαφέρονται για αυτό το πρόβλημα, μπορούμε να προτείνουμε τα έργα των R. G. Newcombe και Brown, Cai και Dasgupta, τα οποία δίνουν τα πλεονεκτήματα και τα μειονεκτήματα της χρήσης 7 και 10 διαφορετικών μεθόδων για τον υπολογισμό των διαστημάτων εμπιστοσύνης, αντίστοιχα. Από εγχώρια εγχειρίδια, το βιβλίο και προτείνεται, στο οποίο, εκτός από μια λεπτομερή περιγραφή της θεωρίας, παρουσιάζονται οι μέθοδοι Wald και Wilson, καθώς και μια μέθοδος υπολογισμού των διαστημάτων εμπιστοσύνης, λαμβάνοντας υπόψη τη διωνυμική κατανομή συχνοτήτων. Εκτός από τις δωρεάν ηλεκτρονικές αριθμομηχανές (http://www./wald.htm και http://faculty.vassar.edu/lowry/prop1.html), τα διαστήματα εμπιστοσύνης για τις συχνότητες (και όχι μόνο!) μπορούν να υπολογιστούν χρησιμοποιώντας το Πρόγραμμα CIA ( Ανάλυση Διαστημάτων Εμπιστοσύνης), το οποίο μπορείτε να κατεβάσετε από τη διεύθυνση http://www. ιατρική Σχολή. σώτον. μετα Χριστον. uk/cia/ .

Το επόμενο άρθρο θα εξετάσει μονομεταβλητούς τρόπους σύγκρισης ποιοτικών δεδομένων.

Βιβλιογραφία

Μπάνερτζι Α.Ιατρικές στατιστικές σε απλή γλώσσα: ένα εισαγωγικό μάθημα / A. Banerzhi. - Μ. : Πρακτική ιατρική, 2007. - 287 σελ. Ιατρικές στατιστικές / . - Μ. : Πρακτορείο Ιατρικών Πληροφοριών, 2007. - 475 σελ. Γκλανζ Σ.Ιατροβιολογική στατιστική / S. Glants. - Μ. : Πρακτική, 1998. Τύποι δεδομένων, επαλήθευση διανομής και περιγραφικές στατιστικές / // Ανθρώπινη Οικολογία - 2008. - Αρ. 1. - Σελ. 52–58. Zhizhin K.S.. Ιατρικές στατιστικές: σχολικό βιβλίο / . - Rostov n / D: Phoenix, 2007. - 160 p. Εφαρμοσμένη Ιατρική Στατιστική / , . - Αγία Πετρούπολη. : Folio, 2003. - 428 σελ. Lakin G. F. Βιομετρικά / . - Μ. : Ανώτερο σχολείο, 1990. - 350 σελ. Γιατρός V. A. Μαθηματική στατιστική στην ιατρική / , . - Μ. : Οικονομικά και στατιστική, 2007. - 798 σελ. Μαθηματική στατιστική στην κλινική έρευνα / , . - Μ. : GEOTAR-MED, 2001. - 256 σελ. Junkerov V. Και. Ιατροστατιστική επεξεργασία δεδομένων ιατρικής έρευνας /,. - Αγία Πετρούπολη. : VmedA, 2002. - 266 σελ. Αγρέστη Α.Η κατά προσέγγιση είναι καλύτερη από την ακριβή για την εκτίμηση διαστήματος των διωνυμικών αναλογιών / A. Agresti, B. Coull // Αμερικανός στατιστικολόγος. - 1998. - Ν 52. - Σ. 119-126. Άλτμαν Δ.Στατιστικά στοιχεία με σιγουριά // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - Λονδίνο: BMJ Books, 2000. - 240 σελ. Brown L.D.Εκτίμηση διαστήματος για διωνυμική αναλογία / L. D. Brown, T. T. Cai, A. Dasgupta // Στατιστική επιστήμη. - 2001. - Ν 2. - Σ. 101-133. Clopper C.J.Η χρήση της εμπιστοσύνης ή των πιστών ορίων που απεικονίζονται στην περίπτωση του διωνύμου / C. J. Clopper, E. S. Pearson // Biometrika. - 1934. - Ν 26. - Σ. 404-413. Garcia-Perez M.A. Σχετικά με το διάστημα εμπιστοσύνης για τη διωνυμική παράμετρο / M. A. Garcia-Perez // Ποιότητα και ποσότητα. - 2005. - Ν 39. - Σ. 467-481. Μοτούλσκι Χ.Διαισθητική βιοστατιστική // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 p. Newcombe R.G.Διαστήματα εμπιστοσύνης δύο όψεων για τη μοναδική αναλογία: Σύγκριση επτά μεθόδων / R. G. Newcombe // Statistics in Medicine. - 1998. - Ν. 17. - Σ. 857–872. Σάουρο Τζ.Εκτίμηση των ρυθμών ολοκλήρωσης από μικρά δείγματα με χρήση διωνυμικών διαστημάτων εμπιστοσύνης: συγκρίσεις και συστάσεις / J. Sauro, J. R. Lewis // Ετήσια συνάντηση της εταιρείας Proceedings of the human factor and ergonomics society. – Ορλάντο, Φλόριντα, 2005. Wald A.Όρια εμπιστοσύνης για συναρτήσεις συνεχούς διανομής // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - Ν 10. - Σελ. 105–118. Wilson E. B. Πιθανό συμπέρασμα, ο νόμος της διαδοχής και το στατιστικό συμπέρασμα / E. B. Wilson // Journal of American Statistical Association. - 1927. - Ν 22. - Σ. 209-212.

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΑΝΑΛΟΓΙΑ

ΕΝΑ. Μ. Γκριμπόφσκι

Εθνικό Ινστιτούτο Δημόσιας Υγείας, Όσλο, Νορβηγία

Το άρθρο παρουσιάζει διάφορες μεθόδους για υπολογισμούς διαστημάτων εμπιστοσύνης για διωνυμικές αναλογίες, συγκεκριμένα, μεθόδους Wald, Wilson, arcsine, Agresti-Coull και ακριβείς Clopper-Pearson. Η εργασία δίνει μόνο γενική εισαγωγή στο πρόβλημα της εκτίμησης του διαστήματος εμπιστοσύνης μιας διωνυμικής αναλογίας και στόχος της δεν είναι μόνο να παρακινήσει τους αναγνώστες να χρησιμοποιούν διαστήματα εμπιστοσύνης κατά την παρουσίαση των αποτελεσμάτων των δικών τους διαστημάτων εμπειρικής έρευνας, αλλά και να τους ενθαρρύνει να συμβουλεύονται τα βιβλία στατιστικής πριν. για την ανάλυση των δεδομένων και την προετοιμασία χειρογράφων.

λέξεις-κλειδιά: διάστημα εμπιστοσύνης, αναλογία

Στοιχεία επικοινωνίας:

Ανώτερος Σύμβουλος, Εθνικό Ινστιτούτο Δημόσιας Υγείας, Όσλο, Νορβηγία

Στις προηγούμενες υποενότητες εξετάσαμε το ζήτημα της εκτίμησης της άγνωστης παραμέτρου έναένας αριθμός. Μια τέτοια αξιολόγηση ονομάζεται "σημείο". Σε μια σειρά εργασιών, απαιτείται όχι μόνο η εύρεση της παραμέτρου ένακατάλληλη αριθμητική τιμή, αλλά και να αξιολογήσει την ακρίβεια και την αξιοπιστία της. Απαιτείται να γνωρίζουμε ποια σφάλματα μπορεί να οδηγήσει η αντικατάσταση παραμέτρων ένασημειακή του εκτίμηση ένακαι με ποιο βαθμό εμπιστοσύνης μπορούμε να περιμένουμε ότι αυτά τα σφάλματα δεν θα υπερβούν τα γνωστά όρια;

Προβλήματα αυτού του είδους είναι ιδιαίτερα σημαντικά για έναν μικρό αριθμό παρατηρήσεων, όταν η σημειακή εκτίμηση και στοείναι σε μεγάλο βαθμό τυχαία και μια κατά προσέγγιση αντικατάσταση του a από το a μπορεί να οδηγήσει σε σοβαρά σφάλματα.

Για να δώσετε μια ιδέα για την ακρίβεια και την αξιοπιστία της εκτίμησης ένα,

στη μαθηματική στατιστική, χρησιμοποιούνται τα λεγόμενα διαστήματα εμπιστοσύνης και οι πιθανότητες εμπιστοσύνης.

Αφήστε για την παράμετρο έναπροέρχεται από αμερόληπτη εκτίμηση της εμπειρίας ένα.Θέλουμε να εκτιμήσουμε το πιθανό σφάλμα σε αυτή την περίπτωση. Ας αντιστοιχίσουμε κάποια αρκετά μεγάλη πιθανότητα p (για παράδειγμα, p = 0,9, 0,95 ή 0,99) έτσι ώστε ένα γεγονός με πιθανότητα p να μπορεί να θεωρηθεί πρακτικά βέβαιο και να βρούμε μια τιμή του s για το οποίο

Στη συνέχεια, το εύρος των πρακτικά δυνατών τιμών του σφάλματος που προκύπτει κατά την αντικατάσταση έναστο ένα, θα είναι ± s; μεγάλα απόλυτα σφάλματα θα εμφανίζονται μόνο με μικρή πιθανότητα a = 1 - p. Ας ξαναγράψουμε το (14.3.1) ως εξής:

Ισότητα (14.3.2) σημαίνει ότι με πιθανότητα p η άγνωστη τιμή της παραμέτρου έναεμπίπτει στο διάστημα

Σε αυτή την περίπτωση, πρέπει να σημειωθεί μια περίσταση. Προηγουμένως, θεωρούσαμε επανειλημμένα την πιθανότητα μια τυχαία μεταβλητή να πέσει σε ένα δεδομένο μη τυχαίο διάστημα. Εδώ η κατάσταση είναι διαφορετική: έναόχι τυχαίο, αλλά τυχαίο διάστημα / r. Τυχαία η θέση του στον άξονα x, που καθορίζεται από το κέντρο του ένα; γενικά, το μήκος του διαστήματος 2s είναι επίσης τυχαίο, αφού η τιμή του s υπολογίζεται, κατά κανόνα, από πειραματικά δεδομένα. Επομένως, σε αυτήν την περίπτωση, θα ήταν καλύτερο να ερμηνεύσουμε την τιμή του p όχι ως την πιθανότητα να "χτυπήσουμε" το σημείο έναστο διάστημα / p, αλλά ως η πιθανότητα ότι ένα τυχαίο διάστημα / p θα καλύψει το σημείο ένα(Εικ. 14.3.1).

Ρύζι. 14.3.1

Η πιθανότητα p ονομάζεται επίπεδο αυτοπεποίθησης, και το διάστημα / p - διάστημα εμπιστοσύνης.Όρια διαστημάτων αν. a x \u003d a- s και a 2 = a +και καλούνται όρια εμπιστοσύνης.

Ας δώσουμε μια ακόμη ερμηνεία στην έννοια του διαστήματος εμπιστοσύνης: μπορεί να θεωρηθεί ως ένα διάστημα τιμών παραμέτρων ένα,συμβατό με πειραματικά δεδομένα και δεν έρχεται σε αντίθεση με αυτά. Πράγματι, εάν συμφωνήσουμε να θεωρήσουμε ένα γεγονός με πιθανότητα a = 1-p πρακτικά αδύνατο, τότε αυτές οι τιμές της παραμέτρου a για τις οποίες α - α> s πρέπει να αναγνωριστεί ότι έρχεται σε αντίθεση με τα πειραματικά δεδομένα και αυτά για τα οποία |a - ένα a t na 2 .

Αφήστε για την παράμετρο έναυπάρχει μια αμερόληπτη εκτίμηση ένα.Αν γνωρίζαμε τον νόμο κατανομής της ποσότητας ένα, το πρόβλημα της εύρεσης του διαστήματος εμπιστοσύνης θα ήταν αρκετά απλό: θα αρκούσε να βρεθεί μια τιμή του s για την οποία

Η δυσκολία έγκειται στο γεγονός ότι ο νόμος κατανομής της εκτίμησης έναεξαρτάται από τον νόμο κατανομής της ποσότητας Χκαι, κατά συνέπεια, στις άγνωστες παραμέτρους του (ιδίως στην ίδια την παράμετρο ένα).

Για να ξεπεραστεί αυτή η δυσκολία, μπορεί κανείς να εφαρμόσει το ακόλουθο κατά προσέγγιση κόλπο: αντικαταστήστε τις άγνωστες παραμέτρους στην έκφραση για το s με τις σημειακές εκτιμήσεις τους. Με σχετικά μεγάλο αριθμό πειραμάτων Π(περίπου 20 ... 30) αυτή η τεχνική συνήθως δίνει ικανοποιητικά αποτελέσματα όσον αφορά την ακρίβεια.

Ως παράδειγμα, εξετάστε το πρόβλημα του διαστήματος εμπιστοσύνης για τη μαθηματική προσδοκία.

Αφήστε να παραχθεί Π Χ,των οποίων τα χαρακτηριστικά είναι η μαθηματική προσδοκία tκαι διακύμανση ρε- άγνωστο. Για αυτές τις παραμέτρους προέκυψαν οι ακόλουθες εκτιμήσεις:

Απαιτείται η οικοδόμηση ενός διαστήματος εμπιστοσύνης / р, που αντιστοιχεί στην πιθανότητα εμπιστοσύνης р, για τη μαθηματική προσδοκία tποσότητες Χ.

Για την επίλυση αυτού του προβλήματος, χρησιμοποιούμε το γεγονός ότι η ποσότητα tείναι το άθροισμα Πανεξάρτητες πανομοιότυπα κατανεμημένες τυχαίες μεταβλητές X hκαι σύμφωνα με το κεντρικό οριακό θεώρημα για αρκετά μεγάλο Πο νόμος κατανομής του είναι κοντά στο κανονικό. Στην πράξη, ακόμη και με έναν σχετικά μικρό αριθμό όρων (της τάξης των 10 ... 20), ο νόμος κατανομής του αθροίσματος μπορεί να θεωρηθεί περίπου κανονικός. Θα υποθέσουμε ότι η τιμή tκατανέμονται σύμφωνα με τον κανονικό νόμο. Τα χαρακτηριστικά αυτού του νόμου - η μαθηματική προσδοκία και η διακύμανση - είναι ίσα, αντίστοιχα tκαι

(βλ. κεφάλαιο 13 υποενότητα 13.3). Ας υποθέσουμε ότι η τιμή ρεμας είναι γνωστό και θα βρούμε τέτοια τιμή Ep για την οποία

Εφαρμόζοντας τον τύπο (6.3.5) του κεφαλαίου 6, εκφράζουμε την πιθανότητα στην αριστερή πλευρά του (14.3.5) ως προς τη συνάρτηση κανονικής κατανομής

όπου είναι η τυπική απόκλιση της εκτίμησης t.

Από την εξίσωση

βρείτε την τιμή S:

όπου arg Ф* (x) είναι η αντίστροφη συνάρτηση του Ф* (Χ),εκείνοι. μια τέτοια τιμή του ορίσματος για το οποίο η συνάρτηση κανονικής κατανομής είναι ίση με Χ.

Διασπορά ΡΕ,μέσω του οποίου εκφράζεται η τιμή ένα 1P, δεν γνωρίζουμε ακριβώς? ως κατά προσέγγιση τιμή του, μπορείτε να χρησιμοποιήσετε την εκτίμηση ρε(14.3.4) και βάλτε περίπου:

Έτσι, το πρόβλημα της κατασκευής ενός διαστήματος εμπιστοσύνης λύνεται κατά προσέγγιση, το οποίο ισούται με:

όπου το gp ορίζεται από τον τύπο (14.3.7).

Προκειμένου να αποφευχθεί η αντίστροφη παρεμβολή στους πίνακες της συνάρτησης Ф * (l) κατά τον υπολογισμό του s p, είναι βολικό να συντάσσεται ένας ειδικός πίνακας (Πίνακας 14.3.1), ο οποίος παραθέτει τις τιμές της ποσότητας

ανάλογα με το r. Η τιμή (p καθορίζει για τον κανονικό νόμο τον αριθμό των τυπικών αποκλίσεων που πρέπει να παραμεριστούν δεξιά και αριστερά του κέντρου διασποράς έτσι ώστε η πιθανότητα πτώσης στην προκύπτουσα περιοχή να είναι ίση με p.

Μέσω της τιμής του 7 p, το διάστημα εμπιστοσύνης εκφράζεται ως:

Πίνακας 14.3.1

Παράδειγμα 1. Διεξήχθησαν 20 πειράματα στην τιμή Χ;τα αποτελέσματα φαίνονται στον πίνακα. 14.3.2.

Πίνακας 14.3.2

Απαιτείται να βρεθεί μια εκτίμηση για τη μαθηματική προσδοκία της ποσότητας Χκαι κατασκευάστε ένα διάστημα εμπιστοσύνης που αντιστοιχεί σε επίπεδο εμπιστοσύνης p = 0,8.

Λύση.Εχουμε:

Επιλέγοντας για την αρχή n: = 10, σύμφωνα με τον τρίτο τύπο (14.2.14) βρίσκουμε την αμερόληπτη εκτίμηση ρε :

Σύμφωνα με τον πίνακα 14.3.1 βρίσκουμε

Όρια εμπιστοσύνης:

Διάστημα εμπιστοσύνης:

Τιμές παραμέτρων t,που βρίσκονται σε αυτό το διάστημα είναι συμβατά με τα πειραματικά δεδομένα που δίνονται στον πίνακα. 14.3.2.

Με παρόμοιο τρόπο, μπορεί να κατασκευαστεί ένα διάστημα εμπιστοσύνης για τη διακύμανση.

Αφήστε να παραχθεί Πανεξάρτητα πειράματα σε μια τυχαία μεταβλητή Χμε άγνωστες παραμέτρους από και A, και για τη διακύμανση ρελαμβάνεται η αμερόληπτη εκτίμηση:

Απαιτείται να δημιουργηθεί περίπου ένα διάστημα εμπιστοσύνης για τη διακύμανση.

Από τον τύπο (14.3.11) φαίνεται ότι η τιμή ρεαντιπροσωπεύει

ποσό Πτυχαίες μεταβλητές της φόρμας . Αυτές οι αξίες δεν είναι

ανεξάρτητο, αφού οποιοδήποτε από αυτά περιλαμβάνει την ποσότητα t,εξαρτάται από όλους τους άλλους. Ωστόσο, μπορεί να αποδειχθεί ότι όπως Πο νόμος κατανομής του αθροίσματος τους είναι επίσης κοντά στο κανονικό. Σχεδόν στο Π= 20...30 μπορεί ήδη να θεωρηθεί φυσιολογικό.

Ας υποθέσουμε ότι είναι έτσι και να βρούμε τα χαρακτηριστικά αυτού του νόμου: τη μαθηματική προσδοκία και τη διακύμανση. Από το σκορ ρε- αμερόληπτο, λοιπόν Μ[Δ] = Δ.

Υπολογισμός Διακύμανσης Δ Δσχετίζεται με σχετικά σύνθετους υπολογισμούς, επομένως δίνουμε την έκφρασή του χωρίς παράγωγο:

όπου c 4 - η τέταρτη κεντρική ροπή της ποσότητας Χ.

Για να χρησιμοποιήσετε αυτήν την έκφραση, πρέπει να αντικαταστήσετε σε αυτήν τις τιμές των 4 και ρε(τουλάχιστον κατά προσέγγιση). Αντί ρεμπορείτε να χρησιμοποιήσετε την αξιολόγηση ΡΕ.Κατ 'αρχήν, η τέταρτη κεντρική στιγμή μπορεί επίσης να αντικατασταθεί από την εκτίμησή της, για παράδειγμα, από μια τιμή της μορφής:

αλλά μια τέτοια αντικατάσταση θα δώσει εξαιρετικά χαμηλή ακρίβεια, αφού γενικά, με περιορισμένο αριθμό πειραμάτων, οι ροπές υψηλής τάξης προσδιορίζονται με μεγάλα σφάλματα. Ωστόσο, στην πράξη συμβαίνει συχνά ότι η μορφή του νόμου κατανομής της ποσότητας Χγνωστό εκ των προτέρων: μόνο οι παράμετροί του είναι άγνωστες. Τότε μπορούμε να προσπαθήσουμε να εκφράσουμε το u4 με όρους ΡΕ.

Ας πάρουμε την πιο συνηθισμένη περίπτωση, όταν η τιμή Χκατανέμονται σύμφωνα με τον κανονικό νόμο. Τότε η τέταρτη κεντρική ροπή του εκφράζεται ως προς τη διακύμανση (βλ. Κεφάλαιο 6 Υποενότητα 6.2).

και ο τύπος (14.3.12) δίνει ή

Αντικατάσταση στην (14.3.14) του αγνώστου ρετην εκτίμησή του ρε, παίρνουμε: από πού

Η στιγμή u 4 μπορεί να εκφραστεί με όρους ρεκαι σε κάποιες άλλες περιπτώσεις, όταν η διανομή της ποσότητας Χδεν είναι φυσιολογικό, αλλά η εμφάνισή του είναι γνωστή. Για παράδειγμα, για το νόμο της ομοιόμορφης πυκνότητας (βλ. Κεφάλαιο 5) έχουμε:

όπου (a, P) είναι το διάστημα στο οποίο δίνεται ο νόμος.

Συνεπώς,

Σύμφωνα με τον τύπο (14.3.12) παίρνουμε: από όπου βρίσκουμε περίπου

Σε περιπτώσεις όπου η μορφή του νόμου κατανομής της τιμής του 26 είναι άγνωστη, κατά την εκτίμηση της τιμής του α /) εξακολουθεί να συνιστάται η χρήση του τύπου (14.3.16), εάν δεν υπάρχουν ειδικοί λόγοι να πιστεύουμε ότι αυτό ο νόμος είναι πολύ διαφορετικός από τον κανονικό (έχει αισθητή θετική ή αρνητική κύρτωση) .

Εάν η κατά προσέγγιση τιμή του a /) ληφθεί με τον ένα ή τον άλλο τρόπο, τότε είναι δυνατό να κατασκευαστεί ένα διάστημα εμπιστοσύνης για τη διακύμανση με τον ίδιο τρόπο όπως το δημιουργήσαμε για τη μαθηματική προσδοκία:

όπου η τιμή ανάλογα με τη δεδομένη πιθανότητα p βρίσκεται στον Πίνακα. 14.3.1.

Παράδειγμα 2. Βρείτε ένα διάστημα εμπιστοσύνης περίπου 80% για τη διακύμανση μιας τυχαίας μεταβλητής Χυπό τις συνθήκες του παραδείγματος 1, εάν είναι γνωστό ότι η τιμή Χδιανέμονται σύμφωνα με νόμο κοντά στο κανονικό.

Λύση.Η τιμή παραμένει η ίδια όπως στον Πίνακα. 14.3.1:

Σύμφωνα με τον τύπο (14.3.16)

Σύμφωνα με τον τύπο (14.3.18) βρίσκουμε το διάστημα εμπιστοσύνης:

Το αντίστοιχο εύρος τιμών της τυπικής απόκλισης: (0,21; 0,29).

14.4. Ακριβείς μέθοδοι για την κατασκευή διαστημάτων εμπιστοσύνης για τις παραμέτρους μιας τυχαίας μεταβλητής που κατανέμονται σύμφωνα με τον κανονικό νόμο

Στην προηγούμενη υποενότητα, εξετάσαμε κατά προσέγγιση μεθόδους για την κατασκευή διαστημάτων εμπιστοσύνης για το μέσο όρο και τη διακύμανση. Εδώ δίνουμε μια ιδέα για τις ακριβείς μεθόδους για την επίλυση του ίδιου προβλήματος. Τονίζουμε ότι για να βρούμε με ακρίβεια τα διαστήματα εμπιστοσύνης είναι απολύτως απαραίτητο να γνωρίζουμε εκ των προτέρων τη μορφή του νόμου κατανομής της ποσότητας Χ,λαμβάνοντας υπόψη ότι αυτό δεν είναι απαραίτητο για την εφαρμογή κατά προσέγγιση μεθόδων.

Η ιδέα των ακριβών μεθόδων για την κατασκευή διαστημάτων εμπιστοσύνης είναι η εξής. Οποιοδήποτε διάστημα εμπιστοσύνης βρίσκεται από τη συνθήκη που εκφράζει την πιθανότητα εκπλήρωσης κάποιων ανισοτήτων, οι οποίες περιλαμβάνουν την εκτίμηση του ενδιαφέροντος για εμάς ένα.Νόμος κατανομής βαθμών έναστη γενική περίπτωση εξαρτάται από τις άγνωστες παραμέτρους της ποσότητας Χ.Ωστόσο, μερικές φορές είναι δυνατό να περάσει σε ανισότητες από μια τυχαία μεταβλητή ένασε κάποια άλλη συνάρτηση παρατηρούμενων τιμών X p X 2, ..., Χ σελ.ο νόμος κατανομής του οποίου δεν εξαρτάται από άγνωστες παραμέτρους, αλλά εξαρτάται μόνο από τον αριθμό των πειραμάτων και από τη μορφή του νόμου κατανομής της ποσότητας Χ.Τυχαίες μεταβλητές αυτού του είδους παίζουν μεγάλο ρόλο στις μαθηματικές στατιστικές. έχουν μελετηθεί λεπτομερέστερα για την περίπτωση κανονικής κατανομής της ποσότητας Χ.

Για παράδειγμα, έχει αποδειχθεί ότι υπό κανονική κατανομή της ποσότητας Χτυχαία τιμή

υπόκειται στο λεγόμενο Νόμος διανομής μαθητώνΜε Π- 1 βαθμός ελευθερίας η πυκνότητα αυτού του νόμου έχει τη μορφή

όπου G(x) είναι η γνωστή συνάρτηση γάμμα:

Αποδεικνύεται επίσης ότι η τυχαία μεταβλητή

έχει "κατανομή % 2" με Π- 1 βαθμός ελευθερίας (βλ. κεφάλαιο 7), η πυκνότητα του οποίου εκφράζεται με τον τύπο

Χωρίς να σταθούμε στις παραγώγους των κατανομών (14.4.2) και (14.4.4), θα δείξουμε πώς μπορούν να εφαρμοστούν κατά την κατασκευή διαστημάτων εμπιστοσύνης για τις παραμέτρους Ty D .

Αφήστε να παραχθεί Πανεξάρτητα πειράματα σε μια τυχαία μεταβλητή Χ,κατανέμεται σύμφωνα με τον κανονικό νόμο με άγνωστες παραμέτρους TIO.Για αυτές τις παραμέτρους, εκτιμήσεις

Απαιτείται η κατασκευή διαστημάτων εμπιστοσύνης και για τις δύο παραμέτρους που αντιστοιχούν στην πιθανότητα εμπιστοσύνης p.

Ας κατασκευάσουμε πρώτα ένα διάστημα εμπιστοσύνης για τη μαθηματική προσδοκία. Είναι φυσικό να λαμβάνεται αυτό το διάστημα συμμετρικό σε σχέση με t; συμβολίζουμε με s p το μισό μήκος του διαστήματος. Η τιμή του sp πρέπει να επιλεγεί έτσι ώστε η συνθήκη

Ας προσπαθήσουμε να περάσουμε στην αριστερή πλευρά της ισότητας (14.4.5) από μια τυχαία μεταβλητή tσε μια τυχαία μεταβλητή Τ,κατανέμεται σύμφωνα με το νόμο του Φοιτητή. Για να γίνει αυτό, πολλαπλασιάζουμε και τα δύο μέρη της ανισότητας |m-w?|

σε θετική τιμή: ή, χρησιμοποιώντας τη σημείωση (14.4.1),

Ας βρούμε έναν αριθμό / p έτσι ώστε η τιμή / p να μπορεί να βρεθεί από τη συνθήκη

Μπορεί να φανεί από τον τύπο (14.4.2) ότι η (1) είναι άρτια συνάρτηση, άρα η (14.4.8) δίνει

Η ισότητα (14.4.9) καθορίζει την τιμή / p ανάλογα με το p. Εάν έχετε στη διάθεσή σας πίνακα με ακέραιες τιμές

τότε η τιμή / p μπορεί να βρεθεί με αντίστροφη παρεμβολή στον πίνακα. Ωστόσο, είναι πιο βολικό να συντάσσετε έναν πίνακα τιμών / p εκ των προτέρων. Ένας τέτοιος πίνακας δίνεται στο Παράρτημα (Πίνακας 5). Αυτός ο πίνακας δείχνει τις τιμές που εξαρτώνται από την πιθανότητα εμπιστοσύνης p και τον αριθμό των βαθμών ελευθερίας Π- 1. Έχοντας καθορίσει / p σύμφωνα με τον πίνακα. 5 και υποθέτοντας

βρίσκουμε το μισό πλάτος του διαστήματος εμπιστοσύνης / p και το ίδιο το διάστημα

Παράδειγμα 1. Πραγματοποιήθηκαν 5 ανεξάρτητα πειράματα σε μια τυχαία μεταβλητή Χ,κανονικά κατανεμημένο με άγνωστες παραμέτρους tκαι περίπου. Τα αποτελέσματα των πειραμάτων δίνονται στον πίνακα. 14.4.1.

Πίνακας 14.4.1

Βρείτε μια εκτίμηση tγια τη μαθηματική προσδοκία και κατασκευάστε ένα διάστημα εμπιστοσύνης 90% / p για αυτό (δηλαδή, το διάστημα που αντιστοιχεί στην πιθανότητα εμπιστοσύνης p \u003d 0,9).

Λύση.Εχουμε:

Σύμφωνα με τον πίνακα 5 της αίτησης για Π - 1 = 4 και p = 0,9 βρίσκουμε όπου

Το διάστημα εμπιστοσύνης θα είναι

Παράδειγμα 2. Για τις συνθήκες του παραδείγματος 1 της υποενότητας 14.3, υποθέτοντας την τιμή Χκανονικά κατανεμημένο, βρείτε το ακριβές διάστημα εμπιστοσύνης.

Λύση.Σύμφωνα με τον πίνακα 5 της αίτησης, βρίσκουμε στο Π - 1 = 19ir =

0,8 / p = 1,328; από εδώ

Συγκρίνοντας με τη λύση του παραδείγματος 1 της υποενότητας 14.3 (e p = 0,072), βλέπουμε ότι η απόκλιση είναι πολύ μικρή. Εάν διατηρήσουμε την ακρίβεια στο δεύτερο δεκαδικό ψηφίο, τότε τα διαστήματα εμπιστοσύνης που βρέθηκαν με τις ακριβείς και κατά προσέγγιση μεθόδους είναι τα ίδια:

Ας προχωρήσουμε στην κατασκευή ενός διαστήματος εμπιστοσύνης για τη διακύμανση. Εξετάστε την αμερόληπτη εκτίμηση διασποράς

και εκφράστε την τυχαία μεταβλητή ρεμέσω της αξίας V(14.4.3) με κατανομή x 2 (14.4.4):

Γνωρίζοντας τον νόμο κατανομής της ποσότητας V,είναι δυνατόν να βρεθεί το διάστημα / (1 ) στο οποίο εμπίπτει με δεδομένη πιθανότητα p.

νόμος διανομής k n _ x (v)η τιμή του I 7 έχει τη μορφή που φαίνεται στο σχ. 14.4.1.

Ρύζι. 14.4.1

Τίθεται το ερώτημα: πώς να επιλέξετε το διάστημα / p; Αν ο νόμος κατανομής της ποσότητας Vήταν συμμετρικό (όπως ένας κανονικός νόμος ή η κατανομή του Student), θα ήταν φυσικό να ληφθεί το διάστημα /p συμμετρικό σε σχέση με τη μαθηματική προσδοκία. Στην προκειμένη περίπτωση ο νόμος k n _ x (v)ασύμμετρη. Ας συμφωνήσουμε να επιλέξουμε το διάστημα /p έτσι ώστε οι πιθανότητες παραγωγής της ποσότητας Vέξω από το διάστημα δεξιά και αριστερά (σκιασμένες περιοχές στο Σχ. 14.4.1) ήταν ίδιες και ίσες

Για να δημιουργήσουμε ένα διάστημα / p με αυτήν την ιδιότητα, χρησιμοποιούμε τον Πίνακα. 4 εφαρμογές: περιέχει αριθμούς y)τέτοια που

για την ποσότητα V,έχοντας x 2 -κατανομή με r βαθμούς ελευθερίας. Στην περίπτωσή μας r = n- 1. Διορθώστε r = n- 1 και βρείτε στην αντίστοιχη γραμμή του πίνακα. 4 δύο τιμές x 2 -Το ένα αντιστοιχεί σε μια πιθανότητα το άλλο - πιθανότητες Ας ορίσουμε αυτές

αξίες στις 2και xl;Το διάστημα έχει y 2,με το αριστερό του, και y ~δεξί άκρο.

Τώρα βρίσκουμε το απαιτούμενο διάστημα εμπιστοσύνης /| για τη διακύμανση με τα όρια D, και D2,που καλύπτει το σημείο ρεμε πιθανότητα p:

Ας κατασκευάσουμε ένα τέτοιο διάστημα / (, = (?> b A), που καλύπτει το σημείο ρεεάν και μόνο εάν η αξία Vεμπίπτει στο διάστημα / r. Ας δείξουμε ότι το διάστημα

ικανοποιεί αυτή την προϋπόθεση. Πράγματι, οι ανισότητες ισοδυναμούν με τις ανισότητες

και αυτές οι ανισότητες ισχύουν με πιθανότητα p. Έτσι, το διάστημα εμπιστοσύνης για τη διασπορά βρίσκεται και εκφράζεται με τον τύπο (14.4.13).

Παράδειγμα 3. Βρείτε το διάστημα εμπιστοσύνης για τη διακύμανση υπό τις συνθήκες του παραδείγματος 2 της υποενότητας 14.3, εάν είναι γνωστό ότι η τιμή Χδιανέμονται κανονικά.

Λύση.Εχουμε . Σύμφωνα με τον πίνακα 4 της αίτησης

βρίσκουμε στο r = n - 1 = 19

Σύμφωνα με τον τύπο (14.4.13) βρίσκουμε το διάστημα εμπιστοσύνης για τη διασπορά

Αντίστοιχο διάστημα για τυπική απόκλιση: (0,21; 0,32). Αυτό το διάστημα υπερβαίνει ελαφρώς μόνο το διάστημα (0,21, 0,29) που λαμβάνεται στο Παράδειγμα 2 της Υποενότητας 14.3 με την κατά προσέγγιση μέθοδο.

  • Το Σχήμα 14.3.1 εξετάζει ένα διάστημα εμπιστοσύνης που είναι συμμετρικό ως προς το α. Γενικά, όπως θα δούμε στη συνέχεια, αυτό δεν είναι απαραίτητο.
ΚΑΤΗΓΟΡΙΕΣ

Δημοφιλή ΑΡΘΡΑ

2022 "kingad.ru" - υπερηχογραφική εξέταση ανθρώπινων οργάνων