Ανάλυση σειρών παραλλαγών. Σειρά παραλλαγής

​ Σειρές παραλλαγής - μια σειρά στην οποία συγκρίνονται (κατά βαθμό αύξησης ή μείωσης) επιλογέςκαι αντίστοιχο συχνότητες

​Οι επιλογές είναι μεμονωμένες ποσοτικές εκφράσεις ενός χαρακτηριστικού. Υποδεικνύεται με λατινικό γράμμα V . Η κλασική κατανόηση του όρου «παραλλαγή» προϋποθέτει ότι κάθε μοναδική τιμή ενός χαρακτηριστικού ονομάζεται παραλλαγή, χωρίς να λαμβάνεται υπόψη ο αριθμός των επαναλήψεων.

Για παράδειγμα, στη σειρά παραλλαγών των δεικτών συστολικής αρτηριακής πίεσης που μετρήθηκαν σε δέκα ασθενείς:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

Υπάρχουν μόνο 6 διαθέσιμες τιμές:

110, 120, 130, 140, 160, 170.

Η συχνότητα είναι ένας αριθμός που υποδεικνύει πόσες φορές επαναλαμβάνεται μια επιλογή. Υποδηλώνεται με λατινικό γράμμα Π . Το άθροισμα όλων των συχνοτήτων (που, φυσικά, είναι ίσο με τον αριθμό όλων αυτών που μελετήθηκαν) συμβολίζεται ως n.

    Στο παράδειγμά μας, οι συχνότητες θα λάβουν τις ακόλουθες τιμές:
  • για την επιλογή 110 συχνότητα P = 1 (η τιμή 110 εμφανίζεται σε έναν ασθενή),
  • για την επιλογή 120, συχνότητα P = 2 (η τιμή 120 εμφανίζεται σε δύο ασθενείς),
  • για την επιλογή 130 συχνότητα P = 3 (η τιμή 130 εμφανίζεται σε τρεις ασθενείς),
  • για την επιλογή 140 συχνότητα P = 2 (η τιμή 140 εμφανίζεται σε δύο ασθενείς),
  • για την επιλογή 160 συχνότητα P = 1 (η τιμή 160 εμφανίζεται σε έναν ασθενή),
  • για την επιλογή 170 συχνότητα P = 1 (η τιμή 170 εμφανίζεται σε έναν ασθενή),

Τύποι σειρών παραλλαγών:

  1. απλός- αυτή είναι μια σειρά στην οποία κάθε επιλογή εμφανίζεται μόνο μία φορά (όλες οι συχνότητες είναι ίσες με 1).
  2. ανασταλεί- μια σειρά στην οποία μία ή περισσότερες επιλογές εμφανίζονται περισσότερες από μία φορές.

Η σειρά παραλλαγών χρησιμοποιείται για να περιγράψει μεγάλες σειρές αριθμών, με αυτή τη μορφή παρουσιάζονται αρχικά τα συλλεγόμενα δεδομένα των περισσότερων ιατρικών μελετών. Προκειμένου να χαρακτηριστεί η σειρά διακύμανσης, υπολογίζονται ειδικοί δείκτες, συμπεριλαμβανομένων των μέσων τιμών, των δεικτών μεταβλητότητας (η λεγόμενη διασπορά) και των δεικτών της αντιπροσωπευτικότητας των δεδομένων του δείγματος.

Δείκτες σειράς παραλλαγών

1) Ο αριθμητικός μέσος όρος είναι ένας γενικός δείκτης που χαρακτηρίζει το μέγεθος του χαρακτηριστικού που μελετάται. Ο αριθμητικός μέσος όρος συμβολίζεται ως Μ , είναι ο πιο συνηθισμένος τύπος μέσου όρου. Ο αριθμητικός μέσος όρος υπολογίζεται ως ο λόγος του αθροίσματος των τιμών των δεικτών όλων των μονάδων παρατήρησης προς τον αριθμό όλων των θεμάτων που μελετήθηκαν. Η μέθοδος για τον υπολογισμό του αριθμητικού μέσου όρου διαφέρει για μια απλή και σταθμισμένη σειρά μεταβολών.

Τύπος υπολογισμού απλός αριθμητικός μέσος όρος:

Τύπος υπολογισμού σταθμισμένος αριθμητικός μέσος όρος:

M = Σ(V * P)/ n

​ 2) Η λειτουργία είναι μια άλλη μέση τιμή της σειράς παραλλαγών, που αντιστοιχεί στην πιο συχνά επαναλαμβανόμενη επιλογή. Ή, για να το θέσω αλλιώς, αυτή είναι η επιλογή που αντιστοιχεί στην υψηλότερη συχνότητα. Συμβολίζεται ως Μο . Η λειτουργία υπολογίζεται μόνο για σταθμισμένες σειρές, αφού στις απλές σειρές καμία από τις επιλογές δεν επαναλαμβάνεται και όλες οι συχνότητες είναι ίσες με μία.

Για παράδειγμα, στη σειρά παραλλαγών τιμών καρδιακού ρυθμού:

80, 84, 84, 86, 86, 86, 90, 94;

η τιμή της λειτουργίας είναι 86, αφού αυτή η επιλογή εμφανίζεται 3 φορές, επομένως η συχνότητά της είναι η υψηλότερη.

3) Διάμεσος - η τιμή της επιλογής που διαιρεί τη σειρά παραλλαγής στη μέση: και στις δύο πλευρές της υπάρχει ίσος αριθμός επιλογών. Ο διάμεσος, όπως ο αριθμητικός μέσος όρος και ο τρόπος λειτουργίας, αναφέρεται σε μέσες τιμές. Συμβολίζεται ως Μου

4) Τυπική απόκλιση (συνώνυμα: τυπική απόκλιση, απόκλιση σίγμα, σίγμα) - ένα μέτρο της μεταβλητότητας της σειράς παραλλαγών. Είναι ένας αναπόσπαστος δείκτης που συνδυάζει όλες τις περιπτώσεις απόκλισης από τον μέσο όρο. Στην πραγματικότητα, απαντά στο ερώτημα: πόσο μακριά και πόσο συχνά εξαπλώνονται οι παραλλαγές από τον αριθμητικό μέσο όρο. Υποδηλώνεται με ελληνικό γράμμα σ ("σίγμα").

Εάν το μέγεθος του πληθυσμού είναι μεγαλύτερο από 30 μονάδες, η τυπική απόκλιση υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

Για μικρούς πληθυσμούς - 30 μονάδες παρατήρησης ή λιγότερο - η τυπική απόκλιση υπολογίζεται χρησιμοποιώντας διαφορετικό τύπο:

Ας καλέσουμε τις διαφορετικές τιμές δείγματος επιλογέςσειρά τιμών και δηλώνουν: Χ 1 , Χ 2,…. Πρώτα απ 'όλα, θα παράγουμε κυμαίνεταιεπιλογές, δηλ. τη διάταξή τους σε αύξουσα ή φθίνουσα σειρά. Για κάθε επιλογή, υποδεικνύεται το δικό της βάρος, δηλ. ένας αριθμός που χαρακτηρίζει τη συμβολή μιας δεδομένης επιλογής στο συνολικό πληθυσμό. Οι συχνότητες ή οι συχνότητες λειτουργούν ως βάρη.

Συχνότητα n i επιλογή x iείναι ένας αριθμός που υποδεικνύει πόσες φορές εμφανίζεται μια δεδομένη επιλογή στον υπό εξέταση πληθυσμό δείγματος.

Συχνότητα ή σχετική συχνότητα w i επιλογή x iείναι ένας αριθμός ίσος με τον λόγο της συχνότητας μιας παραλλαγής προς το άθροισμα των συχνοτήτων όλων των παραλλαγών. Η συχνότητα δείχνει ποια αναλογία μονάδων στον πληθυσμό δείγματος έχει μια δεδομένη παραλλαγή.

Μια ακολουθία επιλογών με τα αντίστοιχα βάρη τους (συχνότητες ή συχνότητες), γραμμένα σε αύξουσα (ή φθίνουσα) σειρά, ονομάζεται σειρά παραλλαγής.

Οι σειρές παραλλαγών είναι διακριτές και ενδιάμεσες.

Για μια διακριτή σειρά παραλλαγών, καθορίζονται οι σημειακές τιμές του χαρακτηριστικού, για μια σειρά διαστημάτων, οι χαρακτηριστικές τιμές καθορίζονται με τη μορφή διαστημάτων. Οι σειρές παραλλαγών μπορούν να δείχνουν την κατανομή των συχνοτήτων ή των σχετικών συχνοτήτων (συχνότητες), ανάλογα με την τιμή που υποδεικνύεται για κάθε επιλογή - συχνότητα ή συχνότητα.

Σειρές διακριτών μεταβολών κατανομής συχνοτήτωνέχει τη μορφή:

Οι συχνότητες βρίσκονται με τον τύπο, i = 1, 2, ..., Μ.

w 1 +w 2 + … + w m = 1.

Παράδειγμα 4.1. Για ένα δεδομένο σύνολο αριθμών

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

κατασκευάστε διακριτές σειρές διακυμάνσεων κατανομών συχνότητας και συχνότητας.

Λύση . Ο όγκος του πληθυσμού είναι ίσος με n= 10. Η διακριτή σειρά κατανομής συχνότητας έχει τη μορφή

Οι σειρές διαλειμμάτων έχουν παρόμοια μορφή εγγραφής.

Σειρά διαλειμματικής διακύμανσης κατανομής συχνότηταςγράφεται ως:

Το άθροισμα όλων των συχνοτήτων είναι ίσο με τον συνολικό αριθμό των παρατηρήσεων, δηλ. συνολικός όγκος: n = n 1 +n 2 + … + nΜ.

Διαστημικές διακυμάνσεις σειράς κατανομής σχετικών συχνοτήτων (συχνότητες)έχει τη μορφή:

Η συχνότητα βρίσκεται με τον τύπο, i = 1, 2, ..., Μ.

Το άθροισμα όλων των συχνοτήτων είναι ίσο με ένα: w 1 +w 2 + … + w m = 1.

Οι σειρές διαστήματος χρησιμοποιούνται συχνότερα στην πράξη. Εάν υπάρχουν πολλά στατιστικά δεδομένα δείγματος και οι τιμές τους διαφέρουν μεταξύ τους κατά ένα αυθαίρετα μικρό ποσό, τότε μια διακριτή σειρά για αυτά τα δεδομένα θα είναι αρκετά δυσκίνητη και άβολη για περαιτέρω έρευνα. Σε αυτή την περίπτωση, χρησιμοποιείται ομαδοποίηση δεδομένων, π.χ. Το διάστημα που περιέχει όλες τις τιμές του χαρακτηριστικού χωρίζεται σε πολλά επιμέρους διαστήματα και, με τον υπολογισμό της συχνότητας για κάθε διάστημα, προκύπτει μια σειρά διαστημάτων. Ας γράψουμε λεπτομερέστερα το σχήμα για την κατασκευή μιας σειράς διαστημάτων, υποθέτοντας ότι τα μήκη των μερικών διαστημάτων θα είναι τα ίδια.

2.2 Κατασκευή διαστημικής σειράς

Για να δημιουργήσετε μια σειρά διαστημάτων χρειάζεστε:

Προσδιορίστε τον αριθμό των διαστημάτων.

Προσδιορίστε το μήκος των διαστημάτων.

Προσδιορίστε τη θέση των διαστημάτων στον άξονα.

Για τον καθορισμό αριθμός διαστημάτων κ Υπάρχει η φόρμουλα του Sturges, σύμφωνα με την οποία

,

Οπου n- ο όγκος ολόκληρου του αδρανούς.

Για παράδειγμα, εάν υπάρχουν 100 τιμές ενός χαρακτηριστικού (παραλλαγή), τότε συνιστάται να λάβετε τον αριθμό των διαστημάτων ίσο με τα διαστήματα για τη δημιουργία μιας σειράς διαστημάτων.

Ωστόσο, πολύ συχνά στην πράξη ο αριθμός των διαστημάτων επιλέγεται από τον ίδιο τον ερευνητή, λαμβάνοντας υπόψη ότι αυτός ο αριθμός δεν πρέπει να είναι πολύ μεγάλος, ώστε η σειρά να μην είναι δυσκίνητη, αλλά ούτε και πολύ μικρή για να μην χαθούν κάποιες ιδιότητες του διανομή.

Μήκος διαστήματος η καθορίζεται από τον ακόλουθο τύπο:

,

Οπου Χμέγιστο και Χ min είναι η μεγαλύτερη και η μικρότερη τιμή των επιλογών, αντίστοιχα.

Μέγεθος που ονομάζεται πεδίο εφαρμογήςσειρά.

Για να κατασκευάσουν τα ίδια τα διαστήματα, προχωρούν με διαφορετικούς τρόπους. Ένας από τους απλούστερους τρόπους είναι ο εξής. Η αρχή του πρώτου διαστήματος θεωρείται ότι είναι
. Στη συνέχεια, τα υπόλοιπα όρια των διαστημάτων βρίσκονται από τον τύπο. Προφανώς, το τέλος του τελευταίου διαστήματος έναΤο m+1 πρέπει να πληροί την προϋπόθεση

Αφού βρεθούν όλα τα όρια των διαστημάτων, καθορίζονται οι συχνότητες (ή οι συχνότητες) αυτών των διαστημάτων. Για να λύσετε αυτό το πρόβλημα, κοιτάξτε όλες τις επιλογές και προσδιορίστε τον αριθμό των επιλογών που εμπίπτουν σε ένα συγκεκριμένο διάστημα. Ας δούμε την πλήρη κατασκευή μιας σειράς διαστημάτων χρησιμοποιώντας ένα παράδειγμα.

Παράδειγμα 4.2. Για τα ακόλουθα στατιστικά δεδομένα, που καταγράφονται με αύξουσα σειρά, κατασκευάστε μια σειρά διαστημάτων με τον αριθμό των διαστημάτων ίσο με 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Λύση. Σύνολο n=50 τιμές παραλλαγής.

Ο αριθμός των διαστημάτων καθορίζεται στη δήλωση προβλήματος, π.χ. κ=5.

Το μήκος των διαστημάτων είναι
.

Ας ορίσουμε τα όρια των διαστημάτων:

ένα 1 = 11 − 8,5 = 2,5; ένα 2 = 2,5 + 17 = 19,5; ένα 3 = 19,5 + 17 = 36,5;

ένα 4 = 36,5 + 17 = 53,5; ένα 5 = 53,5 + 17 = 70,5; ένα 6 = 70,5 + 17 = 87,5;

ένα 7 = 87,5 +17 = 104,5.

Για να προσδιορίσουμε τη συχνότητα των διαστημάτων, μετράμε τον αριθμό των επιλογών που εμπίπτουν σε ένα δεδομένο διάστημα. Για παράδειγμα, το πρώτο διάστημα από 2,5 έως 19,5 περιλαμβάνει επιλογές 11, 12, 12, 14, 14, 15. Ο αριθμός τους είναι 6, επομένως, η συχνότητα του πρώτου διαστήματος είναι n 1 = 6. Η συχνότητα του πρώτου διαστήματος είναι . Το δεύτερο διάστημα από 19,5 έως 36,5 περιλαμβάνει επιλογές 21, 21, 22, 23, 25, ο αριθμός των οποίων είναι 5. Επομένως, η συχνότητα του δεύτερου διαστήματος είναι n 2 =5 και συχνότητα . Έχοντας βρει τις συχνότητες και τις συχνότητες για όλα τα διαστήματα με παρόμοιο τρόπο, λαμβάνουμε τις ακόλουθες σειρές διαστημάτων.

Η διαστημική σειρά κατανομής συχνοτήτων έχει τη μορφή:

Το άθροισμα των συχνοτήτων είναι 6+5+9+11+8+11=50.

Η διαστημική σειρά κατανομής συχνοτήτων έχει τη μορφή:

Το άθροισμα των συχνοτήτων είναι 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

Κατά την κατασκευή διαστημικών σειρών, ανάλογα με τις ειδικές συνθήκες του υπό εξέταση προβλήματος, μπορούν να εφαρμοστούν άλλοι κανόνες, δηλαδή

1. Οι σειρές παραλλαγής διαστήματος μπορεί να αποτελούνται από μερικά διαστήματα διαφορετικού μήκους. Τα άνισα μήκη διαστημάτων καθιστούν δυνατή την ανάδειξη των ιδιοτήτων ενός στατιστικού πληθυσμού με άνιση κατανομή του χαρακτηριστικού. Για παράδειγμα, εάν τα όρια των διαστημάτων καθορίζουν τον αριθμό των κατοίκων στις πόλεις, τότε είναι σκόπιμο σε αυτό το πρόβλημα να χρησιμοποιηθούν διαστήματα άνισου μήκους. Προφανώς, για τις μικρές πόλεις μια μικρή διαφορά στον αριθμό των κατοίκων είναι σημαντική, αλλά για τις μεγάλες πόλεις μια διαφορά δεκάδων ή εκατοντάδων κατοίκων δεν είναι σημαντική. Οι σειρές διαστημάτων με άνισα μήκη μερικών διαστημάτων μελετώνται κυρίως στη γενική θεωρία της στατιστικής και η εξέτασή τους ξεφεύγει από το πεδίο εφαρμογής αυτού του εγχειριδίου.

2. Στη μαθηματική στατιστική, μερικές φορές θεωρούνται διαστασιακές σειρές, για τις οποίες το αριστερό όριο του πρώτου διαστήματος θεωρείται ίσο με –∞ και το δεξί όριο του τελευταίου διαστήματος +∞. Αυτό γίνεται για να φέρουμε τη στατιστική κατανομή πιο κοντά στη θεωρητική.

3. Κατά την κατασκευή σειρών διαστήματος, μπορεί να αποδειχθεί ότι η τιμή κάποιας επιλογής συμπίπτει ακριβώς με το όριο του διαστήματος. Το καλύτερο που έχετε να κάνετε σε αυτή την περίπτωση είναι το εξής. Εάν υπάρχει μόνο μία τέτοια σύμπτωση, τότε θεωρήστε ότι η υπό εξέταση επιλογή με τη συχνότητά της έπεσε στο διάστημα που βρίσκεται πιο κοντά στη μέση της σειράς διαστήματος, εάν υπάρχουν πολλές τέτοιες επιλογές, τότε είτε όλες εκχωρούνται στα διαστήματα δεξιά από αυτές τις επιλογές, ή όλες έχουν αντιστοιχιστεί στα αριστερά.

4. Αφού καθοριστεί ο αριθμός των διαστημάτων και το μήκος τους, η διάταξη των διαστημάτων μπορεί να γίνει με άλλο τρόπο. Βρείτε τον αριθμητικό μέσο όρο όλων των εξεταζόμενων τιμών των επιλογών ΧΝυμφεύομαι και να δημιουργήσετε το πρώτο διάστημα με τέτοιο τρόπο ώστε αυτός ο μέσος όρος του δείγματος να βρίσκεται μέσα σε κάποιο διάστημα. Έτσι, παίρνουμε το διάστημα από ΧΝυμφεύομαι – 0,5 ηπριν Χμέσος όρος.. + 0,5 η. Στη συνέχεια προς τα αριστερά και προς τα δεξιά, προσθέτοντας το μήκος του διαστήματος, χτίζουμε τα υπόλοιπα διαστήματα μέχρι Χ min και ΧΤο max δεν θα εμπίπτει στο πρώτο και το τελευταίο διάστημα, αντίστοιχα.

5. Οι σειρές διαστημάτων με μεγάλο αριθμό διαστημάτων γράφονται βολικά κάθετα, δηλ. γράψτε τα διαστήματα όχι στην πρώτη γραμμή, αλλά στην πρώτη στήλη και τις συχνότητες (ή τις συχνότητες) στη δεύτερη στήλη.

Τα δείγματα δεδομένων μπορούν να θεωρηθούν ως τιμές κάποιας τυχαίας μεταβλητής Χ. Μια τυχαία μεταβλητή έχει τον δικό της νόμο κατανομής. Από τη θεωρία πιθανοτήτων είναι γνωστό ότι ο νόμος κατανομής μιας διακριτής τυχαίας μεταβλητής μπορεί να καθοριστεί με τη μορφή μιας σειράς κατανομής και για μια συνεχή - χρησιμοποιώντας τη συνάρτηση πυκνότητας κατανομής. Ωστόσο, υπάρχει ένας γενικός νόμος κατανομής που ισχύει τόσο για διακριτές όσο και για συνεχείς τυχαίες μεταβλητές. Αυτός ο νόμος διανομής δίνεται ως συνάρτηση διανομής φά(Χ) = Π(Χ<Χ). Για δείγματα δεδομένων, μπορείτε να καθορίσετε ένα ανάλογο της συνάρτησης διανομής - την εμπειρική συνάρτηση διανομής.


Σχετική πληροφορία.


Σειρά στατιστικής κατανομής– πρόκειται για μια διατεταγμένη κατανομή πληθυσμιακών μονάδων σε ομάδες σύμφωνα με ένα συγκεκριμένο διαφορετικό χαρακτηριστικό.
Ανάλογα με το χαρακτηριστικό στο οποίο βασίζεται ο σχηματισμός της σειράς διανομής, υπάρχουν αποδοτικές και μεταβλητές σειρές διανομής.

Η παρουσία ενός κοινού χαρακτηριστικού αποτελεί τη βάση για το σχηματισμό ενός στατιστικού πληθυσμού, ο οποίος αντιπροσωπεύει τα αποτελέσματα της περιγραφής ή της μέτρησης των γενικών χαρακτηριστικών των αντικειμένων μελέτης.

Το αντικείμενο μελέτης στη στατιστική είναι τα μεταβαλλόμενα (μεταβλητά) χαρακτηριστικά ή στατιστικά χαρακτηριστικά.

Είδη στατιστικών χαρακτηριστικών.

Οι σειρές διανομής ονομάζονται αποδοτικέςκατασκευασμένο με ποιοτικά κριτήρια. Προσδιοριστικό– αυτό είναι ένα σημάδι που έχει όνομα (για παράδειγμα, επάγγελμα: μοδίστρα, δάσκαλος κ.λπ.).
Η σειρά διανομής παρουσιάζεται συνήθως με τη μορφή πινάκων. Στον πίνακα Το 2.8 δείχνει τη σειρά κατανομής χαρακτηριστικών.
Πίνακας 2.8 - Κατανομή τύπων νομικής συνδρομής που παρέχεται από δικηγόρους σε πολίτες μιας από τις περιοχές της Ρωσικής Ομοσπονδίας.

Σειρά παραλλαγής– αυτές είναι οι τιμές του χαρακτηριστικού (ή των διαστημάτων τιμών) και οι συχνότητές τους.
Οι σειρές παραλλαγής είναι σειρές διανομής, χτισμένο σε ποσοτική βάση. Οποιαδήποτε σειρά παραλλαγών αποτελείται από δύο στοιχεία: επιλογές και συχνότητες.
Οι παραλλαγές θεωρούνται οι μεμονωμένες τιμές ενός χαρακτηριστικού που παίρνει σε μια σειρά παραλλαγής.
Οι συχνότητες είναι οι αριθμοί των μεμονωμένων επιλογών ή κάθε ομάδα μιας σειράς παραλλαγών, δηλ. Αυτοί είναι αριθμοί που δείχνουν πόσο συχνά εμφανίζονται ορισμένες επιλογές σε μια σειρά διανομής. Το άθροισμα όλων των συχνοτήτων καθορίζει το μέγεθος ολόκληρου του πληθυσμού, τον όγκο του.
Οι συχνότητες είναι συχνότητες που εκφράζονται ως κλάσματα μιας μονάδας ή ως ποσοστό του συνόλου. Αντίστοιχα, το άθροισμα των συχνοτήτων είναι ίσο με 1 ή 100%. Η σειρά παραλλαγών επιτρέπει σε κάποιον να εκτιμήσει τη μορφή του νόμου κατανομής με βάση τα πραγματικά δεδομένα.

Ανάλογα με τη φύση της παραλλαγής του χαρακτηριστικού, υπάρχουν σειρές διακριτών και διαλειμματικών μεταβολών.
Ένα παράδειγμα μιας διακριτής σειράς παραλλαγών δίνεται στον πίνακα. 2.9.
Πίνακας 2.9 - Κατανομή οικογενειών με βάση τον αριθμό των κατειλημμένων δωματίων σε μεμονωμένα διαμερίσματα το 1989 στη Ρωσική Ομοσπονδία.

Η πρώτη στήλη του πίνακα παρουσιάζει επιλογές για μια διακριτή σειρά διακύμανσης, η δεύτερη στήλη περιέχει τις συχνότητες της σειράς διακύμανσης και η τρίτη περιέχει δείκτες συχνότητας.

Σειρά παραλλαγής

Στο γενικό πληθυσμό μελετάται ένα συγκεκριμένο ποσοτικό χαρακτηριστικό. Ένα δείγμα όγκου εξάγεται τυχαία από αυτό n, δηλαδή, ο αριθμός των στοιχείων του δείγματος είναι ίσος με n. Στο πρώτο στάδιο της στατιστικής επεξεργασίας, κυμαίνεταιδείγματα, δηλ. παραγγελία αριθμού x 1 , x 2 , …, x nΑύξουσα. Κάθε παρατηρούμενη τιμή x iπου ονομάζεται επιλογή. Συχνότητα m iείναι ο αριθμός των παρατηρήσεων της τιμής x iστο δείγμα. Σχετική συχνότητα (συχνότητα) w iείναι ο λόγος συχνότητας m iστο μέγεθος του δείγματος n: .
Κατά τη μελέτη των σειρών παραλλαγών, χρησιμοποιούνται επίσης οι έννοιες της συσσωρευμένης συχνότητας και της συσσωρευμένης συχνότητας. Αφήνω Χκάποιο νούμερο. Στη συνέχεια, ο αριθμός των επιλογών , των οποίων οι τιμές είναι μικρότερες Χ, ονομάζεται συσσωρευμένη συχνότητα: για x i nονομάζεται συσσωρευμένη συχνότητα w i max.
Ένα χαρακτηριστικό ονομάζεται διακριτά μεταβλητό εάν οι επιμέρους τιμές του (παραλλαγές) διαφέρουν μεταξύ τους κατά μια ορισμένη πεπερασμένη τιμή (συνήθως έναν ακέραιο). Η σειρά παραλλαγών ενός τέτοιου χαρακτηριστικού ονομάζεται διακριτή σειρά παραλλαγής.

Πίνακας 1. Γενική άποψη μιας σειράς διακριτών συχνοτήτων μεταβολής

Χαρακτηριστικές αξίεςx i x 1 x 2 x n
Συχνότητεςm i m 1 m 2 m n

Ένα χαρακτηριστικό ονομάζεται συνεχώς μεταβαλλόμενο εάν οι τιμές του διαφέρουν μεταξύ τους κατά ένα αυθαίρετα μικρό ποσό, δηλ. το χαρακτηριστικό μπορεί να πάρει οποιαδήποτε τιμή σε ένα συγκεκριμένο διάστημα. Μια σειρά συνεχούς μεταβολής για ένα τέτοιο χαρακτηριστικό ονομάζεται διάστημα.

Πίνακας 2. Γενική άποψη της σειράς συχνοτήτων μεταβολής διαστήματος

Πίνακας 3. Γραφικές εικόνες της σειράς παραλλαγής

ΣειράΠολύγωνο ή ιστόγραμμαΕμπειρική συνάρτηση κατανομής
Διακεκριμένος
Διάστημα
Με την ανασκόπηση των αποτελεσμάτων των παρατηρήσεων, καθορίζεται πόσες τιμές των επιλογών εμπίπτουν σε κάθε συγκεκριμένο διάστημα. Υποτίθεται ότι κάθε διάστημα ανήκει σε ένα από τα άκρα του: είτε σε όλες τις περιπτώσεις αριστερά (πιο συχνά) είτε σε όλες τις περιπτώσεις δεξιά, και οι συχνότητες ή οι συχνότητες δείχνουν τον αριθμό των επιλογών που περιέχονται στα καθορισμένα όρια. Διαφορές a i – a i +1ονομάζονται επιμέρους διαστήματα. Για να απλοποιηθούν οι επόμενοι υπολογισμοί, η σειρά μεταβολών διαστήματος μπορεί να αντικατασταθεί από μια υπό όρους διακριτή. Σε αυτή την περίπτωση, η μέση τιμή Εγώ-Το διάστημα λαμβάνεται ως επιλογή x i, και την αντίστοιχη συχνότητα διαστήματος m i– για τη συχνότητα αυτού του διαστήματος.
Για τη γραφική αναπαράσταση σειρών παραλλαγών, τα πιο συχνά χρησιμοποιούμενα είναι το πολύγωνο, το ιστόγραμμα, η αθροιστική καμπύλη και η συνάρτηση εμπειρικής κατανομής.

Στον πίνακα 2.3 (Ομαδοποίηση του ρωσικού πληθυσμού κατά μέσο κατά κεφαλήν εισόδημα τον Απρίλιο 1994) παρουσιάζεται σειρές παραλλαγής διαστήματος.
Είναι βολικό να αναλύονται οι σειρές διανομής χρησιμοποιώντας μια γραφική εικόνα, η οποία επιτρέπει σε κάποιον να κρίνει το σχήμα της διανομής. Μια οπτική αναπαράσταση της φύσης των αλλαγών στις συχνότητες της σειράς παραλλαγών δίνεται από πολύγωνο και ιστόγραμμα.
Το πολύγωνο χρησιμοποιείται όταν απεικονίζονται διακριτές σειρές παραλλαγών.
Ας απεικονίσουμε, για παράδειγμα, γραφικά την κατανομή του αποθέματος κατοικιών ανά τύπο διαμερίσματος (Πίνακας 2.10).
Πίνακας 2.10 - Κατανομή του οικιστικού αποθέματος της αστικής περιοχής ανά τύπο διαμερίσματος (στοιχεία υπό όρους).


Ρύζι. Χώρος διανομής κατοικιών


Όχι μόνο οι τιμές συχνότητας, αλλά και οι συχνότητες της σειράς μεταβολών μπορούν να απεικονιστούν στους άξονες τεταγμένων.
Το ιστόγραμμα χρησιμοποιείται για την απεικόνιση μιας σειράς παραλλαγής διαστήματος. Κατά την κατασκευή ενός ιστογράμματος, οι τιμές των διαστημάτων σχεδιάζονται στον άξονα της τετμημένης και οι συχνότητες απεικονίζονται με ορθογώνια χτισμένα στα αντίστοιχα διαστήματα. Το ύψος των στηλών στην περίπτωση ίσων διαστημάτων πρέπει να είναι ανάλογο με τις συχνότητες. Το ιστόγραμμα είναι ένα γράφημα στο οποίο μια σειρά απεικονίζεται ως ράβδοι η μία δίπλα στην άλλη.
Ας απεικονίσουμε γραφικά τη σειρά κατανομής διαστήματος που δίνεται στον πίνακα. 2.11.
Πίνακας 2.11 - Κατανομή οικογενειών κατά μέγεθος ζωτικού χώρου ανά άτομο (στοιχεία υπό όρους).
N p/p Ομάδες οικογενειών κατά μέγεθος ζωτικού χώρου ανά άτομο Αριθμός οικογενειών με δεδομένο μέγεθος χώρου διαβίωσης Αθροιστικός αριθμός οικογενειών
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ΣΥΝΟΛΟ 115 ----


Ρύζι. 2.2. Ιστόγραμμα της κατανομής των οικογενειών κατά το μέγεθος του ζωτικού χώρου ανά άτομο


Χρησιμοποιώντας τα δεδομένα της συσσωρευμένης σειράς (Πίνακας 2.11), κατασκευάζουμε σωρευτική κατανομή.


Ρύζι. 2.3. Σωρευτική κατανομή των οικογενειών κατά μέγεθος ζωτικού χώρου ανά άτομο


Η αναπαράσταση μιας σειράς παραλλαγών με τη μορφή αθροίσματος είναι ιδιαίτερα αποτελεσματική για σειρές μεταβολών των οποίων οι συχνότητες εκφράζονται ως κλάσματα ή ποσοστά του αθροίσματος των συχνοτήτων της σειράς.
Αν αλλάξουμε τους άξονες όταν απεικονίζουμε γραφικά μια σειρά παραλλαγών με τη μορφή αθροιστικών, τότε παίρνουμε ogiva. Στο Σχ. Το 2.4 δείχνει την ένδειξη που κατασκευάστηκε με βάση τα δεδομένα του Πίνακα. 2.11.
Ένα ιστόγραμμα μπορεί να μετατραπεί σε πολύγωνο κατανομής βρίσκοντας τα μέσα των πλευρών των ορθογωνίων και στη συνέχεια συνδέοντας αυτά τα σημεία με ευθείες γραμμές. Το προκύπτον πολύγωνο κατανομής φαίνεται στο Σχ. 2.2 με διακεκομμένη γραμμή.
Κατά την κατασκευή ενός ιστογράμματος της κατανομής μιας σειράς μεταβολών με άνισα διαστήματα, δεν είναι οι συχνότητες που απεικονίζονται κατά μήκος της τεταγμένης, αλλά η πυκνότητα κατανομής του χαρακτηριστικού στα αντίστοιχα διαστήματα.
Η πυκνότητα κατανομής είναι η συχνότητα που υπολογίζεται ανά μονάδα πλάτους διαστήματος, δηλ. πόσες μονάδες σε κάθε ομάδα είναι ανά μονάδα τιμής διαστήματος. Ένα παράδειγμα υπολογισμού της πυκνότητας κατανομής παρουσιάζεται στον πίνακα. 2.12.
Πίνακας 2.12 - Κατανομή επιχειρήσεων κατά αριθμό εργαζομένων (στοιχεία υπό όρους)
N p/p Ομάδες επιχειρήσεων κατά αριθμό εργαζομένων, άτομα. Αριθμός επιχειρήσεων Μέγεθος διαστήματος, άτομα. Πυκνότητα κατανομής
ΕΝΑ 1 2 3=1/2
1 Μέχρι 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ΣΥΝΟΛΟ 147 ---- ----

Μπορεί επίσης να χρησιμοποιηθεί για γραφική αναπαράσταση σειρών παραλλαγών αθροιστική καμπύλη. Χρησιμοποιώντας μια αθροιστική (καμπύλη αθροίσματος), απεικονίζεται μια σειρά συσσωρευμένων συχνοτήτων. Οι αθροιστικές συχνότητες καθορίζονται με τη διαδοχική άθροιση των συχνοτήτων μεταξύ των ομάδων και δείχνουν πόσες μονάδες στον πληθυσμό έχουν τιμές χαρακτηριστικών όχι μεγαλύτερες από την υπό εξέταση τιμή.


Ρύζι. 2.4. Αιτιολογία κατανομής των οικογενειών κατά το μέγεθος του ζωτικού χώρου ανά άτομο

Κατά την κατασκευή των σωρευμάτων μιας σειράς μεταβολών διαστήματος, οι παραλλαγές της σειράς σχεδιάζονται κατά μήκος του άξονα της τετμημένης και οι συσσωρευμένες συχνότητες σχεδιάζονται κατά μήκος του άξονα των τεταγμένων.

Χτισμένες σειρές σε ποσοτική βάση, λέγονται μεταβλητή.

Η σειρά διανομής αποτελείται από επιλογές(χαρακτηριστικές αξίες) και συχνότητες(αριθμός ομάδων). Οι συχνότητες που εκφράζονται ως σχετικές τιμές (κλάσματα, ποσοστά) ονομάζονται συχνότητες. Το άθροισμα όλων των συχνοτήτων ονομάζεται όγκος της σειράς διανομής.

Ανά τύπο, οι σειρές διανομής χωρίζονται σε διακεκριμένος(κατασκευασμένο με βάση τις ασυνεχείς τιμές του χαρακτηριστικού) και διάστημα(με βάση τις συνεχείς τιμές του χαρακτηριστικού).

Σειρά παραλλαγήςαντιπροσωπεύει δύο στήλες (ή γραμμές). ένα από τα οποία παρέχει μεμονωμένες τιμές ενός ποικίλου χαρακτηριστικού, που ονομάζεται παραλλαγές και συμβολίζεται με X. και στην άλλη - απόλυτοι αριθμοί που δείχνουν πόσες φορές (πόσο συχνά) εμφανίζεται κάθε επιλογή. Οι δείκτες της δεύτερης στήλης ονομάζονται συχνότητες και συμβολίζονται συμβατικά με f. Ας σημειώσουμε για άλλη μια φορά ότι η δεύτερη στήλη μπορεί επίσης να χρησιμοποιεί σχετικούς δείκτες που χαρακτηρίζουν το μερίδιο της συχνότητας των επιμέρους επιλογών στο συνολικό άθροισμα των συχνοτήτων. Αυτοί οι σχετικοί δείκτες ονομάζονται συχνότητες και συμβολίζονται συμβατικά με ω Το άθροισμα όλων των συχνοτήτων σε αυτή την περίπτωση είναι ίσο με ένα. Ωστόσο, οι συχνότητες μπορούν επίσης να εκφραστούν ως ποσοστά και στη συνέχεια το άθροισμα όλων των συχνοτήτων δίνει 100%.

Εάν οι παραλλαγές μιας σειράς παραλλαγής εκφράζονται με τη μορφή διακριτών μεγεθών, τότε μια τέτοια σειρά παραλλαγής ονομάζεται διακεκριμένος.

Για συνεχή χαρακτηριστικά, οι σειρές παραλλαγών κατασκευάζονται ως διάστημα, δηλαδή, οι τιμές του χαρακτηριστικού σε αυτά εκφράζονται "από... έως...". Σε αυτή την περίπτωση, οι ελάχιστες τιμές του χαρακτηριστικού σε ένα τέτοιο διάστημα ονομάζονται το κατώτερο όριο του διαστήματος και το μέγιστο - το ανώτερο όριο.

Οι σειρές μεταβολών διαστήματος κατασκευάζονται επίσης για διακριτά χαρακτηριστικά που ποικίλλουν σε μεγάλο εύρος. Η σειρά διαστημάτων μπορεί να είναι με ίσοςΚαι άνισοςκατά διαστήματα.

Ας εξετάσουμε πώς καθορίζεται η τιμή των ίσων διαστημάτων. Ας εισάγουμε τον ακόλουθο συμβολισμό:

Εγώ– μέγεθος διαστήματος

- τη μέγιστη τιμή του χαρακτηριστικού για μονάδες πληθυσμού.

– την ελάχιστη τιμή του χαρακτηριστικού για πληθυσμιακές μονάδες·

n -αριθμός των κατανεμημένων ομάδων.

, εάν το n είναι γνωστό.

Εάν ο αριθμός των ομάδων που πρέπει να διακριθούν είναι δύσκολο να προσδιοριστεί εκ των προτέρων, τότε για να υπολογιστεί η βέλτιστη τιμή του διαστήματος με επαρκές μέγεθος πληθυσμού, μπορεί να προταθεί ο τύπος που πρότεινε ο Sturgess το 1926:

n = 1+ 3,322 log N, όπου N είναι ο αριθμός των μονάδων στο άθροισμα.

Το μέγεθος των άνισων διαστημάτων καθορίζεται σε κάθε μεμονωμένη περίπτωση, λαμβάνοντας υπόψη τα χαρακτηριστικά του αντικειμένου μελέτης.

Κατανομή στατιστικών δειγμάτωνκαλέστε μια λίστα επιλογών και τις αντίστοιχες συχνότητες (ή τις σχετικές συχνότητες).

Η στατιστική κατανομή του δείγματος μπορεί να καθοριστεί με τη μορφή πίνακα, στην πρώτη στήλη του οποίου βρίσκονται οι επιλογές και στη δεύτερη - οι συχνότητες που αντιστοιχούν σε αυτές τις επιλογές ni, ή σχετικές συχνότητες Πι .

Στατιστική κατανομή του δείγματος

Οι σειρές διαστήματος είναι σειρές παραλλαγών στις οποίες οι τιμές των χαρακτηριστικών στα οποία βασίζονται ο σχηματισμός τους εκφράζονται εντός ορισμένων ορίων (διαστημάτων). Οι συχνότητες σε αυτήν την περίπτωση δεν αναφέρονται σε μεμονωμένες τιμές του χαρακτηριστικού, αλλά σε ολόκληρο το διάστημα.

Οι σειρές διαλειμματικής κατανομής κατασκευάζονται με βάση συνεχή ποσοτικά χαρακτηριστικά, καθώς και διακριτά χαρακτηριστικά που ποικίλλουν εντός σημαντικών ορίων.

Μια σειρά διαστημάτων μπορεί να αναπαρασταθεί από τη στατιστική κατανομή ενός δείγματος που δείχνει τα διαστήματα και τις αντίστοιχες συχνότητές τους. Στην περίπτωση αυτή, το άθροισμα των συχνοτήτων των παραλλαγών που εμπίπτουν σε αυτό το διάστημα λαμβάνεται ως η συχνότητα του διαστήματος.

Κατά την ομαδοποίηση βάσει ποσοτικών συνεχών χαρακτηριστικών, ο καθορισμός του μεγέθους του διαστήματος είναι σημαντικός.

Εκτός από τον μέσο όρο του δείγματος και τη διακύμανση του δείγματος, χρησιμοποιούνται επίσης και άλλα χαρακτηριστικά της σειράς διακύμανσης.

ΜόδαΗ παραλλαγή που έχει την υψηλότερη συχνότητα ονομάζεται.

Σειρά παραλλαγών: ορισμός, τύποι, κύρια χαρακτηριστικά. Μέθοδος υπολογισμού
τρόπος, διάμεσος, αριθμητικός μέσος όρος στην ιατρική και στατιστική έρευνα
(δείξτε με παράδειγμα υπό όρους).

Μια σειρά παραλλαγών είναι μια σειρά από αριθμητικές τιμές του χαρακτηριστικού που μελετάται, που διαφέρουν μεταξύ τους ως προς το μέγεθος και διατάσσονται σε μια συγκεκριμένη σειρά (σε αύξουσα ή φθίνουσα σειρά). Κάθε αριθμητική τιμή μιας σειράς ονομάζεται παραλλαγή (V) και οι αριθμοί που δείχνουν πόσο συχνά εμφανίζεται μια συγκεκριμένη παραλλαγή σε μια δεδομένη σειρά ονομάζονται συχνότητα (p).

Ο συνολικός αριθμός των περιπτώσεων παρατήρησης που συνθέτουν τη σειρά παραλλαγής συμβολίζεται με το γράμμα n. Η διαφορά στην έννοια των χαρακτηριστικών που μελετώνται ονομάζεται παραλλαγή. Εάν ένα μεταβαλλόμενο χαρακτηριστικό δεν έχει ποσοτικό μέτρο, η παραλλαγή ονομάζεται ποιοτική και η σειρά κατανομής ονομάζεται αποδοτική (για παράδειγμα, κατανομή ανά έκβαση ασθένειας, κατάσταση υγείας κ.λπ.).

Εάν ένα μεταβαλλόμενο χαρακτηριστικό έχει ποσοτική έκφραση, αυτή η παραλλαγή ονομάζεται ποσοτική και η σειρά κατανομής ονομάζεται μεταβλητή.

Οι σειρές παραλλαγών χωρίζονται σε ασυνεχείς και συνεχείς - με βάση τη φύση του ποσοτικού χαρακτηριστικού απλές και σταθμισμένες - με βάση τη συχνότητα εμφάνισης της παραλλαγής.

Σε μια απλή σειρά παραλλαγών, κάθε επιλογή εμφανίζεται μόνο μία φορά (p=1), σε μια σταθμισμένη σειρά, η ίδια επιλογή εμφανίζεται πολλές φορές (p>1). Παραδείγματα τέτοιων σειρών θα συζητηθούν περαιτέρω στο κείμενο. Αν το ποσοτικό χαρακτηριστικό είναι συνεχές, δηλ. Ανάμεσα σε ακέραια μεγέθη υπάρχουν ενδιάμεσα κλασματικά μεγέθη, η σειρά μεταβολής ονομάζεται συνεχής.

Για παράδειγμα: 10,0 – 11,9

14,0 – 15,9, κ.λπ.

Εάν το ποσοτικό χαρακτηριστικό είναι ασυνεχές, π.χ. Οι επιμέρους τιμές του (παραλλαγές) διαφέρουν μεταξύ τους κατά έναν ακέραιο και δεν έχουν ενδιάμεσες κλασματικές τιμές, η σειρά παραλλαγής ονομάζεται ασυνεχής ή διακριτή.

Χρησιμοποιώντας τα δεδομένα καρδιακών παλμών από το προηγούμενο παράδειγμα

για 21 μαθητές, θα κατασκευάσουμε μια σειρά παραλλαγών (Πίνακας 1).

Τραπέζι 1

Κατανομή φοιτητών ιατρικής ανά καρδιακό ρυθμό (bpm)

Έτσι, η κατασκευή μιας σειράς παραλλαγών σημαίνει συστηματοποίηση και οργάνωση των διαθέσιμων αριθμητικών τιμών (παραλλαγών), δηλ. τακτοποιούν σε μια συγκεκριμένη σειρά (σε αύξουσα ή φθίνουσα σειρά) με τις αντίστοιχες συχνότητές τους. Στο υπό εξέταση παράδειγμα, οι επιλογές είναι διατεταγμένες σε αύξουσα σειρά και εκφράζονται ως ακέραιοι ασυνεχείς (διακριτές) αριθμοί, κάθε επιλογή εμφανίζεται πολλές φορές, δηλ. έχουμε να κάνουμε με μια σταθμισμένη, ασυνεχή ή διακριτή σειρά παραλλαγής.

Κατά κανόνα, εάν ο αριθμός των παρατηρήσεων στον στατιστικό πληθυσμό που μελετάμε δεν υπερβαίνει τις 30, τότε αρκεί να ταξινομηθούν όλες οι τιμές του χαρακτηριστικού που μελετάται σε μια αύξουσα σειρά παραλλαγών, όπως στον Πίνακα. 1, ή φθίνουσα σειρά.

Με μεγάλο αριθμό παρατηρήσεων (n>30), ο αριθμός των εμφανιζόμενων παραλλαγών μπορεί να είναι πολύ μεγάλος σε αυτή την περίπτωση, συντάσσεται μια σειρά διαστημάτων ή ομαδοποιημένων παραλλαγών, στην οποία, για να απλοποιηθεί η επακόλουθη επεξεργασία και να διευκρινιστεί η φύση της κατανομής. οι παραλλαγές συνδυάζονται σε ομάδες.

Συνήθως ο αριθμός των επιλογών ομάδας κυμαίνεται από 8 έως 15.

Θα πρέπει να είναι τουλάχιστον 5 από αυτούς, γιατί... Διαφορετικά, θα είναι πολύ σκληρή, υπερβολική μεγέθυνση, η οποία αλλοιώνει τη συνολική εικόνα της διακύμανσης και επηρεάζει σε μεγάλο βαθμό την ακρίβεια των μέσων τιμών. Όταν ο αριθμός των ομαδικών παραλλαγών είναι μεγαλύτερος από 20-25, η ακρίβεια του υπολογισμού των μέσων τιμών αυξάνεται, αλλά τα χαρακτηριστικά της διακύμανσης του χαρακτηριστικού παραμορφώνονται σημαντικά και η μαθηματική επεξεργασία γίνεται πιο περίπλοκη.

Κατά τη σύνταξη μιας ομαδοποιημένης σειράς, είναι απαραίτητο να ληφθεί υπόψη

− Οι ομάδες επιλογών πρέπει να είναι διατεταγμένες με συγκεκριμένη σειρά (αύξουσα ή φθίνουσα).

− Τα διαστήματα στις ομάδες επιλογών πρέπει να είναι τα ίδια.

− οι τιμές των ορίων του διαστήματος δεν πρέπει να συμπίπτουν, γιατί θα είναι ασαφές σε ποιες ομάδες θα ταξινομηθούν μεμονωμένες παραλλαγές.

− είναι απαραίτητο να ληφθούν υπόψη τα ποιοτικά χαρακτηριστικά του συλλεγόμενου υλικού κατά τον καθορισμό ορίων διαστήματος (για παράδειγμα, κατά τη μελέτη του βάρους των ενηλίκων, ένα διάστημα 3-4 κιλών είναι αποδεκτό και για τα παιδιά των πρώτων μηνών της ζωής δεν πρέπει να υπερβαίνει τα 100 g)

Ας κατασκευάσουμε μια ομαδοποιημένη (διαλειμματική) σειρά που χαρακτηρίζει δεδομένα σχετικά με τον ρυθμό σφυγμού (παλμούς ανά λεπτό) 55 φοιτητών ιατρικής πριν από την εξέταση: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Για να δημιουργήσετε μια ομαδοποιημένη σειρά χρειάζεστε:

1. Προσδιορίστε το μέγεθος του διαστήματος.

2. Προσδιορίστε τη μέση, την αρχή και το τέλος των ομάδων της σειράς παραλλαγής.

● Το μέγεθος του διαστήματος (i) καθορίζεται από τον αριθμό των υποτιθέμενων ομάδων (r), ο αριθμός των οποίων ορίζεται ανάλογα με τον αριθμό των παρατηρήσεων (n) σύμφωνα με ειδικό πίνακα

Αριθμός ομάδων ανάλογα με τον αριθμό των παρατηρήσεων:

Στην περίπτωσή μας, για 55 μαθητές, μπορείτε να δημιουργήσετε από 8 έως 10 ομάδες.

Η τιμή του διαστήματος (i) καθορίζεται από τον ακόλουθο τύπο -

i = V max-V min/r

Στο παράδειγμά μας, η τιμή του διαστήματος είναι 82-58/8= 3.

Εάν η τιμή του διαστήματος είναι κλάσμα, το αποτέλεσμα πρέπει να στρογγυλοποιηθεί στον πλησιέστερο ακέραιο αριθμό.

Υπάρχουν διάφοροι τύποι μέσου όρου:

● αριθμητικός μέσος όρος,

● γεωμετρικό μέσο,

● αρμονική μέση,

● ρίζα μέσο τετράγωνο,

● μέση προοδευτική,

● διάμεσος

Στις ιατρικές στατιστικές, οι αριθμητικοί μέσοι όροι χρησιμοποιούνται συχνότερα.

Ο αριθμητικός μέσος όρος (M) είναι μια γενικευμένη τιμή που καθορίζει τι είναι τυπικό για ολόκληρο τον πληθυσμό. Οι κύριες μέθοδοι για τον υπολογισμό του Μ είναι: η μέθοδος του αριθμητικού μέσου όρου και η μέθοδος των ροπών (προϋποθέσεις αποκλίσεις).

Η μέθοδος του αριθμητικού μέσου όρου χρησιμοποιείται για τον υπολογισμό του απλού αριθμητικού μέσου όρου και του σταθμισμένου αριθμητικού μέσου όρου. Η επιλογή της μεθόδου για τον υπολογισμό του αριθμητικού μέσου όρου εξαρτάται από τον τύπο της σειράς διακύμανσης. Στην περίπτωση μιας απλής σειράς παραλλαγής, στην οποία κάθε επιλογή εμφανίζεται μόνο μία φορά, ο αριθμητικός μέσος απλός καθορίζεται από τον τύπο:

όπου: M – αριθμητική μέση τιμή.

V – τιμή του μεταβαλλόμενου χαρακτηριστικού (παραλλαγές).

Σ – δηλώνει τη δράση – άθροιση.

n – συνολικός αριθμός παρατηρήσεων.

Ένα παράδειγμα υπολογισμού του απλού αριθμητικού μέσου όρου. Αναπνευστικός ρυθμός (αριθμός αναπνευστικών κινήσεων ανά λεπτό) σε 9 άνδρες ηλικίας 35 ετών: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Για τον προσδιορισμό του μέσου επιπέδου αναπνευστικού ρυθμού σε άνδρες ηλικίας 35 ετών, είναι απαραίτητο:

1. Κατασκευάστε μια σειρά παραλλαγής, τακτοποιώντας όλες τις επιλογές σε αύξουσα ή φθίνουσα σειρά Έχουμε λάβει μια απλή σειρά παραλλαγής, επειδή Οι τιμές των επιλογών εμφανίζονται μόνο μία φορά.

M = ∑V/n = 171/9 = 19 αναπνοές ανά λεπτό

Συμπέρασμα. Ο αναπνευστικός ρυθμός στους άνδρες ηλικίας 35 ετών είναι κατά μέσο όρο 19 αναπνευστικές κινήσεις ανά λεπτό.

Εάν επαναλαμβάνονται μεμονωμένες τιμές μιας παραλλαγής, δεν χρειάζεται να γράψετε κάθε παραλλαγή σε μια γραμμή, αρκεί να αναφέρετε τα μεγέθη της παραλλαγής (V) και δίπλα να υποδείξετε τον αριθμό των επαναλήψεών τους (σ. ). Μια τέτοια σειρά διακύμανσης, στην οποία οι επιλογές ζυγίζονται, όπως λέγαμε, με τον αριθμό των συχνοτήτων που αντιστοιχούν σε αυτές, ονομάζεται σταθμισμένη σειρά διακύμανσης και η υπολογισμένη μέση τιμή είναι ο σταθμισμένος αριθμητικός μέσος όρος.

Ο σταθμισμένος αριθμητικός μέσος όρος προσδιορίζεται από τον τύπο: M= ∑Vp/n

όπου n είναι ο αριθμός των παρατηρήσεων ίσος με το άθροισμα των συχνοτήτων – Σρ.

Ένα παράδειγμα υπολογισμού του αριθμητικού σταθμισμένου μέσου όρου.

Η διάρκεια της αναπηρίας (σε ημέρες) σε 35 ασθενείς με οξείες αναπνευστικές παθήσεις (ARI) που αντιμετωπίστηκαν από τοπικό γιατρό κατά το πρώτο τρίμηνο του τρέχοντος έτους ήταν: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 ημέρες .

Η μέθοδος για τον προσδιορισμό της μέσης διάρκειας αναπηρίας σε ασθενείς με οξείες αναπνευστικές λοιμώξεις είναι η εξής:

1. Ας κατασκευάσουμε μια σταθμισμένη σειρά παραλλαγής, γιατί Οι μεμονωμένες τιμές της επιλογής επαναλαμβάνονται πολλές φορές. Για να το κάνετε αυτό, μπορείτε να τακτοποιήσετε όλες τις επιλογές σε αύξουσα ή φθίνουσα σειρά με τις αντίστοιχες συχνότητές τους.

Στην περίπτωσή μας, οι επιλογές είναι ταξινομημένες με αύξουσα σειρά

2. Υπολογίστε τον αριθμητικό σταθμισμένο μέσο όρο χρησιμοποιώντας τον τύπο: M = ∑Vp/n = 233/35 = 6,7 ημέρες

Κατανομή ασθενών με οξείες αναπνευστικές λοιμώξεις κατά διάρκεια αναπηρίας:

Διάρκεια αναπηρίας (V) Αριθμός ασθενών (p) Vp
∑p = n = 35 ∑Vp = 233

Συμπέρασμα. Η διάρκεια της αναπηρίας σε ασθενείς με οξείες αναπνευστικές παθήσεις ήταν κατά μέσο όρο 6,7 ημέρες.

Η λειτουργία (Mo) είναι η πιο κοινή επιλογή στη σειρά παραλλαγών. Για την κατανομή που παρουσιάζεται στον πίνακα, η λειτουργία αντιστοιχεί σε μια επιλογή ίση με 10, εμφανίζεται πιο συχνά από άλλες - 6 φορές.

Κατανομή ασθενών κατά διάρκεια παραμονής σε νοσοκομειακό κρεβάτι (σε ​​ημέρες)

V
Π

Μερικές φορές είναι δύσκολο να προσδιοριστεί το ακριβές μέγεθος ενός τρόπου λειτουργίας, επειδή μπορεί να υπάρχουν αρκετές «πιο κοινές» παρατηρήσεις στα δεδομένα που μελετώνται.

Ο διάμεσος (Me) είναι ένας μη παραμετρικός δείκτης που χωρίζει μια σειρά παραλλαγών σε δύο ίσα μισά: ο ίδιος αριθμός παραλλαγών βρίσκεται και στις δύο πλευρές της διάμεσης τιμής.

Για παράδειγμα, για την κατανομή που φαίνεται στον πίνακα, η διάμεσος είναι 10, επειδή και στις δύο πλευρές αυτής της τιμής υπάρχουν 14 επιλογές, δηλ. ο αριθμός 10 κατέχει κεντρική θέση σε αυτή τη σειρά και είναι ο διάμεσος.

Δεδομένου ότι ο αριθμός των παρατηρήσεων σε αυτό το παράδειγμα είναι ζυγός (n=34), η διάμεσος μπορεί να προσδιοριστεί ως εξής:

Εγώ = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Αυτό σημαίνει ότι το μέσο της σειράς πέφτει στη δέκατη έβδομη επιλογή, η οποία αντιστοιχεί σε διάμεσο ίσο με 10. Για την κατανομή που παρουσιάζεται στον πίνακα, ο αριθμητικός μέσος όρος είναι ίσος με:

M = ∑Vp/n = 334/34 = 10,1

Έτσι, για 34 παρατηρήσεις από τον πίνακα. 8, πήραμε: Mo=10, Me=10, ο αριθμητικός μέσος όρος (M) είναι 10,1. Στο παράδειγμά μας, και οι τρεις δείκτες αποδείχθηκαν ίσοι ή κοντά ο ένας στον άλλο, αν και είναι εντελώς διαφορετικοί.

Ο αριθμητικός μέσος όρος είναι το προκύπτον άθροισμα όλων των επιρροών χωρίς εξαίρεση, συμπεριλαμβανομένων των ακραίων, συχνά άτυπων για ένα δεδομένο φαινόμενο ή πληθυσμό, που συμμετέχουν στο σχηματισμό του.

Ο τρόπος λειτουργίας και η διάμεσος, σε αντίθεση με τον αριθμητικό μέσο όρο, δεν εξαρτώνται από την τιμή όλων των επιμέρους τιμών του ποικίλου χαρακτηριστικού (τις τιμές των ακραίων παραλλαγών και ο βαθμός διασποράς της σειράς). Ο αριθμητικός μέσος όρος χαρακτηρίζει ολόκληρη τη μάζα των παρατηρήσεων, ο τρόπος και η διάμεσος χαρακτηρίζουν το μεγαλύτερο μέρος

ΚΑΤΗΓΟΡΙΕΣ

Δημοφιλή ΑΡΘΡΑ

2024 "kingad.ru" - υπερηχογραφική εξέταση ανθρώπινων οργάνων