Το τεστ συσχέτισης Pearson είναι μια παραμετρική στατιστική μέθοδος που σας επιτρέπει να προσδιορίσετε την παρουσία ή την απουσία μιας γραμμικής σχέσης μεταξύ δύο ποσοτικών δεικτών, καθώς και να αξιολογήσετε την εγγύτητα και τη στατιστική σημασία της. Με άλλα λόγια, το τεστ συσχέτισης Pearson σάς επιτρέπει να προσδιορίσετε εάν υπάρχει γραμμική σχέση μεταξύ των αλλαγών στις τιμές δύο μεταβλητών. Σε στατιστικούς υπολογισμούς και συμπεράσματα, ο συντελεστής συσχέτισης συνήθως συμβολίζεται ως rxyή Rxy.

1. Ιστορικό ανάπτυξης του κριτηρίου συσχέτισης

Το τεστ συσχέτισης Pearson αναπτύχθηκε από μια ομάδα Βρετανών επιστημόνων με επικεφαλής τον Καρλ Πίρσον(1857-1936) στη δεκαετία του '90 του 19ου αιώνα, για να απλοποιηθεί η ανάλυση της συνδιακύμανσης δύο τυχαίων μεταβλητών. Εκτός από τον Karl Pearson, εργάστηκε και το τεστ συσχέτισης του Pearson Φράνσις Έτζγουορθκαι Ραφαέλ Ουέλντον.

2. Σε τι χρησιμεύει το τεστ συσχέτισης Pearson;

Το κριτήριο συσχέτισης Pearson σάς επιτρέπει να προσδιορίσετε ποια είναι η εγγύτητα (ή η ισχύς) της συσχέτισης μεταξύ δύο δεικτών που μετρώνται σε ποσοτική κλίμακα. Με τη βοήθεια πρόσθετων υπολογισμών, μπορείτε επίσης να προσδιορίσετε πόσο στατιστικά σημαντική είναι η προσδιορισμένη σχέση.

Για παράδειγμα, χρησιμοποιώντας το κριτήριο συσχέτισης Pearson, μπορεί κανείς να απαντήσει στο ερώτημα εάν υπάρχει σχέση μεταξύ της θερμοκρασίας του σώματος και της περιεκτικότητας σε λευκοκύτταρα στο αίμα σε οξείες αναπνευστικές λοιμώξεις, μεταξύ του ύψους και του βάρους του ασθενούς, μεταξύ της περιεκτικότητας σε φθόριο. στο πόσιμο νερό και η συχνότητα της τερηδόνας στον πληθυσμό.

3. Προϋποθέσεις και περιορισμοί στη χρήση του πειράματος chi-square του Pearson

  1. Συγκρίσιμοι δείκτες θα πρέπει να μετρώνται σε ποσοτική κλίμακα(για παράδειγμα, καρδιακός ρυθμός, θερμοκρασία σώματος, αριθμός λευκοκυττάρων ανά 1 ml αίματος, συστολική αρτηριακή πίεση).
  2. Μέσω του κριτηρίου συσχέτισης Pearson, είναι δυνατός ο προσδιορισμός μόνο την παρουσία και τη δύναμη μιας γραμμικής σχέσηςμεταξύ των ποσοτήτων. Άλλα χαρακτηριστικά της σύνδεσης, συμπεριλαμβανομένης της κατεύθυνσης (άμεση ή αντίστροφη), η φύση των αλλαγών (ευθύγραμμη ή καμπυλόγραμμη), καθώς και η εξάρτηση μιας μεταβλητής από την άλλη, προσδιορίζονται με ανάλυση παλινδρόμησης.
  3. Ο αριθμός των τιμών που θα συγκριθούν πρέπει να είναι ίσος με δύο. Στην περίπτωση ανάλυσης της σχέσης τριών ή περισσότερων παραμέτρων, θα πρέπει να χρησιμοποιήσετε τη μέθοδο παραγοντική ανάλυση.
  4. Το κριτήριο συσχέτισης του Pearson είναι παραμετρική, σε σχέση με την οποία είναι η προϋπόθεση για την εφαρμογή του κανονική κατανομήαντιστοιχισμένες μεταβλητές. Εάν είναι απαραίτητο να πραγματοποιηθεί μια ανάλυση συσχέτισης δεικτών των οποίων η κατανομή διαφέρει από την κανονική, συμπεριλαμβανομένων εκείνων που μετρώνται σε τακτική κλίμακα, θα πρέπει να χρησιμοποιηθεί ο συντελεστής συσχέτισης κατάταξης του Spearman.
  5. Είναι απαραίτητο να γίνει σαφής διάκριση μεταξύ των εννοιών της εξάρτησης και της συσχέτισης. Η εξάρτηση των τιμών καθορίζει την ύπαρξη συσχέτισης μεταξύ τους, αλλά όχι το αντίστροφο.

Για παράδειγμα, η ανάπτυξη ενός παιδιού εξαρτάται από την ηλικία του, δηλαδή όσο μεγαλύτερο είναι το παιδί τόσο πιο ψηλό είναι. Αν πάρουμε δύο παιδιά διαφορετικών ηλικιών, τότε με μεγάλο βαθμό πιθανότητας η ανάπτυξη του μεγαλύτερου παιδιού θα είναι μεγαλύτερη από αυτή του μικρότερου. Αυτό το φαινόμενο ονομάζεται εθισμός, υπονοώντας μια αιτιώδη σχέση μεταξύ των δεικτών. Φυσικά και υπάρχουν συσχέτιση, που σημαίνει ότι οι αλλαγές σε έναν δείκτη συνοδεύονται από αλλαγές σε έναν άλλο δείκτη.

Σε μια άλλη περίπτωση, εξετάστε τη σχέση μεταξύ της ανάπτυξης του παιδιού και του καρδιακού παλμού (HR). Όπως γνωρίζετε, και οι δύο αυτές τιμές εξαρτώνται άμεσα από την ηλικία, επομένως, στις περισσότερες περιπτώσεις, τα παιδιά μεγαλύτερου αναστήματος (και, επομένως, τα μεγαλύτερα) θα έχουν χαμηλότερες τιμές καρδιακών παλμών. Αυτό είναι, συσχέτισηθα παρατηρηθεί και μπορεί να έχει αρκετά υψηλή στεγανότητα. Ωστόσο, αν πάρουμε παιδιά η ιδια ηλικια, αλλά διαφορετικό ύψος, τότε, πιθανότατα, ο καρδιακός ρυθμός τους θα διαφέρει ασήμαντα, σε σχέση με το οποίο μπορούμε να συμπεράνουμε ότι ανεξαρτησίαΚαρδιακός ρυθμός από την ανάπτυξη.

Το παραπάνω παράδειγμα δείχνει πόσο σημαντικό είναι να γίνεται διάκριση μεταξύ των βασικών εννοιών στη στατιστική συνδέσειςκαι εξαρτήσειςδείκτες για την εξαγωγή ορθών συμπερασμάτων.

4. Πώς υπολογίζεται ο συντελεστής συσχέτισης Pearson;

Ο συντελεστής συσχέτισης Pearson υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

5. Πώς ερμηνεύεται η τιμή του συντελεστή συσχέτισης Pearson;

Οι τιμές του συντελεστή συσχέτισης Pearson ερμηνεύονται με βάση τις απόλυτες τιμές του. Οι πιθανές τιμές του συντελεστή συσχέτισης ποικίλλουν από 0 έως ±1. Όσο μεγαλύτερη είναι η απόλυτη τιμή του r xy, τόσο μεγαλύτερη είναι η εγγύτητα της σχέσης μεταξύ των δύο μεγεθών. Το r xy = 0 υποδηλώνει πλήρη έλλειψη σύνδεσης. r xy = 1 - υποδηλώνει την παρουσία απόλυτης (λειτουργικής) σύνδεσης. Εάν η τιμή του κριτηρίου συσχέτισης Pearson αποδεικνυόταν μεγαλύτερη από 1 ή μικρότερη από -1, έγινε λάθος στους υπολογισμούς.

Για να εκτιμηθεί η εγγύτητα ή η ισχύς της συσχέτισης, χρησιμοποιούνται γενικά αποδεκτά κριτήρια, σύμφωνα με τα οποία οι απόλυτες τιμές του r xy< 0.3 свидетельствуют о αδύναμοςσύνδεση, τιμές r xy από 0,3 έως 0,7 - σχετικά με τη σύνδεση Μέσηςστεγανότητα, τιμές r xy > 0,7 - o ισχυρόςσυνδέσεις.

Μια πιο ακριβής εκτίμηση της ισχύος της συσχέτισης μπορεί να ληφθεί χρησιμοποιώντας Τραπέζι Chaddock:

Βαθμός στατιστική σημασίαΟ συντελεστής συσχέτισης r xy πραγματοποιείται χρησιμοποιώντας το τεστ t, που υπολογίζεται με τον ακόλουθο τύπο:

Η λαμβανόμενη τιμή t r συγκρίνεται με την κρίσιμη τιμή σε ένα ορισμένο επίπεδο σημαντικότητας και τον αριθμό των βαθμών ελευθερίας n-2. Εάν το t r υπερβαίνει το t crit, τότε βγαίνει ένα συμπέρασμα σχετικά με τη στατιστική σημασία της ταυτοποιημένης συσχέτισης.

6. Παράδειγμα υπολογισμού του συντελεστή συσχέτισης Pearson

Σκοπός της μελέτης ήταν ο εντοπισμός, ο προσδιορισμός της στεγανότητας και της στατιστικής σημασίας της συσχέτισης μεταξύ δύο ποσοτικών δεικτών: του επιπέδου τεστοστερόνης στο αίμα (Χ) και του ποσοστού μυϊκής μάζας στο σώμα (Υ). Τα αρχικά δεδομένα για ένα δείγμα 5 ατόμων (n = 5) συνοψίζονται στον πίνακα.

Στην επιστημονική έρευνα, συχνά καθίσταται απαραίτητο να βρεθεί μια σχέση μεταξύ των μεταβλητών που προκύπτουν και των παραγόντων (η απόδοση μιας καλλιέργειας και η ποσότητα της βροχόπτωσης, το ύψος και το βάρος ενός ατόμου σε ομοιογενείς ομάδες ανά φύλο και ηλικία, ρυθμός σφυγμού και θερμοκρασία σώματος , και τα λοιπά.).

Τα δεύτερα είναι ζώδια που συμβάλλουν στην αλλαγή όσων συνδέονται μαζί τους (το πρώτο).

Η έννοια της ανάλυσης συσχέτισης

Υπάρχει ένα σύνολο Με βάση τα παραπάνω, μπορούμε να πούμε ότι η ανάλυση συσχέτισης είναι μια μέθοδος που χρησιμοποιείται για τον έλεγχο της υπόθεσης της στατιστικής σημασίας δύο ή περισσότερων μεταβλητών, εάν ο ερευνητής μπορεί να τις μετρήσει, αλλά όχι να τις αλλάξει.

Υπάρχουν και άλλοι ορισμοί της έννοιας υπό εξέταση. Η ανάλυση συσχέτισης είναι μια μέθοδος επεξεργασίας που εξετάζει τους συντελεστές συσχέτισης μεταξύ μεταβλητών. Σε αυτή την περίπτωση, οι συντελεστές συσχέτισης μεταξύ ενός ζεύγους ή πολλαπλών ζευγών χαρακτηριστικών συγκρίνονται για να δημιουργηθούν στατιστικές σχέσεις μεταξύ τους. Η ανάλυση συσχέτισης είναι μια μέθοδος για τη μελέτη της στατιστικής εξάρτησης μεταξύ τυχαίων μεταβλητών με την προαιρετική παρουσία αυστηρής λειτουργικής φύσης, στην οποία η δυναμική μιας τυχαίας μεταβλητής οδηγεί στη δυναμική της μαθηματικής προσδοκίας μιας άλλης.

Η έννοια της ψευδούς συσχέτισης

Κατά τη διεξαγωγή μιας ανάλυσης συσχέτισης, πρέπει να ληφθεί υπόψη ότι μπορεί να πραγματοποιηθεί σε σχέση με οποιοδήποτε σύνολο χαρακτηριστικών, συχνά παράλογα μεταξύ τους. Μερικές φορές δεν έχουν αιτιολογική σχέση μεταξύ τους.

Σε αυτή την περίπτωση, μιλάμε για ψευδή συσχέτιση.

Προβλήματα ανάλυσης συσχέτισης

Με βάση τους παραπάνω ορισμούς, μπορούμε να διατυπώσουμε τις ακόλουθες εργασίες της περιγραφόμενης μεθόδου: να λάβουμε πληροφορίες για μία από τις επιθυμητές μεταβλητές χρησιμοποιώντας την άλλη. προσδιορίζουν την εγγύτητα της σχέσης μεταξύ των υπό μελέτη μεταβλητών.

Η ανάλυση συσχέτισης περιλαμβάνει τον προσδιορισμό της σχέσης μεταξύ των χαρακτηριστικών που μελετήθηκαν και επομένως οι εργασίες της ανάλυσης συσχέτισης μπορούν να συμπληρωθούν με τα ακόλουθα:

  • προσδιορισμός παραγόντων που έχουν τη μεγαλύτερη επίδραση στο προκύπτον πρόσημο.
  • εντοπισμός ανεξερεύνητων προηγουμένως αιτιών σχέσεων.
  • κατασκευή ενός μοντέλου συσχέτισης με την παραμετρική του ανάλυση.
  • μελέτη της σημασίας των παραμέτρων επικοινωνίας και εκτίμηση των διαστημάτων τους.

Σύνδεση ανάλυσης συσχέτισης με παλινδρόμηση

Η μέθοδος ανάλυσης συσχέτισης συχνά δεν περιορίζεται στην εύρεση της εγγύτητας της σχέσης μεταξύ των μεγεθών που μελετήθηκαν. Μερικές φορές συμπληρώνεται από τη συλλογή εξισώσεων παλινδρόμησης, οι οποίες λαμβάνονται χρησιμοποιώντας την ανάλυση με το ίδιο όνομα, και οι οποίες είναι μια περιγραφή της συσχέτισης μεταξύ του προκύπτοντος και του παραγοντικού (παραγοντικού) χαρακτηριστικού(ων). Αυτή η μέθοδος, μαζί με την υπό εξέταση ανάλυση, αποτελεί τη μέθοδο

Προϋποθέσεις χρήσης της μεθόδου

Οι παράγοντες έκβασης εξαρτώνται από έναν ή περισσότερους παράγοντες. Η μέθοδος της ανάλυσης συσχέτισης μπορεί να χρησιμοποιηθεί εάν υπάρχει μεγάλος αριθμός παρατηρήσεων σχετικά με την αξία των αποτελεσματικών και παραγόντων δεικτών (παράγοντες), ενώ οι παράγοντες που μελετήθηκαν θα πρέπει να είναι ποσοτικοί και να αντικατοπτρίζονται σε συγκεκριμένες πηγές. Το πρώτο μπορεί να προσδιοριστεί από τον κανονικό νόμο - σε αυτήν την περίπτωση, οι συντελεστές συσχέτισης Pearson είναι το αποτέλεσμα της ανάλυσης συσχέτισης ή, εάν τα σημάδια δεν υπακούουν σε αυτόν τον νόμο, χρησιμοποιείται ο συντελεστής συσχέτισης κατάταξης Spearman.

Κανόνες επιλογής παραγόντων ανάλυσης συσχέτισης

Κατά την εφαρμογή αυτής της μεθόδου, είναι απαραίτητο να προσδιοριστούν οι παράγοντες που επηρεάζουν τους δείκτες απόδοσης. Επιλέγονται λαμβάνοντας υπόψη το γεγονός ότι πρέπει να υπάρχουν αιτιώδεις σχέσεις μεταξύ των δεικτών. Στην περίπτωση δημιουργίας ενός πολυπαραγοντικού μοντέλου συσχέτισης, επιλέγονται εκείνοι που έχουν σημαντική επίδραση στον προκύπτοντα δείκτη, ενώ είναι προτιμότερο να μην περιλαμβάνονται αλληλεξαρτώμενοι παράγοντες με συντελεστή συσχέτισης ζεύγους μεγαλύτερο του 0,85 στο μοντέλο συσχέτισης, καθώς και αυτοί για την οποία η σχέση με την παράμετρο που προκύπτει είναι έμμεση ή λειτουργική.

Εμφάνιση αποτελεσμάτων

Τα αποτελέσματα της ανάλυσης συσχέτισης μπορούν να παρουσιαστούν σε μορφή κειμένου και γραφικών. Στην πρώτη περίπτωση παρουσιάζονται ως συντελεστής συσχέτισης, στη δεύτερη ως διάγραμμα διασποράς.

Εάν δεν υπάρχει συσχέτιση μεταξύ των παραμέτρων, τα σημεία στο διάγραμμα εντοπίζονται τυχαία, ο μέσος βαθμός σύνδεσης χαρακτηρίζεται από μεγαλύτερο βαθμό τάξης και χαρακτηρίζεται από μια περισσότερο ή λιγότερο ομοιόμορφη απόσταση των σημειωμένων σημαδιών από τη διάμεσο. Μια ισχυρή σύνδεση τείνει σε ευθεία γραμμή και στο r=1 το διάγραμμα διασποράς είναι μια επίπεδη γραμμή. Μια αντίστροφη συσχέτιση χαρακτηρίζεται από την κατεύθυνση του γραφήματος από πάνω αριστερά προς τα κάτω δεξιά, μια άμεση - από την κάτω αριστερή στην επάνω δεξιά γωνία.

τρισδιάστατη αναπαράσταση ενός scatterplot (σκέδαση)

Εκτός από την παραδοσιακή παρουσίαση 2D scatterplot, χρησιμοποιείται επί του παρόντος μια τρισδιάστατη γραφική αναπαράσταση της ανάλυσης συσχέτισης.

Χρησιμοποιείται επίσης ένας πίνακας scatterplot, ο οποίος εμφανίζει όλα τα ζευγαρωμένα διαγράμματα σε ένα μόνο σχήμα σε μορφή πίνακα. Για n μεταβλητές, ο πίνακας περιέχει n γραμμές και n στήλες. Το διάγραμμα που βρίσκεται στην τομή της i-ης σειράς και της j-ης στήλης είναι ένα γράφημα των μεταβλητών Xi σε σύγκριση με το Xj. Έτσι, κάθε γραμμή και στήλη είναι μία διάσταση, ένα μεμονωμένο κελί εμφανίζει ένα διάγραμμα διασποράς των δύο διαστάσεων.

Εκτίμηση στεγανότητας επικοινωνίας

Η στεγανότητα της συσχέτισης προσδιορίζεται από τον συντελεστή συσχέτισης (r): ισχυρός - r = ±0,7 έως ±1, μεσαίος - r = ±0,3 έως ±0,699, ασθενής - r = 0 έως ±0,299. Αυτή η ταξινόμηση δεν είναι αυστηρή. Το σχήμα δείχνει ένα ελαφρώς διαφορετικό σχήμα.

Ένα παράδειγμα εφαρμογής της μεθόδου ανάλυσης συσχέτισης

Μια ενδιαφέρουσα μελέτη πραγματοποιήθηκε στο Ηνωμένο Βασίλειο. Είναι αφιερωμένο στη σχέση του καπνίσματος με τον καρκίνο του πνεύμονα και πραγματοποιήθηκε με ανάλυση συσχέτισης. Αυτή η παρατήρηση παρουσιάζεται παρακάτω.

Τεστ συσχέτισης Pearson. Στατιστική Σημασία Παλινδρόμησης και Παραμέτρων Συσχέτισης

Εισαγωγή. 2

1. Αξιολόγηση της σημασίας των συντελεστών παλινδρόμησης και συσχέτισης με χρήση του Student's f-test. 3

2. Υπολογισμός της σημασίας των συντελεστών παλινδρόμησης και συσχέτισης με χρήση του Student's f-test. 6

Συμπέρασμα. δεκαπέντε

Μετά την κατασκευή της εξίσωσης παλινδρόμησης, είναι απαραίτητο να ελέγξετε τη σημασία της: χρησιμοποιώντας ειδικά κριτήρια, καθορίστε εάν η προκύπτουσα εξάρτηση, που εκφράζεται από την εξίσωση παλινδρόμησης, είναι τυχαία, δηλ. εάν μπορεί να χρησιμοποιηθεί για προγνωστικούς σκοπούς και για ανάλυση παραγόντων. Στη στατιστική, έχουν αναπτυχθεί μέθοδοι για τον αυστηρό έλεγχο της σημασίας των συντελεστών παλινδρόμησης χρησιμοποιώντας ανάλυση διακύμανσης και τον υπολογισμό ειδικών κριτηρίων (για παράδειγμα, το κριτήριο F). Ένας μη αυστηρός έλεγχος μπορεί να πραγματοποιηθεί με τον υπολογισμό της μέσης σχετικής γραμμικής απόκλισης (e), που ονομάζεται μέσο σφάλμα προσέγγισης:

Τώρα ας προχωρήσουμε στην εκτίμηση της σημασίας των συντελεστών παλινδρόμησης bj και στην κατασκευή ενός διαστήματος εμπιστοσύνης για τις παραμέτρους του μοντέλου παλινδρόμησης Py (J=l,2,..., p).

Πεδίο 5 - εκτίμηση της σημασίας των συντελεστών παλινδρόμησης με την τιμή του Student's t-test. Οι υπολογισμένες τιμές του ta συγκρίνονται με την επιτρεπόμενη τιμή

Πεδίο 5 - εκτίμηση της σημασίας των συντελεστών παλινδρόμησης με την τιμή του κριτηρίου ^. Οι υπολογισμένες τιμές του t0n συγκρίνονται με την επιτρεπόμενη τιμή 4,/, η οποία προσδιορίζεται από τους πίνακες των κατανομών t για μια δεδομένη πιθανότητα σφάλματος (a) και τον αριθμό των βαθμών ελευθερίας (/).

Εκτός από τον έλεγχο της σημασίας ολόκληρου του μοντέλου, είναι απαραίτητο να ελεγχθεί η σημασία των συντελεστών παλινδρόμησης χρησιμοποιώντας το Student's /-test. Η ελάχιστη τιμή του συντελεστή παλινδρόμησης bg πρέπει να αντιστοιχεί στη συνθήκη bifob- ^t, όπου bi είναι η τιμή του συντελεστή της εξίσωσης παλινδρόμησης σε φυσική κλίμακα με το πρόσημο i-ο παράγοντα. αβ. - ρίζα μέσου τετραγωνικού σφάλματος κάθε συντελεστή. ασυμβατότητα μεταξύ τους ως προς τη σημασία των συντελεστών D·

Περαιτέρω στατιστική ανάλυση αφορά τον έλεγχο της σημαντικότητας των συντελεστών παλινδρόμησης. Για να γίνει αυτό, βρίσκουμε την τιμή του κριτηρίου ^ για τους συντελεστές παλινδρόμησης. Ως αποτέλεσμα της σύγκρισής τους, προσδιορίζεται το μικρότερο t-κριτήριο. Ο παράγοντας του οποίου ο συντελεστής αντιστοιχεί στο μικρότερο ^-κριτήριο αποκλείεται από περαιτέρω ανάλυση.

Για να εκτιμηθεί η στατιστική σημασία των συντελεστών παλινδρόμησης και συσχέτισης, υπολογίζεται το t-test Student και τα διαστήματα εμπιστοσύνης για κάθε έναν από τους δείκτες. Η υπόθεση Αλλά για την τυχαία φύση των δεικτών προβάλλεται, δηλ. για την ασήμαντη διαφορά τους από το μηδέν. Η αξιολόγηση της σημασίας των συντελεστών παλινδρόμησης και συσχέτισης με τη χρήση του Student's f-test πραγματοποιείται συγκρίνοντας τις τιμές τους με το μέγεθος του τυχαίου σφάλματος:

Η εκτίμηση της σημασίας των συντελεστών καθαρής παλινδρόμησης με χρήση /-Το κριτήριο του μαθητή ανάγεται στον υπολογισμό της τιμής

Η ποιότητα της εργασίας είναι χαρακτηριστικό μιας συγκεκριμένης εργασίας, αντικατοπτρίζοντας το βαθμό πολυπλοκότητάς της, την ένταση (έντασή της), τις συνθήκες και τη σημασία της για την ανάπτυξη της οικονομίας. Κ.τ. μετράται μέσω ενός συστήματος τιμολογίων που καθιστά δυνατή τη διαφοροποίηση των μισθών ανάλογα με το επίπεδο των προσόντων (πολυπλοκότητα της εργασίας), τις συνθήκες, τη σοβαρότητα της εργασίας και την έντασή της, καθώς και τη σημασία των επιμέρους βιομηχανιών και βιομηχανιών, περιοχών, εδάφη για την ανάπτυξη της οικονομίας της χώρας. Κ.τ. βρίσκει έκφραση στους μισθούς των εργαζομένων, που διαμορφώνονται στην αγορά εργασίας υπό την επίδραση της προσφοράς και της ζήτησης εργασίας (συγκεκριμένοι τύποι εργασίας). Κ.τ. - πολύπλοκη δομή

Οι βαθμολογίες που προέκυψαν για τη σχετική σημασία των επιμέρους οικονομικών, κοινωνικών και περιβαλλοντικών επιπτώσεων του έργου παρέχουν περαιτέρω μια βάση για σύγκριση εναλλακτικών έργων και των επιλογών τους χρησιμοποιώντας το "σύνθετο κριτήριο βαθμολόγησης αδιάστατης κοινωνικής και περιβαλλοντικής-οικονομικής αποτελεσματικότητας" του έργου Ec, υπολογισμένο (σε μέσες βαθμολογίες σημαντικότητας) σύμφωνα με τον τύπο

Ο ενδοβιομηχανικός κανονισμός προβλέπει διαφορές στους μισθούς των εργαζομένων σε έναν δεδομένο κλάδο της βιομηχανίας, ανάλογα με τη σημασία των επιμέρους τύπων παραγωγής σε αυτόν τον κλάδο, την πολυπλοκότητα και τις συνθήκες εργασίας, καθώς και τις μορφές μισθών που χρησιμοποιούνται.

Η ληφθείσα βαθμολογία αξιολόγησης της επιχείρησης που αναλύθηκε σε σχέση με την επιχείρηση αναφοράς, χωρίς να λαμβάνεται υπόψη η σημασία των επιμέρους δεικτών, είναι συγκριτική. Κατά τη σύγκριση των αξιολογήσεων πολλών επιχειρήσεων, η υψηλότερη βαθμολογία ανήκει στην επιχείρηση με την ελάχιστη τιμή της συγκριτικής αξιολόγησης που αποκτήθηκε.

Η κατανόηση της ποιότητας ενός προϊόντος ως μέτρο της χρησιμότητάς του εγείρει ένα πρακτικά σημαντικό ερώτημα σχετικά με τη μέτρησή του. Η λύση του επιτυγχάνεται με τη μελέτη της σημασίας των επιμέρους ιδιοκτησιών στην ικανοποίηση μιας συγκεκριμένης ανάγκης. Η σημασία ακόμη και της ίδιας ιδιότητας μπορεί να ποικίλλει ανάλογα με τις συνθήκες κατανάλωσης του προϊόντος. Κατά συνέπεια, η χρησιμότητα του αγαθού σε διαφορετικές συνθήκες χρήσης του είναι διαφορετική.

Το δεύτερο στάδιο της εργασίας είναι η μελέτη στατιστικών δεδομένων και ο προσδιορισμός της σχέσης και της αλληλεπίδρασης των δεικτών, ο προσδιορισμός της σημασίας των επιμέρους παραγόντων και οι λόγοι για την αλλαγή σε γενικούς δείκτες.

Όλοι οι δείκτες που εξετάζονται συγκεντρώνονται με τέτοιο τρόπο ώστε το αποτέλεσμα είναι μια συνολική αξιολόγηση όλων των αναλυόμενων πτυχών των δραστηριοτήτων της επιχείρησης, λαμβάνοντας υπόψη τις συνθήκες της δραστηριότητάς της, λαμβάνοντας υπόψη τον βαθμό σημασίας των επιμέρους δεικτών για διάφορους τύποι επενδυτών:

Οι συντελεστές παλινδρόμησης δείχνουν την ένταση της επίδρασης παραγόντων στον δείκτη απόδοσης. Εάν έχει πραγματοποιηθεί μια προκαταρκτική τυποποίηση των δεικτών συντελεστών, τότε το b0 είναι ίσο με τη μέση τιμή του ενεργού δείκτη στο σύνολο. Οι συντελεστές b, b2 ..... bl δείχνουν πόσες μονάδες το επίπεδο του ενεργού δείκτη αποκλίνει από τη μέση τιμή του εάν οι τιμές του δείκτη παράγοντα αποκλίνουν από το μέσο όρο ίσο με μηδέν κατά μία τυπική απόκλιση. Έτσι, οι συντελεστές παλινδρόμησης χαρακτηρίζουν τον βαθμό σημασίας των επιμέρους παραγόντων για την αύξηση του επιπέδου του αποτελεσματικού δείκτη. Οι συγκεκριμένες τιμές των συντελεστών παλινδρόμησης προσδιορίζονται από εμπειρικά δεδομένα σύμφωνα με τη μέθοδο των ελαχίστων τετραγώνων (ως αποτέλεσμα της επίλυσης συστημάτων κανονικών εξισώσεων).

2. Υπολογισμός της σημασίας της παλινδρόμησης και των συντελεστών συσχέτισης με χρήση του Student's f-test

Ας θεωρήσουμε τη γραμμική μορφή των πολυπαραγοντικών σχέσεων όχι μόνο ως την απλούστερη, αλλά και ως μορφή που παρέχεται από πακέτα λογισμικού εφαρμογών για υπολογιστές. Εάν η σύνδεση ενός μεμονωμένου παράγοντα με ένα προκύπτον χαρακτηριστικό δεν είναι γραμμική, τότε η εξίσωση γραμμικοποιείται αντικαθιστώντας ή μετασχηματίζοντας την τιμή του χαρακτηριστικού παράγοντα.

Η γενική μορφή της εξίσωσης πολυπαραγοντικής παλινδρόμησης είναι:


όπου k είναι ο αριθμός των χαρακτηριστικών παραγόντων.

Για να απλοποιηθεί το σύστημα των εξισώσεων ελαχίστων τετραγώνων που είναι απαραίτητο για τον υπολογισμό των παραμέτρων της εξίσωσης (8.32), συνήθως εισάγονται οι αποκλίσεις των επιμέρους τιμών όλων των χαρακτηριστικών από τις μέσες τιμές αυτών των χαρακτηριστικών.

Παίρνουμε ένα σύστημα k εξισώσεων ελαχίστων τετραγώνων:

Επιλύοντας αυτό το σύστημα, λαμβάνουμε τις τιμές των υπό όρους καθαρών συντελεστών παλινδρόμησης β. Ο ελεύθερος όρος της εξίσωσης υπολογίζεται από τον τύπο


Ο όρος "συντελεστής παλινδρόμησης υπό όρους-καθαρό" σημαίνει ότι κάθε μία από τις τιμές bj μετρά τη μέση απόκλιση πληθυσμού του προκύπτοντος χαρακτηριστικού από τη μέση τιμή του όταν ο δεδομένος παράγοντας xj αποκλίνει από τη μέση τιμή του ανά μονάδα μέτρησής του και υπό την προϋπόθεση ότι όλα τα άλλοι παράγοντες που περιλαμβάνονται στην εξίσωση παλινδρόμησης, σταθεροί σε μέσες τιμές, δεν αλλάζουν, δεν μεταβάλλονται.

Έτσι, σε αντίθεση με τον συντελεστή παλινδρόμησης ζεύγους, ο συντελεστής παλινδρόμησης υπό όρους-καθαρή μετρά την επίδραση ενός παράγοντα, αφαιρώντας από τη σχέση μεταξύ της διακύμανσης αυτού του παράγοντα και της διακύμανσης άλλων παραγόντων. Εάν είναι δυνατό να συμπεριληφθούν στην εξίσωση παλινδρόμησης όλοι οι παράγοντες που επηρεάζουν τη διακύμανση του προκύπτοντος χαρακτηριστικού, τότε οι τιμές bj. θα μπορούσαν να θεωρηθούν μέτρα της καθαρής επίδρασης παραγόντων. Επειδή όμως είναι πραγματικά αδύνατο να συμπεριληφθούν όλοι οι παράγοντες στην εξίσωση, οι συντελεστές bj. δεν είναι απαλλαγμένο από την ανάμειξη της επίδρασης παραγόντων που δεν περιλαμβάνονται στην εξίσωση.

Είναι αδύνατο να συμπεριληφθούν όλοι οι παράγοντες στην εξίσωση παλινδρόμησης για έναν από τους τρεις λόγους ή για όλους ταυτόχρονα, επειδή:

1) ορισμένοι από τους παράγοντες μπορεί να είναι άγνωστοι στη σύγχρονη επιστήμη, η γνώση οποιασδήποτε διαδικασίας είναι πάντα ελλιπής.

2) δεν υπάρχουν πληροφορίες για γνωστούς θεωρητικούς παράγοντες ή είναι αναξιόπιστες.

3) το μέγεθος του πληθυσμού που μελετήθηκε (δείγμα) είναι περιορισμένο, γεγονός που σας επιτρέπει να συμπεριλάβετε έναν περιορισμένο αριθμό παραγόντων στην εξίσωση παλινδρόμησης.

Συντελεστές υπό όρους καθαρής παλινδρόμησης bj. ονομάζονται αριθμοί, εκφράζονται σε διαφορετικές μονάδες μέτρησης και επομένως είναι ασύγκριτοι μεταξύ τους. Για τη μετατροπή τους σε συγκρίσιμους σχετικούς δείκτες, εφαρμόζεται ο ίδιος μετασχηματισμός όπως και για τη λήψη του συντελεστή συσχέτισης ζεύγους. Η τιμή που προκύπτει ονομάζεται τυποποιημένος συντελεστής παλινδρόμησης ή β-συντελεστής.


Ο συντελεστής στον παράγοντα xj καθορίζει τον βαθμό επιρροής της διακύμανσης του παράγοντα xj στη μεταβολή του ενεργού χαρακτηριστικού y όταν άλλοι παράγοντες που περιλαμβάνονται στην εξίσωση παλινδρόμησης αφαιρούνται από τη συνακόλουθη μεταβολή.

Είναι χρήσιμο να εκφράσουμε τους συντελεστές της υπό όρους καθαρής παλινδρόμησης με τη μορφή σχετικών συγκρίσιμων δεικτών επικοινωνίας, συντελεστών ελαστικότητας:

Ο συντελεστής ελαστικότητας του παράγοντα xj δείχνει ότι εάν η τιμή αυτού του παράγοντα αποκλίνει από τη μέση τιμή του κατά 1% και εάν ληφθούν υπόψη άλλοι παράγοντες που περιλαμβάνονται στην εξίσωση, το χαρακτηριστικό που προκύπτει θα αποκλίνει από τη μέση τιμή του κατά ej τοις εκατό από y. Συχνότερα, οι συντελεστές ελαστικότητας ερμηνεύονται και εφαρμόζονται με όρους δυναμικής: με αύξηση του συντελεστή x κατά 1% της μέσης τιμής του, το χαρακτηριστικό που προκύπτει θα αυξηθεί κατά e. τοις εκατό της μέσης τιμής του.

Εξετάστε τον υπολογισμό και την ερμηνεία της εξίσωσης πολυμεταβλητής παλινδρόμησης στο παράδειγμα των ίδιων 16 αγροκτημάτων (Πίνακας 8.1). Το αποτελεσματικό χαρακτηριστικό είναι το επίπεδο του ακαθάριστου εισοδήματος και τρεις παράγοντες που το επηρεάζουν παρουσιάζονται στον Πίνακα. 8.7.

Θυμηθείτε για άλλη μια φορά ότι για να αποκτηθούν αξιόπιστοι και επαρκώς ακριβείς δείκτες συσχέτισης, απαιτείται μεγαλύτερος πληθυσμός.


Πίνακας 8.7

Το επίπεδο ακαθάριστου εισοδήματος και οι παράγοντες του

Αριθμοί φάρμας

Ακαθάριστο εισόδημα, ρούβλ./ρα

Κόστος εργασίας, ανθρωποημέρες/στρέμμα x1

Μερίδιο καλλιεργήσιμης γης

απόδοση γάλακτος ανά αγελάδα,

Πίνακας 8.8 Δείκτες της εξίσωσης παλινδρόμησης

Εξαρτημένη μεταβλητή: y

συντελεστής παλινδρόμησης

Constant-240,112905

Std. σφάλμα εκ. = 79,243276


Η λύση πραγματοποιήθηκε χρησιμοποιώντας το πρόγραμμα "Microstat" για υπολογιστή. Εδώ είναι οι πίνακες από την εκτύπωση: καρτέλα. Το 8.7 δίνει τις μέσες τιμές και τις τυπικές αποκλίσεις όλων των χαρακτηριστικών. Αυτί. Το 8.8 περιέχει τους συντελεστές παλινδρόμησης και την πιθανολογική τους εκτίμηση:

η πρώτη στήλη "var" - μεταβλητές, δηλαδή παράγοντες. η δεύτερη στήλη "συντελεστής παλινδρόμησης" - συντελεστές της υπό όρους καθαρής παλινδρόμησης bj. η τρίτη στήλη «στδ. σφάλμα" - μέσος όρος σφαλμάτων εκτιμήσεων των συντελεστών παλινδρόμησης. η τέταρτη στήλη - οι τιμές του Student's t-test σε 12 βαθμούς ελευθερίας παραλλαγής. η πέμπτη στήλη "prob" - η πιθανότητα της μηδενικής υπόθεσης σχετικά με τους συντελεστές παλινδρόμησης.

η έκτη στήλη "μερικό r2" - μερικοί συντελεστές προσδιορισμού. Το περιεχόμενο και η μεθοδολογία για τον υπολογισμό των δεικτών στις στήλες 3-6 συζητούνται περαιτέρω στο Κεφάλαιο 8. "Σταθερά" - ένας ελεύθερος όρος της εξίσωσης παλινδρόμησης a; «Στδ. λάθος εκ των πραγμάτων." - Σφάλμα ρίζας-μέσος τετραγώνου της αξιολόγησης του αποτελεσματικού χαρακτηριστικού σύμφωνα με την εξίσωση παλινδρόμησης. Προέκυψε η εξίσωση πολλαπλής παλινδρόμησης:

y \u003d 2,26x1 - 4,31x2 + 0,166x3 - 240.

Αυτό σημαίνει ότι η αξία του ακαθάριστου εισοδήματος ανά 1 εκτάριο γεωργικής γης αυξήθηκε κατά μέσο όρο κατά 2,26 ρούβλια. με αύξηση του κόστους εργασίας κατά 1 ώρα/εκτάριο· μειώθηκε κατά μέσο όρο 4,31 ρούβλια. με αύξηση του μεριδίου της καλλιεργήσιμης γης στις γεωργικές εκτάσεις κατά 1% και αυξήθηκε κατά 0,166 ρούβλια. με αύξηση της γαλακτοπαραγωγής ανά αγελάδα κατά 1 κιλό. Η αρνητική τιμή του δωρεάν όρου είναι απολύτως φυσική και, όπως έχει ήδη σημειωθεί στην παράγραφο 8.2, το πραγματικό χαρακτηριστικό - το ακαθάριστο εισόδημα μηδενίζεται πολύ πριν φτάσει τις μηδενικές τιμές των παραγόντων, κάτι που είναι αδύνατο στην παραγωγή.

Η αρνητική τιμή του συντελεστή στο x^ αποτελεί ένδειξη σημαντικών προβλημάτων στην οικονομία των μελετηθέντων αγροκτημάτων, όπου η φυτική παραγωγή είναι ασύμφορη και μόνο η κτηνοτροφία είναι κερδοφόρα. Με ορθολογικές μεθόδους καλλιέργειας και κανονικές τιμές (ισορροπίας ή πλησίον αυτών) για τα προϊόντα όλων των βιομηχανιών, το εισόδημα δεν πρέπει να μειώνεται, αλλά να αυξάνεται με την αύξηση του πιο εύφορου μεριδίου στη γεωργική γη - καλλιεργήσιμη γη.

Με βάση τα στοιχεία των δύο προτελευταίων σειρών του Πίνακα. 8.7 και καρτέλα. 8.8 Υπολογίστε τους συντελεστές p και τους συντελεστές ελαστικότητας σύμφωνα με τους τύπους (8.34) και (8.35).

Τόσο η διακύμανση του επιπέδου του εισοδήματος όσο και η πιθανή αλλαγή στη δυναμική του επηρεάζονται ισχυρότερα από τον παράγοντα x3 - την παραγωγικότητα των αγελάδων, και τον ασθενέστερο - x2 - το μερίδιο της καλλιεργήσιμης γης. Οι τιμές του Р2/ θα χρησιμοποιηθούν στο μέλλον (Πίνακας 8.9).

Πίνακας 8.9 Συγκριτική επίδραση παραγόντων στο επίπεδο εισοδήματος

Παράγοντες xj


Έτσι, καταλήξαμε ότι ο συντελεστής β του παράγοντα xj αναφέρεται στον συντελεστή ελαστικότητας αυτού του παράγοντα, ως ο συντελεστής μεταβολής του παράγοντα προς τον συντελεστή μεταβολής του ενεργού χαρακτηριστικού. Δεδομένου ότι, όπως φαίνεται από την τελευταία γραμμή του Πίνακα. 8.7, οι συντελεστές διακύμανσης όλων των παραγόντων είναι μικρότεροι από τον συντελεστή διακύμανσης του προκύπτοντος χαρακτηριστικού. Όλοι οι συντελεστές β είναι μικρότεροι από τους συντελεστές ελαστικότητας.

Εξετάστε τη σχέση μεταξύ του ζευγαρωμένου και του υπό όρους καθαρού συντελεστή παλινδρόμησης χρησιμοποιώντας το παράδειγμα του παράγοντα -c. Η ζευγαρωμένη γραμμική εξίσωση σύνδεσης μεταξύ y και x έχει τη μορφή:

y = 3,886x1 - 243,2

Ο υπό όρους καθαρός συντελεστής παλινδρόμησης στο x1 είναι μόνο 58% του ζευγαρωμένου. Το υπόλοιπο 42% οφείλεται στο γεγονός ότι η παραλλαγή x1 συνοδεύεται από τη μεταβολή του παράγοντα x2 x3, η οποία, με τη σειρά της, επηρεάζει το χαρακτηριστικό που προκύπτει. Οι σχέσεις όλων των χαρακτηριστικών και οι συντελεστές παλινδρόμησης ανά ζεύγη παρουσιάζονται στο γράφημα σχέσεων (Εικ. 8.2).


Αν αθροίσουμε τις εκτιμήσεις της άμεσης και έμμεσης επιρροής της παραλλαγής x1 στο y, δηλαδή το γινόμενο των ζευγαρωμένων συντελεστών παλινδρόμησης για όλα τα «μονοπάτια» (Εικ. 8.2), παίρνουμε: 2,26 + 12,55 0,166 + (-0,00128 ) (-4,31) + (-0,00128) 17,00 0,166 = 4,344.

Αυτή η τιμή είναι ακόμη μεγαλύτερη από τον συντελεστή ζεύξης x1 με το y. Επομένως, η έμμεση επίδραση της διακύμανσης x1 μέσω των πρόσημων-παραγόντων που δεν περιλαμβάνονται στην εξίσωση είναι αντίθετη, δίνοντας συνολικά:

1 Ayvazyan S.A., Mkhitaryan V.S. Εφαρμοσμένες στατιστικές και θεμέλια οικονομετρίας. Το εγχειρίδιο για τα λύκεια. - Μ.: UNITI, 2008, - 311σ.

2 Johnston J. Econometric Methods. - Μ.: Στατιστική, 1980,. - 282 δευτ.

3 Dougherty K. Εισαγωγή στην οικονομετρία. - M.: INFRA-M, 2004, - 354 p.

4 Dreyer N., Smith G., Εφαρμοσμένη ανάλυση παλινδρόμησης. - Μ.: Οικονομικά και στατιστική, 2006, - 191s.

5 Magnus Ya.R., Kartyshev P.K., Peresetsky A.A. Οικονομετρία. Αρχική πορεία.-Μ.: Delo, 2006, - 259σ.

6 Εργαστήριο οικονομετρίας / Εκδ. I.I.Eliseeva.- M.: Οικονομικά και στατιστική, 2004, - 248σ.

7 Οικονομετρία / Εκδ. I.I.Eliseeva.- M.: Οικονομικά και στατιστική, 2004, - 541σ.

8 Kremer N., Putko B. Econometrics.- M.: UNITY-DANA, 200, - 281p.


Ayvazyan S.A., Mkhitaryan V.S. Εφαρμοσμένες στατιστικές και θεμέλια οικονομετρίας. Το εγχειρίδιο για τα λύκεια. - Μ.: UNITI, 2008,–σελ. 23.

Kremer N., Putko B. Econometrics.- M.: UNITY-DANA, 200, -σελ.64

Dreyer N., Smith G., Εφαρμοσμένη ανάλυση παλινδρόμησης. - Μ.: Οικονομικά και στατιστική, 2006, - σελ57.

Εργαστήριο οικονομετρίας / Εκδ. I.I. Eliseeva. - M .: Οικονομικά και στατιστική, 2004, -σελ. 172.

Αρχικά δεδομένα για ανάλυση συσχέτισης

Επαγγελματική ομάδα

θνησιμότητα

Αγρότες, δασολόγοι και ψαράδες

Μεταλλωρύχοι και εργάτες λατομείων

Παραγωγοί αερίων, οπτάνθρακα και χημικών

Κατασκευαστές γυαλιού και κεραμικών

Εργάτες σε φούρνους, σφυρήλατα, χυτήρια και ελασματουργεία

Εργάτες ηλεκτρολόγων και ηλεκτρονικών

Μηχανικός και συναφή επαγγέλματα

Παραγωγή ξυλουργικής

Βυρσοδέψες

Εργάτες κλωστοϋφαντουργίας

Κατασκευαστές ενδυμάτων εργασίας

Εργαζόμενοι στη βιομηχανία τροφίμων, ποτών και καπνού

Κατασκευαστές χαρτιού και εκτυπώσεων

Παραγωγοί άλλων προϊόντων

Οικοδόμοι

Καλλιτέχνες και διακοσμητές

Οδηγοί ακίνητων κινητήρων, γερανών κ.λπ.

Εργαζόμενοι που δεν περιλαμβάνονται αλλού

Εργαζόμενοι μεταφορών και επικοινωνιών

Εργάτες αποθηκών, αποθηκάριοι, συσκευαστές και εργάτες μηχανών πλήρωσης

υπάλληλοι γραφείου

Πωλητές

Εργαζόμενοι σε υπηρεσίες αθλητισμού και αναψυχής

Διαχειριστές και διευθυντές

Επαγγελματίες, τεχνικοί και καλλιτέχνες

Ξεκινάμε την ανάλυση συσχέτισης. Είναι προτιμότερο να ξεκινήσουμε τη λύση για σαφήνεια με μια γραφική μέθοδο, για την οποία θα φτιάξουμε ένα διάγραμμα διασποράς (σκέδασης).

Δείχνει μια άμεση σύνδεση. Ωστόσο, είναι δύσκολο να εξαχθεί ένα σαφές συμπέρασμα με βάση τη γραφική μέθοδο και μόνο. Επομένως, θα συνεχίσουμε να εκτελούμε ανάλυση συσχέτισης. Ένα παράδειγμα υπολογισμού του συντελεστή συσχέτισης φαίνεται παρακάτω.

Χρησιμοποιώντας εργαλεία λογισμικού (στο παράδειγμα του MS Excel, θα περιγραφεί παρακάτω), προσδιορίζουμε τον συντελεστή συσχέτισης, ο οποίος είναι 0,716, που σημαίνει ισχυρή σχέση μεταξύ των μελετημένων παραμέτρων. Ας προσδιορίσουμε τη στατιστική σημασία της λαμβανόμενης τιμής σύμφωνα με τον αντίστοιχο πίνακα, για τον οποίο πρέπει να αφαιρέσουμε 2 από 25 ζεύγη τιμών, ως αποτέλεσμα παίρνουμε 23 και για αυτή τη γραμμή στον πίνακα βρίσκουμε r κρίσιμο για p = 0,01 (καθώς πρόκειται για ιατρικά δεδομένα, μια πιο αυστηρή εξάρτηση, σε άλλες περιπτώσεις αρκεί p=0,05), που είναι 0,51 για αυτήν την ανάλυση συσχέτισης. Το παράδειγμα έδειξε ότι το υπολογισμένο r είναι μεγαλύτερο από το κρίσιμο r, η τιμή του συντελεστή συσχέτισης θεωρείται στατιστικά σημαντική.

Χρήση λογισμικού στην ανάλυση συσχέτισης

Ο περιγραφόμενος τύπος επεξεργασίας στατιστικών δεδομένων μπορεί να πραγματοποιηθεί χρησιμοποιώντας λογισμικό, ειδικότερα, MS Excel. Η συσχέτιση περιλαμβάνει τον υπολογισμό των ακόλουθων παραμέτρων χρησιμοποιώντας συναρτήσεις:

1. Ο συντελεστής συσχέτισης προσδιορίζεται χρησιμοποιώντας τη συνάρτηση CORREL (πίνακας1, πίνακας2). Το Array1,2 είναι ένα κελί του εύρους τιμών των μεταβλητών που προκύπτουν και των παραγόντων.

Ο συντελεστής γραμμικής συσχέτισης ονομάζεται επίσης συντελεστής συσχέτισης Pearson και επομένως, ξεκινώντας με το Excel 2007, μπορείτε να χρησιμοποιήσετε τη συνάρτηση με τους ίδιους πίνακες.

Η γραφική απεικόνιση της ανάλυσης συσχέτισης στο Excel γίνεται χρησιμοποιώντας τον πίνακα "Διαγράμματα" με την επιλογή "Σχεδίαση διασποράς".

Αφού καθορίσουμε τα αρχικά δεδομένα, παίρνουμε ένα γράφημα.

2. Αξιολόγηση της σημασίας του συντελεστή συσχέτισης ζεύγους με χρήση του Student's t-test. Η υπολογισμένη τιμή του κριτηρίου t συγκρίνεται με την πίνακα (κρίσιμη) τιμή αυτού του δείκτη από τον αντίστοιχο πίνακα τιμών της υπό εξέταση παραμέτρου, λαμβάνοντας υπόψη το δεδομένο επίπεδο σημασίας και τον αριθμό των βαθμών ελευθερίας. Αυτή η εκτίμηση γίνεται χρησιμοποιώντας τη συνάρτηση STUDIV (πιθανότητα; βαθμοί_ελευθερίας).

3. Πίνακας συντελεστών συσχέτισης ζεύγους. Η ανάλυση πραγματοποιείται χρησιμοποιώντας το εργαλείο «Ανάλυση δεδομένων», στο οποίο επιλέγεται η «Συσχέτιση». Η στατιστική αξιολόγηση των συντελεστών συσχέτισης ζεύγους πραγματοποιείται συγκρίνοντας την απόλυτη τιμή του με την πίνακα (κρίσιμη) τιμή. Όταν ο υπολογισμένος συντελεστής συσχέτισης ζεύγους υπερβαίνει αυτόν τον κρίσιμο, μπορούμε να πούμε, λαμβάνοντας υπόψη τον δεδομένο βαθμό πιθανότητας, ότι η μηδενική υπόθεση για τη σημασία της γραμμικής σχέσης δεν απορρίπτεται.

Τελικά

Η χρήση της μεθόδου της ανάλυσης συσχέτισης στην επιστημονική έρευνα καθιστά δυνατό τον προσδιορισμό της σχέσης μεταξύ διαφόρων παραγόντων και δεικτών απόδοσης. Ταυτόχρονα, θα πρέπει να ληφθεί υπόψη ότι ένας υψηλός συντελεστής συσχέτισης μπορεί επίσης να ληφθεί από ένα παράλογο ζεύγος ή σύνολο δεδομένων, και επομένως αυτός ο τύπος ανάλυσης πρέπει να πραγματοποιηθεί σε μια αρκετά μεγάλη συστοιχία δεδομένων.

Αφού ληφθεί η υπολογισμένη τιμή του r, είναι επιθυμητό να συγκριθεί με το r κρίσιμο για να επιβεβαιωθεί η στατιστική σημασία μιας ορισμένης τιμής. Η ανάλυση συσχέτισης μπορεί να πραγματοποιηθεί χειροκίνητα χρησιμοποιώντας τύπους ή χρησιμοποιώντας εργαλεία λογισμικού, ιδιαίτερα το MS Excel. Εδώ μπορείτε επίσης να δημιουργήσετε ένα διάγραμμα διασποράς (σκέδασης) με σκοπό την οπτική αναπαράσταση της σχέσης μεταξύ των μελετημένων παραγόντων της ανάλυσης συσχέτισης και του προκύπτοντος χαρακτηριστικού.

Όπως έχει επανειλημμένα σημειωθεί, για ένα στατιστικό συμπέρασμα σχετικά με την παρουσία ή απουσία συσχέτισης μεταξύ των υπό μελέτη μεταβλητών, είναι απαραίτητο να ελεγχθεί η σημασία του συντελεστή συσχέτισης του δείγματος. Λόγω του γεγονότος ότι η αξιοπιστία των στατιστικών χαρακτηριστικών, συμπεριλαμβανομένου του συντελεστή συσχέτισης, εξαρτάται από το μέγεθος του δείγματος, μπορεί να προκύψει μια κατάσταση όπου η τιμή του συντελεστή συσχέτισης θα οφείλεται εξ ολοκλήρου σε τυχαίες διακυμάνσεις στο δείγμα βάσει των οποίων υπολογίζεται. Με μια σημαντική σχέση μεταξύ των μεταβλητών, ο συντελεστής συσχέτισης θα πρέπει να είναι σημαντικά διαφορετικός από το μηδέν. Εάν δεν υπάρχει συσχέτιση μεταξύ των μεταβλητών που μελετήθηκαν, τότε ο συντελεστής συσχέτισης του γενικού πληθυσμού ρ είναι ίσος με μηδέν. Στις πρακτικές σπουδές, κατά κανόνα, βασίζονται σε επιλεκτικές παρατηρήσεις. Όπως κάθε στατιστικό χαρακτηριστικό, ο συντελεστής συσχέτισης του δείγματος είναι μια τυχαία μεταβλητή, δηλαδή, οι τιμές του διασκορπίζονται τυχαία γύρω από την παράμετρο του γενικού πληθυσμού με το ίδιο όνομα (η πραγματική τιμή του συντελεστή συσχέτισης). Ελλείψει συσχέτισης μεταξύ μεταβλητών y και xο συντελεστής συσχέτισης στο γενικό πληθυσμό είναι μηδέν. Αλλά λόγω της τυχαίας φύσης της σκέδασης, καταστάσεις είναι θεμελιωδώς δυνατές όταν ορισμένοι συντελεστές συσχέτισης που υπολογίζονται από δείγματα από αυτόν τον πληθυσμό θα είναι διαφορετικοί από το μηδέν.

Μπορούν οι παρατηρούμενες διαφορές να αποδοθούν σε τυχαίες διακυμάνσεις στο δείγμα ή αντανακλούν σημαντική αλλαγή στις συνθήκες για το σχηματισμό σχέσεων μεταξύ των μεταβλητών; Εάν οι τιμές του συντελεστή συσχέτισης του δείγματος πέφτουν στη ζώνη διασποράς λόγω της τυχαίας φύσης του ίδιου του δείκτη, τότε αυτό δεν αποτελεί απόδειξη της απουσίας σύνδεσης. Το περισσότερο που μπορεί να ειπωθεί σε αυτή την περίπτωση είναι ότι τα δεδομένα παρατήρησης δεν αρνούνται την απουσία σχέσης μεταξύ των μεταβλητών. Αν όμως η τιμή του συντελεστή συσχέτισης του δείγματος βρίσκεται εκτός της αναφερόμενης ζώνης διασποράς, τότε συμπεραίνεται ότι διαφέρει σημαντικά από το μηδέν και μπορούμε να υποθέσουμε ότι μεταξύ των μεταβλητών y και xυπάρχει στατιστικά σημαντική σχέση. Το κριτήριο που χρησιμοποιείται για την επίλυση αυτού του προβλήματος, με βάση την κατανομή διαφόρων στατιστικών, ονομάζεται κριτήριο σημαντικότητας.

Η διαδικασία ελέγχου σημαντικότητας ξεκινά με τη διατύπωση της μηδενικής υπόθεσης H0 . Σε γενικές γραμμές, έγκειται στο γεγονός ότι δεν υπάρχουν σημαντικές διαφορές μεταξύ της παραμέτρου του δείγματος και της παραμέτρου του πληθυσμού. Εναλλακτική υπόθεση H1 είναι ότι υπάρχουν σημαντικές διαφορές μεταξύ αυτών των παραμέτρων. Για παράδειγμα, κατά τον έλεγχο της συσχέτισης στον πληθυσμό, η μηδενική υπόθεση είναι ότι ο πραγματικός συντελεστής συσχέτισης είναι μηδέν ( H0: ρ = 0). Εάν, ως αποτέλεσμα της δοκιμής, αποδειχθεί ότι η μηδενική υπόθεση δεν είναι αποδεκτή, τότε ο συντελεστής συσχέτισης του δείγματος rΟυάουσημαντικά διαφορετικό από το μηδέν (η μηδενική υπόθεση απορρίπτεται και η εναλλακτική γίνεται αποδεκτή) H1).Με άλλα λόγια, η υπόθεση των μη συσχετισμένων τυχαίων μεταβλητών στον γενικό πληθυσμό θα πρέπει να αναγνωρίζεται ως παράλογη. Αντίθετα, εάν με βάση το τεστ σημαντικότητας, η μηδενική υπόθεση γίνεται αποδεκτή, δηλ. rΟυάουβρίσκεται στην αποδεκτή ζώνη τυχαίας διασποράς, τότε δεν υπάρχει λόγος να θεωρηθεί αμφίβολη η υπόθεση των μη συσχετισμένων μεταβλητών στο γενικό πληθυσμό.

Σε ένα τεστ σημαντικότητας, ο ερευνητής καθιερώνει ένα επίπεδο σημαντικότητας α που δίνει κάποια πρακτική εμπιστοσύνη ότι θα εξαχθούν λανθασμένα συμπεράσματα μόνο σε πολύ σπάνιες περιπτώσεις. Το επίπεδο σημαντικότητας εκφράζει την πιθανότητα η μηδενική υπόθεση H0απορρίφθηκε τη στιγμή που είναι πραγματικά αληθινή. Είναι σαφές ότι είναι λογικό να επιλέξουμε αυτή την πιθανότητα όσο το δυνατόν μικρότερη.

Ας είναι γνωστή η κατανομή του χαρακτηριστικού του δείγματος, που είναι μια αμερόληπτη εκτίμηση της παραμέτρου πληθυσμού. Το επιλεγμένο επίπεδο σημαντικότητας α αντιστοιχεί στις σκιασμένες περιοχές κάτω από την καμπύλη αυτής της κατανομής (βλ. Εικ. 24). Η μη σκιασμένη περιοχή κάτω από την καμπύλη κατανομής ορίζει την πιθανότητα P = 1-α . Τα όρια των τμημάτων στον άξονα της τετμημένης κάτω από τις σκιασμένες περιοχές ονομάζονται κρίσιμες τιμές και τα ίδια τα τμήματα σχηματίζουν την κρίσιμη περιοχή ή την περιοχή απόρριψης της υπόθεσης.

Στη διαδικασία ελέγχου υποθέσεων, το χαρακτηριστικό δείγματος που υπολογίζεται από τα αποτελέσματα των παρατηρήσεων συγκρίνεται με την αντίστοιχη κρίσιμη τιμή. Σε αυτή την περίπτωση, θα πρέπει να γίνει διάκριση μεταξύ μονόπλευρων και αμφίπλευρων κρίσιμων περιοχών. Η μορφή προσδιορισμού της κρίσιμης περιοχής εξαρτάται από τη διατύπωση του προβλήματος σε μια στατιστική μελέτη. Μια κρίσιμη περιοχή διπλής όψης είναι απαραίτητη όταν, κατά τη σύγκριση της παραμέτρου δείγματος και της παραμέτρου πληθυσμού, απαιτείται να εκτιμηθεί η απόλυτη τιμή της διαφοράς μεταξύ τους, δηλαδή ενδιαφέρουν τόσο θετικές όσο και αρνητικές διαφορές μεταξύ των τιμών που μελετήθηκαν. . Όταν είναι απαραίτητο να βεβαιωθείτε ότι μια τιμή είναι κατά μέσο όρο αυστηρά μεγαλύτερη ή μικρότερη από μια άλλη, χρησιμοποιείται μια μονόπλευρη κρίσιμη περιοχή (δεξιός ή αριστερός). Είναι προφανές ότι για την ίδια κρίσιμη τιμή το επίπεδο σημαντικότητας όταν χρησιμοποιείται μια μονόπλευρη κρίσιμη περιοχή είναι μικρότερο από όταν χρησιμοποιείται μια διπλής όψης. Εάν η κατανομή του χαρακτηριστικού του δείγματος είναι συμμετρική,

Ρύζι. 24. Έλεγχος της μηδενικής υπόθεσης H0

τότε το επίπεδο σημασίας της αμφίπλευρης κρίσιμης περιοχής είναι ίσο με α, και το επίπεδο σημασίας της μονόπλευρης είναι (βλ. Εικ. 24). Περιοριζόμαστε σε μια γενική διατύπωση του προβλήματος. Περισσότερες λεπτομέρειες σχετικά με τη θεωρητική αιτιολόγηση για τον έλεγχο στατιστικών υποθέσεων μπορούν να βρεθούν στην εξειδικευμένη βιβλιογραφία. Επιπλέον, θα αναφέρουμε μόνο τα κριτήρια σπουδαιότητας για διάφορες διαδικασίες, χωρίς να σταθούμε στην κατασκευή τους.

Με τον έλεγχο της σημασίας του συντελεστή συσχέτισης ζεύγους, διαπιστώνεται η ύπαρξη ή απουσία συσχέτισης μεταξύ των μελετηθέντων φαινομένων. Ελλείψει σύνδεσης, ο συντελεστής συσχέτισης του γενικού πληθυσμού είναι ίσος με μηδέν (ρ = 0). Η διαδικασία επαλήθευσης ξεκινά με τη διατύπωση των μηδενικών και εναλλακτικών υποθέσεων:

H0: διαφορά μεταξύ του συντελεστή συσχέτισης δείγματος r και ρ = 0 είναι ασήμαντο,

H1: διαφορά μεταξύ rκαι ρ = 0 είναι σημαντικό, και επομένως, μεταξύ των μεταβλητών στοκαι Χυπάρχει μια σημαντική σύνδεση. Από την εναλλακτική υπόθεση προκύπτει ότι πρέπει να χρησιμοποιηθεί μια αμφίπλευρη κρίσιμη περιοχή.

Στην ενότητα 8.1 αναφέρθηκε ήδη ότι ο συντελεστής συσχέτισης του δείγματος, κάτω από ορισμένες παραδοχές, σχετίζεται με μια τυχαία μεταβλητή t, υπακούοντας στη διανομή του Μαθητή με φά = n- 2 βαθμοί ελευθερίας. Στατιστικά στοιχεία που υπολογίζονται από τα αποτελέσματα του δείγματος

σε σύγκριση με την κρίσιμη τιμή που προσδιορίζεται από τον πίνακα κατανομής του Student σε ένα δεδομένο επίπεδο σημαντικότητας α καιφά = n- 2 βαθμοί ελευθερίας. Ο κανόνας για την εφαρμογή του κριτηρίου είναι ο εξής: εάν | t| >tf,ένα, τότε η μηδενική υπόθεση στο επίπεδο σημαντικότητας α απορρίφθηκε, δηλαδή η σχέση μεταξύ των μεταβλητών είναι σημαντική. αν | t| ≤tf,ένα, τότε η μηδενική υπόθεση στο επίπεδο σημαντικότητας α γίνεται αποδεκτή. Απόκλιση τιμής r από ρ = 0 μπορεί να αποδοθεί σε τυχαία παραλλαγή. Αυτά τα δείγματα χαρακτηρίζουν την υπό εξέταση υπόθεση ως πολύ πιθανή και αληθοφανή, δηλαδή, η υπόθεση της απουσίας σύνδεσης δεν είναι απαράδεκτη.

Η διαδικασία για τον έλεγχο μιας υπόθεσης είναι πολύ απλοποιημένη εάν αντί για στατιστικά tχρησιμοποιήστε τις κρίσιμες τιμές του συντελεστή συσχέτισης, ο οποίος μπορεί να προσδιοριστεί ως προς τα ποσοστάσια της κατανομής του Μαθητή αντικαθιστώντας σε (8.38) t= tf, α και r= ρ φά, ένα:

(8.39)

Υπάρχουν αναλυτικοί πίνακες κρίσιμων τιμών, απόσπασμα των οποίων δίνεται στο Παράρτημα αυτού του βιβλίου (βλ. Πίνακα 6). Ο κανόνας για τον έλεγχο της υπόθεσης σε αυτή την περίπτωση είναι ο εξής: αν r> ρ φά, α, τότε μπορούμε να ισχυριστούμε ότι η σχέση μεταξύ των μεταβλητών είναι σημαντική. Αν ένα rrf,ένα, τότε τα αποτελέσματα των παρατηρήσεων θεωρούνται συνεπή με την υπόθεση της απουσίας σύνδεσης.

; ; .

Τώρα ας υπολογίσουμε τις τιμές των τυπικών αποκλίσεων του δείγματος:

https://pandia.ru/text/78/148/images/image443_0.gif" width="413" height="60 src=">.

Η συσχέτιση μεταξύ του επιπέδου των μαθητών της δέκατης τάξης, τόσο υψηλότερο είναι το μέσο επίπεδο επίδοσης στα μαθηματικά και αντίστροφα.

2. Έλεγχος της σημαντικότητας του συντελεστή συσχέτισης

Δεδομένου ότι ο συντελεστής δείγματος υπολογίζεται από δεδομένα δείγματος, είναι μια τυχαία μεταβλητή . Αν , τότε τίθεται το ερώτημα: αυτό οφείλεται σε μια πραγματικά υπάρχουσα γραμμική σχέση μεταξύ και width="27" height="25">: (αν δεν είναι γνωστό το σύμβολο συσχέτισης); ή μονόπλευρη https://pandia.ru/text/78/148/images/image448_0.gif" width="43" height="23 src=">.gif" width="43" height="23 src =" > (αν το πρόσημο της συσχέτισης μπορεί να προκαθοριστεί).

Μέθοδος 1.Για να ελέγξουμε την υπόθεση, χρησιμοποιούμε https://pandia.ru/text/78/148/images/image150_1.gif" width="11" height="17 src=">-Δοκιμή μαθητή σύμφωνα με τον τύπο

https://pandia.ru/text/78/148/images/image406_0.gif" width="13" height="15">.gif" width="36 height=25" height="25">.gif " width="17" height="16"> και ο αριθμός των βαθμών ελευθερίας για μια δοκιμή διπλής όψης.

Η κρίσιμη περιοχή δίνεται από την ανισότητα .

Εάν https://pandia.ru/text/78/148/images/image455_0.gif" width="99" height="29 src=">, τότε η μηδενική υπόθεση απορρίπτεται. Καταλήγουμε στο συμπέρασμα:

§ για μια εναλλακτική υπόθεση δύο όψεων - ο συντελεστής συσχέτισης είναι σημαντικά διαφορετικός από το μηδέν.

§ Για μια μονόπλευρη υπόθεση, υπάρχει στατιστικά σημαντική θετική (ή αρνητική) συσχέτιση.

Μέθοδος 2.Μπορείτε επίσης να χρησιμοποιήσετε πίνακας κρίσιμων τιμών του συντελεστή συσχέτισης, από το οποίο βρίσκουμε την τιμή της κρίσιμης τιμής του συντελεστή συσχέτισης με τον αριθμό των βαθμών ελευθερίας https://pandia.ru/text/78/148/images/image367_1.gif" width="17 height=16" height="16">.

Εάν https://pandia.ru/text/78/148/images/image459_0.gif" width="101" height="29 src=">, τότε συμπεραίνεται ότι ο συντελεστής συσχέτισης είναι σημαντικά διαφορετικός από το 0 και υπάρχει στατιστικά σημαντική συσχέτιση.

Έτσι, ορισμένα φαινόμενα μπορούν να συμβούν ή να αλλάξουν ταυτόχρονα, αλλά ανεξάρτητα το ένα από το άλλο (κοινά συμβάντα). ψευδήςοπισθοδρόμηση). Άλλοι - να είναι σε μια αιτιακή σχέση όχι μεταξύ τους, αλλά σύμφωνα με μια πιο περίπλοκη αιτιακή σχέση ( έμμεσοςοπισθοδρόμηση). Έτσι, με σημαντικό συντελεστή συσχέτισης, το τελικό συμπέρασμα για την ύπαρξη αιτιώδους σχέσης μπορεί να γίνει μόνο λαμβάνοντας υπόψη τις ιδιαιτερότητες του υπό μελέτη προβλήματος.

Παράδειγμα 2Προσδιορίστε τη σημασία του συντελεστή συσχέτισης του δείγματος που υπολογίστηκε στο παράδειγμα 1.

Λύση.

Ας υποθέσουμε μια υπόθεση: ότι δεν υπάρχει συσχέτιση στον γενικό πληθυσμό. Δεδομένου ότι το πρόσημο της συσχέτισης ως αποτέλεσμα της λύσης του παραδείγματος 1 προσδιορίζεται - η συσχέτιση είναι θετική, τότε η εναλλακτική υπόθεση είναι μονόπλευρη της μορφής https://pandia.ru/text/78/148/images/ image448_0.gif" width="43" height="23 src =">.

Βρείτε την εμπειρική αξία του -κριτηρίου:

https://pandia.ru/text/78/148/images/image461_0.gif" width="167 height=20" height="20">, επιλέγουμε το επίπεδο σημασίας ίσο με . Σύμφωνα με τον πίνακα "Κρίσιμες τιμές - Τεστ μαθητή για διάφορα επίπεδα σημασίας» βρίσκουμε την κρίσιμη τιμή .

Δεδομένου ότι η https://pandia.ru/text/78/148/images/image434_0.gif" width="25 height=24" height="24"> και το μέσο επίπεδο απόδοσης στα μαθηματικά, υπάρχει στατιστικά σημαντική συσχέτιση .

Εργασίες δοκιμής

1. Σημειώστε τουλάχιστον δύο σωστές απαντήσεις. Ο έλεγχος της σημαντικότητας του συντελεστή συσχέτισης του δείγματος βασίζεται σε στατιστικό έλεγχο της υπόθεσης ότι ...

1) δεν υπάρχει συσχέτιση στο γενικό πληθυσμό

2) η διαφορά από το μηδέν του συντελεστή συσχέτισης του δείγματος εξηγείται μόνο από την τυχαιότητα του δείγματος

3) ο συντελεστής συσχέτισης είναι σημαντικά διαφορετικός από το 0

4) η διαφορά από το μηδέν του συντελεστή συσχέτισης του δείγματος δεν είναι τυχαία

2. Εάν ο συντελεστής δείγματος γραμμικής συσχέτισης , τότε η μεγαλύτερη τιμή ενός χαρακτηριστικού αντιστοιχεί σε ... τη μεγαλύτερη τιμή του άλλου χαρακτηριστικού.

1) μέσος όρος

3) στις περισσότερες παρατηρήσεις

4) περιστασιακά

3. Συντελεστής συσχέτισης δείγματος https://pandia.ru/text/78/148/images/image465_0.gif" width="64" height="23 src="> (για μέγεθος δείγματος και επίπεδο σημαντικότητας 0,05). Είναι δυνατόν να πούμε ότι υπάρχει στατιστικά σημαντική θετική συσχέτιση μεταξύ ψυχολογικών χαρακτηριστικών;

5. Αφήστε τον συντελεστή συσχέτισης του δείγματος να βρεθεί στην εργασία προσδιορισμού της ισχύος μιας γραμμικής σχέσης μεταξύ ψυχολογικών χαρακτηριστικών https://pandia.ru/text/78/148/images/image466_0.gif και ενός επιπέδου σημαντικότητας 0,05.) Είναι δυνατόν να πούμε ότι η διαφορά από το μηδέν του συντελεστή συσχέτισης του δείγματος εξηγείται μόνο από την τυχαιότητα του δείγματος;

Θέμα 3. Συντελεστές και συσχετίσεις κατάταξης

1. Συντελεστής συσχέτισης κατάταξης https://pandia.ru/text/78/148/images/image130_3.gif" width="21 height=19" height="19"> και. Ο αριθμός των τιμών χαρακτηριστικών (δείκτες, θέματα, ποιότητες, χαρακτηριστικά) μπορεί να είναι οποιαδήποτε, αλλά ο αριθμός τους πρέπει να είναι ο ίδιος.

μαθήματα

Κατάταξη χαρακτηριστικών

Κατάταξη χαρακτηριστικών

Ας υποδηλώσουμε τη διαφορά μεταξύ των βαθμών σε δύο μεταβλητές για κάθε θέμα μέσω https://pandia.ru/text/78/148/images/image470_0.gif" width="319" height="66">,

όπου είναι ο αριθμός των τιμών των χαρακτηριστικών κατάταξης, των δεικτών.

Ο συντελεστής συσχέτισης κατάταξης παίρνει τιμές που κυμαίνονται από -1 έως +1και θεωρείται ως μέσο γρήγορης εκτίμησης του συντελεστή συσχέτισης Pearson.

Για έλεγχος της σημασίας του συντελεστή συσχέτισης των βαθμών Spearman (εάν ο αριθμός των τιμών https://pandia.ru/text/78/148/images/image472_0.gif" width="55" height="29"> εξαρτάται από τον αριθμό και το επίπεδο σημασίας. Εάν το εμπειρικό η τιμή είναι μεγαλύτερη, τότε στο επίπεδο σημασίας, μπορεί να υποστηριχθεί ότι τα χαρακτηριστικά συσχετίζονται.

Παράδειγμα 1Ο ψυχολόγος ανακαλύπτει πώς συνδέονται τα αποτελέσματα της προόδου των μαθητών στα μαθηματικά και τη φυσική, τα αποτελέσματα των οποίων παρουσιάζονται με τη μορφή ταξινομημένης σειράς ανά επώνυμα.

Μαθητης σχολειου

Αθροισμα

ακαδημαϊκή επίδοση

μαθηματικά

ακαδημαϊκή επίδοση

στη φυσική

Το τετράγωνο της διαφοράς μεταξύ των βαθμών

Υπολογίστε το άθροισμα, τότε ο συντελεστής συσχέτισης των βαθμών του Spearman είναι ίσος με:

Ας ελέγξουμε τη σημασία του συντελεστή συσχέτισης που βρέθηκε. Ας βρούμε τις κρίσιμες τιμές του συντελεστή συσχέτισης κατάταξης του Spearman από τον πίνακα (βλ. Παραρτήματα) για:

https://pandia.ru/text/78/148/images/image480_0.gif" width="72" height="25"> είναι μεγαλύτερη από την τιμή = 0,64 και την τιμή 0,79. Αυτό δείχνει ότι η τιμή έπεσε σε η περιοχή σημασίας του συντελεστή συσχέτισης. Ως εκ τούτου, μπορεί να υποστηριχθεί ότι ο συντελεστής συσχέτισης των βαθμών Spearman είναι σημαντικά διαφορετικός από το 0. Αυτό σημαίνει ότι τα αποτελέσματα της προόδου των μαθητών στα μαθηματικά και τη φυσική συσχετίζονται θετικά . Υπάρχει σημαντική θετική συσχέτιση μεταξύ της απόδοσης στα μαθηματικά και της απόδοσης στη φυσική: όσο καλύτερη είναι η επίδοση στα μαθηματικά, τόσο καλύτερη είναι η μέση επίδοση στη φυσική και αντίστροφα.

Συγκρίνοντας τους συντελεστές συσχέτισης Pearson και Spearman, σημειώνουμε ότι ο συντελεστής συσχέτισης Pearson συσχετίζει τις τιμές ποσότητες, και ο συντελεστής συσχέτισης Spearman είναι οι τιμές τάξειςαυτές οι τιμές, επομένως οι τιμές των συντελεστών Pearson και Spearman συχνά δεν είναι ίδιες.

Για την πληρέστερη κατανόηση του πειραματικού υλικού που λαμβάνεται στην ψυχολογική έρευνα, συνιστάται ο υπολογισμός των συντελεστών σύμφωνα με τον Pearson και τον Spearman.

Σχόλιο. Υπό την παρουσία του ίδιες τάξειςστη σειρά κατάταξης και στον αριθμητή του τύπου για τον υπολογισμό του συντελεστή συσχέτισης των βαθμών, προστίθενται όροι - "διορθώσεις για τάξεις": ; ,

όπου https://pandia.ru/text/78/148/images/image130_3.gif" width="21" height="19">;

https://pandia.ru/text/78/148/images/image165_1.gif" width="16" height="19">.

Σε αυτήν την περίπτωση, ο τύπος για τον υπολογισμό του συντελεστή συσχέτισης κατάταξης έχει τη μορφή https://pandia.ru/text/78/148/images/image485_0.gif" width="16" height="19">.

Προϋποθέσεις εφαρμογής του συντελεστή συσχέτισης.

1. Τα συγκριτικά γνωρίσματα μετρήθηκαν σε διχοτομική κλίμακα.

2..gif" width="21" height="19">, , σημειωμένα με τα σύμβολα 0 και 1, εμφανίζονται στον πίνακα.

Αριθμός παρατήρησης

ΚΑΤΗΓΟΡΙΕΣ

Δημοφιλή ΑΡΘΡΑ

2022 "kingad.ru" - υπερηχογραφική εξέταση ανθρώπινων οργάνων