Δίνεται ένας πίνακας συντελεστών συσχέτισης ζεύγους. Κατασκευή πίνακα συντελεστών συσχέτισης ζεύγους

Ζ 1 (t)

Ζ 2 (t)

t

y(t)

Ζ 1 (t)

Ζ 2 (t)

t

y(t)

Το κύριο καθήκον που αντιμετωπίζουμε κατά την επιλογή παραγόντων που θα συμπεριληφθούν σε ένα μοντέλο συσχέτισης είναι να εισαγάγουμε στην ανάλυση όλους τους κύριους παράγοντες που επηρεάζουν το επίπεδο του φαινομένου που μελετάται. Ωστόσο, η εισαγωγή μεγάλου αριθμού παραγόντων στο μοντέλο δεν είναι πρακτική, είναι πιο σωστό να επιλέγουμε μόνο έναν σχετικά μικρό αριθμό κύριων παραγόντων που πιθανώς είναι σε συσχέτιση με τον επιλεγμένο λειτουργικό δείκτη.

Αυτό μπορεί να γίνει χρησιμοποιώντας τη λεγόμενη επιλογή δύο σταδίων. Σύμφωνα με αυτό, όλοι οι προεπιλεγμένοι παράγοντες περιλαμβάνονται στο μοντέλο. Στη συνέχεια, ανάμεσά τους, βάσει ειδικής ποσοτικής αξιολόγησης και πρόσθετης ποιοτικής ανάλυσης, εντοπίζονται ασήμαντοι παράγοντες που επηρεάζουν σταδιακά μέχρι να μείνουν αυτοί για τους οποίους μπορεί να υποστηριχθεί ότι το διαθέσιμο στατιστικό υλικό συνάδει με την υπόθεση της άρθρωσής τους. σημαντική επιρροή στην εξαρτημένη μεταβλητή με την επιλεγμένη μορφή σύνδεσης.

Η επιλογή δύο σταδίων έλαβε την πληρέστερη έκφρασή της στην τεχνική της λεγόμενης ανάλυσης παλινδρόμησης πολλαπλών βημάτων, στην οποία η εξάλειψη των ασήμαντων παραγόντων γίνεται με βάση δείκτες της σημασίας τους, ιδίως με βάση την τιμή του t f - την υπολογιζόμενη τιμή της δοκιμασίας του Μαθητή.

Ας υπολογίσουμε το t f χρησιμοποιώντας τους συντελεστές συσχέτισης που βρέθηκαν και ας τους συγκρίνουμε με το t κρίσιμο για ένα επίπεδο σημαντικότητας 5% (δύο όψεων) και 18 βαθμούς ελευθερίας (ν = n-2).

όπου r είναι η τιμή του συντελεστή συσχέτισης ζεύγους.

n – αριθμός παρατηρήσεων (n=20)

Όταν συγκρίνετε t f για κάθε συντελεστή με t cr = 2,101 διαπιστώνουμε ότι οι συντελεστές που βρέθηκαν θεωρούνται σημαντικοί, γιατί t f > t cr.

t f για r yx 1 = 2, 5599 ;

t f για r yx 2 = 7,064206 ;

t f για r yx 3 = 2,40218 ;

t f για r x1 x 2 = 4,338906 ;

t f για r x1 x 3 = 15,35065;

t f για r x2 x 3 = 4,749981

Κατά την επιλογή των παραγόντων που θα συμπεριληφθούν στην ανάλυση, τους επιβάλλονται συγκεκριμένες απαιτήσεις. Πρώτα απ 'όλα, οι δείκτες που εκφράζουν αυτούς τους παράγοντες πρέπει να είναι ποσοτικά μετρήσιμοι.

Οι παράγοντες που περιλαμβάνονται στο μοντέλο δεν πρέπει να βρίσκονται σε λειτουργική ή στενή σχέση μεταξύ τους. Η παρουσία τέτοιων σχέσεων χαρακτηρίζεται από πολυσυγγραμμικότητα.

Η πολυσυγγραμμικότητα δείχνει ότι ορισμένοι παράγοντες χαρακτηρίζουν μια και την ίδια πτυχή του φαινομένου που μελετάται. Επομένως, η ταυτόχρονη συμπερίληψή τους στο μοντέλο δεν είναι πρακτική, καθώς αντιγράφουν το ένα το άλλο σε κάποιο βαθμό. Εάν δεν υπάρχουν ειδικές υποθέσεις από τους ομιλητές υπέρ ενός από αυτούς τους παράγοντες, θα πρέπει να προτιμάται αυτός που χαρακτηρίζεται από μεγάλο συντελεστή συσχέτισης κατά ζεύγη (ή μερικό).

Πιστεύεται ότι η μέγιστη τιμή του συντελεστή συσχέτισης μεταξύ δύο παραγόντων είναι 0,8.

Η πολυσυγγραμμικότητα συνήθως οδηγεί σε εκφυλισμό του πίνακα των μεταβλητών και, κατά συνέπεια, στο γεγονός ότι η κύρια ορίζουσα μειώνει την τιμή της και στο όριο γίνεται κοντά στο μηδέν. Οι εκτιμήσεις των συντελεστών της εξίσωσης παλινδρόμησης εξαρτώνται σε μεγάλο βαθμό από την ακρίβεια εύρεσης των δεδομένων πηγής και αλλάζουν τις τιμές τους απότομα όταν αλλάζει ο αριθμός των παρατηρήσεων.

Πίνακας συντελεστών συσχέτισης ζεύγους

Υ Χ1 X2 X3 Χ4 Χ5
Υ
Χ1 0,732705
X2 0,785156 0,706287
X3 0,179211 -0,29849 0,208514
Χ4 0,667343 0,924333 0,70069 0,299583
Χ5 0,709204 0,940488 0,691809 0,326602 0,992945

Οι κόμβοι του πίνακα περιέχουν ζευγαρωμένους συντελεστές συσχέτισης που χαρακτηρίζουν τη στενή σχέση μεταξύ των χαρακτηριστικών των παραγόντων. Αναλύοντας αυτούς τους συντελεστές, σημειώνουμε ότι όσο μεγαλύτερη είναι η απόλυτη τιμή τους, τόσο μεγαλύτερη είναι η επίδραση που έχει το αντίστοιχο χαρακτηριστικό παραγόντων στο προκύπτον. Η ανάλυση του προκύπτοντος πίνακα πραγματοποιείται σε δύο στάδια:

1. Αν στην πρώτη στήλη του πίνακα υπάρχουν συντελεστές συσχέτισης για τους οποίους /r /< 0,5, то соответствующие признаки из модели исключаются. В данном случае в первом столбце матрицы коэффициентов корреляции исключается фактор или коэффициент роста уровня инфляции. Данный фактор оказывает меньшее влияние на результативный признак, нежели оставшиеся четыре признака.

2. Αναλύοντας τους συντελεστές συσχέτισης ζευγαρωμένων χαρακτηριστικών παραγόντων μεταξύ τους, (r XiXj), που χαρακτηρίζουν την εγγύτητα της σχέσης τους, είναι απαραίτητο να εκτιμηθεί η ανεξαρτησία τους μεταξύ τους, καθώς αυτό είναι απαραίτητη προϋπόθεση για περαιτέρω ανάλυση παλινδρόμησης. Δεδομένου ότι δεν υπάρχουν απολύτως ανεξάρτητα χαρακτηριστικά στα οικονομικά, είναι απαραίτητο να επισημανθούν, ει δυνατόν, τα πιο ανεξάρτητα. Τα χαρακτηριστικά των παραγόντων που συσχετίζονται στενά μεταξύ τους ονομάζονται πολυσυγγραμμικά. Η συμπερίληψη πολυσυγγραμμικών χαρακτηριστικών στο μοντέλο καθιστά αδύνατη την οικονομική ερμηνεία του μοντέλου παλινδρόμησης, καθώς μια αλλαγή σε έναν παράγοντα συνεπάγεται αλλαγή των παραγόντων που σχετίζονται με αυτό, γεγονός που μπορεί να οδηγήσει σε «διάσπαση» του μοντέλου στο σύνολό του.

Το κριτήριο για την πολυπλευρικότητα των παραγόντων είναι το εξής:

/r XiXj / > 0,8

Στον προκύπτοντα πίνακα των ζευγαρωμένων συντελεστών συσχέτισης, αυτό το κριτήριο ικανοποιείται από δύο δείκτες που βρίσκονται στη διασταύρωση των σειρών Και . Από κάθε ζεύγος αυτών των χαρακτηριστικών, ένα πρέπει να μείνει στο μοντέλο θα πρέπει να έχει μεγαλύτερο αντίκτυπο στο χαρακτηριστικό που προκύπτει. Ως αποτέλεσμα, παράγοντες και εξαιρούνται από το μοντέλο, π.χ. ο ρυθμός αύξησης του κόστους των πωληθέντων αγαθών και ο ρυθμός αύξησης του όγκου των πωλήσεών του.

Έτσι, εισάγουμε τους παράγοντες X1 και X2 στο μοντέλο παλινδρόμησης.

Στη συνέχεια, πραγματοποιείται ανάλυση παλινδρόμησης (υπηρεσία, ανάλυση δεδομένων, παλινδρόμηση). Και πάλι, ένας πίνακας αρχικών δεδομένων συντάσσεται με τους παράγοντες X1 και X2. Η παλινδρόμηση γενικά χρησιμοποιείται για την ανάλυση της επίδρασης των τιμών των ανεξάρτητων μεταβλητών (παραγόντων) σε μια μεμονωμένη εξαρτημένη μεταβλητή και επιτρέπει τη συσχέτιση μεταξύ των χαρακτηριστικών να αναπαρασταθεί με τη μορφή κάποιας λειτουργικής εξάρτησης που ονομάζεται εξίσωση παλινδρόμησης ή συσχέτιση-παλίνδρομο μοντέλο.

Ως αποτέλεσμα της ανάλυσης παλινδρόμησης, λαμβάνουμε τα αποτελέσματα του υπολογισμού της πολυμεταβλητής παλινδρόμησης. Ας αναλύσουμε τα αποτελέσματα που προέκυψαν.

Όλοι οι συντελεστές παλινδρόμησης είναι σημαντικοί σύμφωνα με το Student's t test. Ο πολλαπλός συντελεστής συσχέτισης R ήταν 0,925 το τετράγωνο αυτής της τιμής (συντελεστής προσδιορισμού) σημαίνει ότι κατά μέσο όρο το 85,5% της διακύμανσης στο ενεργό χαρακτηριστικό εξηγείται από τη διακύμανση των χαρακτηριστικών παραγόντων που περιλαμβάνονται στο μοντέλο. Ο συντελεστής ντετερμινισμού χαρακτηρίζει τη στενή σχέση μεταξύ του συνόλου των χαρακτηριστικών παραγόντων και του αποτελεσματικού δείκτη. Όσο πιο κοντά είναι η τιμή του R στο 1, τόσο ισχυρότερη είναι η σχέση. Στην περίπτωσή μας, ένας δείκτης ίσος με 0,855 υποδηλώνει τη σωστή επιλογή παραγόντων και την ύπαρξη σχέσης μεταξύ των παραγόντων και του αποτελεσματικού δείκτη.

Το υπό εξέταση μοντέλο είναι επαρκές, καθώς η υπολογισμένη τιμή του Fisher's F-test υπερβαίνει σημαντικά την πινακοποιημένη τιμή του (F obs =52.401, F tab =1.53).

Το γενικό αποτέλεσμα της ανάλυσης συσχέτισης και παλινδρόμησης είναι μια εξίσωση πολλαπλής παλινδρόμησης, η οποία έχει τη μορφή:

Η προκύπτουσα εξίσωση παλινδρόμησης ανταποκρίνεται στον στόχο της ανάλυσης συσχέτισης-παλίνδρομης και είναι ένα γραμμικό μοντέλο της εξάρτησης του κέρδους του ισολογισμού της επιχείρησης από δύο παράγοντες: τον συντελεστή αύξησης της παραγωγικότητας της εργασίας και τον συντελεστή βιομηχανικής ιδιοκτησίας.

Με βάση το μοντέλο που προέκυψε, μπορούμε να συμπεράνουμε ότι με αύξηση του επιπέδου παραγωγικότητας της εργασίας κατά 1% σε σύγκριση με το επίπεδο της προηγούμενης περιόδου, το ποσό του κέρδους του ισολογισμού θα αυξηθεί κατά 0,95 ποσοστιαίες μονάδες. αύξηση του συντελεστή βιομηχανικής ιδιοκτησίας κατά 1% θα οδηγήσει σε αύξηση του πραγματικού δείκτη κατά 27,9 ποσοστιαίες μονάδες. Κατά συνέπεια, η κυρίαρχη επιρροή στην αύξηση των κερδών του ισολογισμού ασκείται από την αύξηση της αξίας των ακινήτων για παραγωγικούς σκοπούς (ανανέωση και αύξηση των παγίων της επιχείρησης).

Χρησιμοποιώντας ένα μοντέλο πολλαπλής παλινδρόμησης, πραγματοποιείται μια πολυπαραγοντική πρόβλεψη του αποτελεσματικού χαρακτηριστικού. Ας είναι γνωστό ότι Χ1 = 3,0 και Χ3 = 0,7. Ας αντικαταστήσουμε τις τιμές των χαρακτηριστικών παραγόντων στο μοντέλο, παίρνουμε Control = 0,95*3,0 + 27,9*0,7 – 19,4 = 2,98. Έτσι, με την αύξηση της παραγωγικότητας της εργασίας και τον εκσυγχρονισμό των παγίων στοιχείων της επιχείρησης, τα κέρδη του ισολογισμού το 1ο τρίμηνο του 2005 σε σύγκριση με την προηγούμενη περίοδο (IV τρίμηνο 2004) θα αυξηθούν κατά 2,98%.

Τα οικονομικά δεδομένα αντιπροσωπεύουν ποσοτικά χαρακτηριστικά οποιωνδήποτε οικονομικών αντικειμένων ή διαδικασιών. Δημιουργούνται υπό την επίδραση πολλών παραγόντων, οι οποίοι δεν είναι όλοι προσβάσιμοι σε εξωτερικό έλεγχο. Οι μη ελεγχόμενοι παράγοντες μπορούν να λάβουν τυχαίες τιμές από κάποιο σύνολο τιμών και ως εκ τούτου να κάνουν τα δεδομένα που ορίζουν να είναι τυχαία. Ένα από τα κύρια καθήκοντα στην οικονομική έρευνα είναι ανάλυση των εξαρτήσεων μεταξύ των μεταβλητών.

Όταν εξετάζουμε τις εξαρτήσεις μεταξύ των χαρακτηριστικών, είναι απαραίτητο να διακρίνουμε, πρώτα απ 'όλα, δύο τύπους συνδέσεων:

  • λειτουργικό -χαρακτηρίζονται από πλήρη αντιστοιχία μεταξύ της αλλαγής του χαρακτηριστικού του παράγοντα και της αλλαγής στην τιμή που προκύπτει: Κάθε τιμή ενός χαρακτηριστικού παράγοντα αντιστοιχεί σε πολύ συγκεκριμένες τιμές του χαρακτηριστικού που προκύπτει.Αυτός ο τύπος σχέσης εκφράζεται ως σχέση τύπου. Η λειτουργική εξάρτηση μπορεί να συνδέσει ένα αποτελεσματικό χαρακτηριστικό με ένα ή περισσότερα χαρακτηριστικά παραγόντων. Έτσι, το ύψος των μισθών για μισθούς με βάση το χρόνο εξαρτάται από τον αριθμό των ωρών εργασίας.
  • συσχετιστική- δεν υπάρχει πλήρης αντιστοιχία μεταξύ της αλλαγής σε δύο σημεία, ο αντίκτυπος των επιμέρους παραγόντων εκδηλώνεται μόνο κατά μέσο όρο, με μαζική παρατήρηση πραγματικών δεδομένων. Η ταυτόχρονη επίδραση στο υπό μελέτη γνώρισμα ενός μεγάλου αριθμού διαφορετικών παραγόντων οδηγεί στο γεγονός ότι μια και η ίδια τιμή ενός χαρακτηριστικού παράγοντα αντιστοιχεί σε μια ολόκληρη κατανομή των τιμών του προκύπτοντος χαρακτηριστικού,αφού σε κάθε συγκεκριμένη περίπτωση άλλα χαρακτηριστικά παραγόντων μπορούν να αλλάξουν τη δύναμη και την κατεύθυνση της πρόσκρουσής τους.

Θα πρέπει να ληφθεί υπόψη ότι εάν υπάρχει λειτουργική σχέση μεταξύ των χαρακτηριστικών, είναι δυνατό, γνωρίζοντας την τιμή του χαρακτηριστικού παράγοντα, να προσδιοριστεί με ακρίβεια την τιμή του προκύπτοντος πρόσημου.Παρουσία εξάρτησης συσχέτισης, μόνο τάση αλλαγής στο προκύπτον χαρακτηριστικόόταν αλλάζει η τιμή του χαρακτηριστικού του παράγοντα.

Κατά τη μελέτη των σχέσεων μεταξύ των ζωδίων, ταξινομούνται ανάλογα με την κατεύθυνση, τη μορφή, τον αριθμό παραγόντων:

  • προς την κατεύθυνσηοι συνδέσεις χωρίζονται σε ευθείαΚαι αντίστροφο.Με μια άμεση σύνδεση, η κατεύθυνση της αλλαγής στο προκύπτον χαρακτηριστικό συμπίπτει με την κατεύθυνση της αλλαγής στο χαρακτηριστικό παράγοντα. Με την ανάδραση, η κατεύθυνση της αλλαγής στο χαρακτηριστικό που προκύπτει είναι αντίθετη από την κατεύθυνση της αλλαγής στο χαρακτηριστικό παράγοντα. Για παράδειγμα, όσο υψηλότερα είναι τα προσόντα του εργαζομένου, τόσο υψηλότερο είναι το επίπεδο παραγωγικότητας της εργασίας του (άμεση σχέση). Όσο υψηλότερη είναι η παραγωγικότητα της εργασίας, τόσο χαμηλότερο είναι το κόστος ανά μονάδα παραγωγής (ανατροφοδότηση).
  • σύμφωνα με τη μορφή(τύπος λειτουργίας) οι συνδέσεις χωρίζονται σε γραμμικός(ευθεία γραμμή) και μη γραμμικό(καμπυλόγραμμος). Μια γραμμική σχέση αντιπροσωπεύεται από μια ευθεία γραμμή, μια μη γραμμική σχέση με μια καμπύλη (παραβολή, υπερβολή κ.λπ.). Σε μια γραμμική σχέση, με αύξηση της τιμής ενός χαρακτηριστικού παράγοντα, υπάρχει ομοιόμορφη αύξηση (μείωση) στην τιμή του χαρακτηριστικού που προκύπτει.
  • από τον αριθμό των παραγόντων που επηρεάζουν το αποτελεσματικό χαρακτηριστικό,οι συνδέσεις χωρίζονται σε μονοπαράγοντα(ζευγοποιημένο) και πολυπαραγοντική.

Η μελέτη της εξάρτησης της παραλλαγής χαρακτηριστικών από τις περιβαλλοντικές συνθήκες είναι το περιεχόμενο της θεωρίας συσχέτισης.

Κατά τη διεξαγωγή ανάλυσης συσχέτισης, ολόκληρο το σύνολο δεδομένων θεωρείται ως ένα σύνολο μεταβλητών (παράγοντες), καθεμία από τις οποίες περιέχει nπαρατηρήσεις.

Κατά τη μελέτη της σχέσης μεταξύ δύο παραγόντων, συνήθως προσδιορίζονται X=(x σελ x 2,...,x n)Και Y= (y ( , y 2 ,..., y και).

Συνδιακύμανση -αυτό είναι στατιστικό μέτρο αλληλεπίδρασηςδύο μεταβλητές. Για παράδειγμα, μια θετική τιμή για τη συνδιακύμανση των αποδόσεων δύο τίτλων υποδηλώνει ότι οι αποδόσεις αυτών των τίτλων τείνουν να κινούνται προς μία κατεύθυνση.

Συνδιακύμανση μεταξύ δύο μεταβλητών ΧΚαι Υυπολογίζεται ως εξής:

όπου είναι οι πραγματικές τιμές των μεταβλητών

ΧΚαι ΣΟΛ;

Αν τυχαίες μεταβλητές Τσι Υανεξάρτητη, η θεωρητική συνδιακύμανση είναι μηδέν.

Η συνδιακύμανση εξαρτάται από τις μονάδες στις οποίες μετρώνται οι μεταβλητές Χι Y, είναι μια μη τυποποιημένη ποσότητα. Επομένως, για να μετρήσετε δύναμη σύνδεσηςΈνα άλλο στατιστικό που ονομάζεται συντελεστής συσχέτισης χρησιμοποιείται μεταξύ δύο μεταβλητών.

Για δύο μεταβλητές ΧΚαι Συντελεστής συσχέτισης ζεύγους Υ

ορίζεται ως εξής:

Οπου SSy-εκτιμήσεις των αποκλίσεων των ποσοτήτων Hee Y.Οι εκτιμήσεις αυτές χαρακτηρίζουν βαθμός διασποράςαξίες x (, x 2, ..., x n (y 1, y 2, y n)γύρω από τον μέσο όρο σας x(yαντίστοιχα), ή μεταβλητότητα(μεταβλητότητα) αυτών των μεταβλητών σε ένα σύνολο παρατηρήσεων.

Διασπορά(εκτίμηση διακύμανσης) καθορίζεται από τον τύπο

Γενικά, για να ληφθεί μια αμερόληπτη εκτίμηση της διακύμανσης, το άθροισμα των τετραγώνων θα πρέπει να διαιρεθεί με τον αριθμό των βαθμών ελευθερίας της εκτίμησης (p-r),Οπου p -μέγεθος δείγματος, r -αριθμός συνδέσεων που τοποθετούνται στο δείγμα. Δεδομένου ότι το δείγμα έχει ήδη χρησιμοποιηθεί μία φορά για τον προσδιορισμό του μέσου όρου X,τότε ο αριθμός των επάλληλων συνδέσεων σε αυτή την περίπτωση είναι ίσος με ένα (p = 1), και ο αριθμός των βαθμών ελευθερίας της εκτίμησης (δηλαδή, ο αριθμός των ανεξάρτητων στοιχείων δείγματος) είναι ίσος με (σ - 1).

Είναι πιο φυσικό να μετράται ο βαθμός διασποράς των μεταβλητών τιμών στις ίδιες μονάδες στις οποίες μετράται η ίδια η μεταβλητή. Αυτό το πρόβλημα επιλύεται από μια ένδειξη που ονομάζεται τυπική απόκλιση (τυπική απόκλιση) ή τυπικό σφάλμαμεταβλητός Χ(μεταβλητός Υ)και καθορίζεται από τη σχέση

Οι όροι στον αριθμητή του τύπου (3.2.1) εκφράζουν την αλληλεπίδραση δύο μεταβλητών και καθορίζουν το πρόσημο της συσχέτισης (θετική ή αρνητική). Εάν, για παράδειγμα, υπάρχει ισχυρή θετική σχέση μεταξύ των μεταβλητών (αύξηση σε μια μεταβλητή ενώ αυξάνεται η άλλη), κάθε όρος θα είναι ένας θετικός αριθμός. Ομοίως, εάν υπάρχει ισχυρή αρνητική σχέση μεταξύ των μεταβλητών, όλοι οι όροι στον αριθμητή θα είναι αρνητικοί αριθμοί, με αποτέλεσμα μια αρνητική τιμή συσχέτισης.

Ο παρονομαστής της έκφρασης για τον συντελεστή συσχέτισης κατά ζεύγη [βλ ο τύπος (3.2.2)] απλώς κανονικοποιεί τον αριθμητή με τέτοιο τρόπο ώστε ο συντελεστής συσχέτισης να αποδειχθεί ένας εύκολα ερμηνεύσιμος αριθμός χωρίς διάσταση και να παίρνει τιμές από -1 έως +1.

Ο αριθμητής της έκφρασης για τον συντελεστή συσχέτισης, ο οποίος είναι δύσκολο να ερμηνευτεί λόγω των ασυνήθιστων μονάδων μέτρησης, είναι συνδιακύμανση HiU.Παρά το γεγονός ότι μερικές φορές χρησιμοποιείται ως ανεξάρτητο χαρακτηριστικό (για παράδειγμα, στη χρηματοοικονομική θεωρία για την περιγραφή της κοινής μεταβολής των τιμών των μετοχών σε δύο χρηματιστήρια), είναι πιο βολικό να χρησιμοποιηθεί ο συντελεστής συσχέτισης. Η συσχέτιση και η συνδιακύμανση αντιπροσωπεύουν ουσιαστικά τις ίδιες πληροφορίες, αλλά η συσχέτιση παρουσιάζει αυτές τις πληροφορίες σε μια πιο χρήσιμη μορφή.

Για την ποιοτική αξιολόγηση του συντελεστή συσχέτισης, χρησιμοποιούνται διάφορες κλίμακες, πιο συχνά η κλίμακα Chaddock. Ανάλογα με την τιμή του συντελεστή συσχέτισης, η σχέση μπορεί να έχει μία από τις ακόλουθες αξιολογήσεις:

  • 0,1-0,3 - αδύναμο;
  • 0,3-0,5 - αισθητό.
  • 0,5-0,7 - μέτρια;
  • 0,7-0,9 - υψηλό;
  • 0,9-1,0 - πολύ υψηλό.

Η αξιολόγηση του βαθμού εγγύτητας μιας σύνδεσης χρησιμοποιώντας τον συντελεστή συσχέτισης πραγματοποιείται, κατά κανόνα, με βάση περισσότερο ή λιγότερο περιορισμένες πληροφορίες σχετικά με το φαινόμενο που μελετάται. Από αυτή την άποψη, υπάρχει ανάγκη να αξιολογηθεί η σημασία του συντελεστή γραμμικής συσχέτισης, ο οποίος καθιστά δυνατή την επέκταση των συμπερασμάτων με βάση τα αποτελέσματα του δείγματος στον γενικό πληθυσμό.

Η αξιολόγηση της σημασίας του συντελεστή συσχέτισης για μικρά μεγέθη δείγματος πραγματοποιείται χρησιμοποιώντας το Student's 7-test. Στην περίπτωση αυτή, η πραγματική (παρατηρηθείσα) τιμή αυτού του κριτηρίου καθορίζεται από τον τύπο

Η τιμή / obs που υπολογίζεται χρησιμοποιώντας αυτόν τον τύπο συγκρίνεται με την κρίσιμη τιμή του 7-κριτηρίου, το οποίο λαμβάνεται από τον πίνακα των τιμών Student's /-test (βλ. Παράρτημα 2) λαμβάνοντας υπόψη το δεδομένο επίπεδο σημασίας oc και τον αριθμό των βαθμών ελευθερίας (σελ - 2).

Εάν 7 obs > 7 καρτέλες, τότε η προκύπτουσα τιμή του συντελεστή συσχέτισης θεωρείται σημαντική (δηλαδή, η μηδενική υπόθεση που δηλώνει ότι ο συντελεστής συσχέτισης είναι ίσος με μηδέν απορρίπτεται). Και έτσι συμπεραίνεται ότι υπάρχει στενή στατιστική σχέση μεταξύ των υπό μελέτη μεταβλητών.

Αν η τιμή g y xκοντά στο μηδέν, η σχέση μεταξύ των μεταβλητών είναι ασθενής. Εάν η συσχέτιση μεταξύ τυχαίων μεταβλητών:

  • θετική, τότε καθώς η μία τυχαία μεταβλητή αυξάνεται, η άλλη τείνει να αυξάνεται κατά μέσο όρο.
  • αρνητικό, τότε καθώς η μία τυχαία μεταβλητή αυξάνεται, η άλλη τείνει να μειώνεται κατά μέσο όρο. Ένα βολικό γραφικό εργαλείο για την ανάλυση ζευγαρωμένων δεδομένων είναι διασκορπίζω οικόπεδο, που αντιπροσωπεύει κάθε παρατήρηση σε ένα χώρο δύο διαστάσεων που αντιστοιχούν σε δύο παράγοντες. Ένα scatterplot, το οποίο απεικονίζει ένα σύνολο τιμών δύο χαρακτηριστικών, ονομάζεται επίσης πεδίο συσχέτισης.Κάθε σημείο σε αυτό το διάγραμμα έχει συντεταγμένες x (. και y gΚαθώς η ισχύς της γραμμικής σχέσης αυξάνεται, τα σημεία στο γράφημα θα βρίσκονται πιο κοντά στην ευθεία γραμμή και το μέγεθος σολθα είναι πιο κοντά στην ενότητα.

Οι συντελεστές συσχέτισης κατά ζεύγη χρησιμοποιούνται για τη μέτρηση της ισχύος των γραμμικών σχέσεων μεταξύ διαφορετικών ζευγών χαρακτηριστικών από ένα σύνολο από αυτά. Για πολλά χαρακτηριστικά αποκτά κανείς πίνακας συντελεστών συσχέτισης ζεύγους.

Αφήστε ολόκληρο το σύνολο δεδομένων να αποτελείται από μια μεταβλητή Υ = =(y σελ y 2, ..., y p)Και Τμεταβλητές (παράγοντες) X,καθένα από τα οποία περιέχει nπαρατηρήσεις. Μεταβλητές τιμές ΥΚαι X,που περιέχονται στον παρατηρούμενο πληθυσμό καταγράφονται σε πίνακα (Πίνακας 3.2.1).

Πίνακας 3.2.1

Μεταβλητός

Αριθμός

παρατηρήσεις

Χ ΤΖ

Χ τπ

Με βάση τα δεδομένα που περιέχονται σε αυτόν τον πίνακα, υπολογίστε πίνακας συντελεστών συσχέτισης ζεύγους R,είναι συμμετρικό ως προς την κύρια διαγώνιο:


Η ανάλυση του πίνακα των συντελεστών συσχέτισης ζεύγους χρησιμοποιείται κατά την κατασκευή μοντέλων πολλαπλής παλινδρόμησης.

Ένας πίνακας συσχέτισης δεν μπορεί να περιγράψει πλήρως τις εξαρτήσεις μεταξύ των ποσοτήτων. Από αυτή την άποψη, η πολυμεταβλητή ανάλυση συσχέτισης εξετάζει δύο προβλήματα:

  • 1. Προσδιορισμός της στενής σχέσης μιας τυχαίας μεταβλητής με το σύνολο των άλλων μεταβλητών που περιλαμβάνονται στην ανάλυση.
  • 2. Προσδιορισμός της εγγύτητας της σύνδεσης μεταξύ δύο μεγεθών ενώ καθορίζεται ή αποκλείεται η επίδραση άλλων ποσοτήτων.

Αυτά τα προβλήματα επιλύονται χρησιμοποιώντας πολλαπλούς και μερικούς συντελεστές συσχέτισης, αντίστοιχα.

Η λύση στο πρώτο πρόβλημα (καθορισμός της στενής σχέσης μιας τυχαίας μεταβλητής με το σύνολο των άλλων μεταβλητών που περιλαμβάνονται στην ανάλυση) πραγματοποιείται χρησιμοποιώντας δείγμα πολλαπλού συντελεστή συσχέτισηςσύμφωνα με τον τύπο

Οπου R- R[εκ. τύπος (3.2.6)]; Rjj-αλγεβρικό συμπλήρωμα στοιχείου του ίδιου πίνακα R.

Συντελεστής πολλαπλής συσχέτισης σε τετράγωνο SCHj 2 ι _j J+l mσυνήθως ονομάζεται δείγμα πολλαπλού συντελεστή προσδιορισμού; δείχνει ποιο ποσοστό της διακύμανσης (τυχαία διασπορά) της τιμής που μελετάται Xjεξηγεί την παραλλαγή των υπόλοιπων τυχαίων μεταβλητών Χ (, Χ 2 ,..., X t.

Οι συντελεστές πολλαπλής συσχέτισης και προσδιορισμού είναι θετικά μεγέθη, παίρνοντας τιμές στην περιοχή από 0 έως 1. Κατά την προσέγγιση του συντελεστή R 2 στην ενότητα, μπορούμε να συμπεράνουμε ότι η σχέση μεταξύ των τυχαίων μεταβλητών είναι στενή, αλλά όχι ως προς την κατεύθυνσή της. Ο πολλαπλός συντελεστής συσχέτισης μπορεί να αυξηθεί μόνο εάν συμπεριληφθούν πρόσθετες μεταβλητές στο μοντέλο και δεν θα αυξηθεί εάν εξαιρεθεί κάποιο από τα υπάρχοντα χαρακτηριστικά.

Ο έλεγχος της σημασίας του συντελεστή προσδιορισμού πραγματοποιείται συγκρίνοντας την υπολογιζόμενη τιμή του κριτηρίου Fisher's /'

με πίνακα φά rabl. Η τιμή του πίνακα του κριτηρίου (βλ. Παράρτημα 1) καθορίζεται από το δεδομένο επίπεδο σημασίας α και τους βαθμούς ελευθερίας v l = mnv 2 = n-m-l.Συντελεστής R 2διαφέρει σημαντικά από το μηδέν αν ισχύει η ανισότητα

Αν οι τυχαίες μεταβλητές που εξετάζονται συσχετίζονται μεταξύ τουςτότε η τιμή του συντελεστή συσχέτισης ζεύγους επηρεάζεται εν μέρει από την επίδραση άλλων μεγεθών. Από αυτή την άποψη, υπάρχει ανάγκη να μελετηθεί η μερική συσχέτιση μεταξύ των ποσοτήτων, ενώ αποκλείεται η επίδραση άλλων τυχαίων μεταβλητών (μία ή περισσότερες).

Δείγμα συντελεστή μερικής συσχέτισηςκαθορίζεται από τον τύπο

Οπου R Jk , Rjj, R kk -αλγεβρικές προσθήκες στα αντίστοιχα στοιχεία του πίνακα R[εκ. τύπος (3.2.6)].

Ο συντελεστής μερικής συσχέτισης, καθώς και ο συντελεστής συσχέτισης ζεύγους, ποικίλλει από -1 έως +1.

Η έκφραση (3.2.9) υπόκειται σε t = 3 θα μοιάζει

Ο συντελεστής r 12(3) ονομάζεται συντελεστής συσχέτισης μεταξύ x (Και x 2 για σταθερό x yΕίναι συμμετρικό σε σχέση με τους πρωτεύοντες δείκτες 1, 2. Ο δευτερεύων δείκτης 3 αναφέρεται σε μια σταθερή μεταβλητή.

Παράδειγμα 3.2.1. Υπολογισμός συντελεστών ζεύγους,

πολλαπλή και μερική συσχέτιση.

Στον πίνακα 3.2.2 παρέχει πληροφορίες για τους όγκους πωλήσεων και το κόστος διαφήμισης μιας εταιρείας, καθώς και τον δείκτη καταναλωτικών δαπανών για ορισμένα τρέχοντα έτη.

  • 1. Κατασκευάστε ένα διάγραμμα διασποράς (πεδίο συσχέτισης) για τις μεταβλητές «όγκος πωλήσεων» και «δείκτης δαπανών καταναλωτή».
  • 2. Προσδιορίστε τον βαθμό επιρροής του δείκτη καταναλωτικών δαπανών στον όγκο πωλήσεων (υπολογίστε τον συντελεστή συσχέτισης ζεύγους).
  • 3. Εκτιμήστε τη σημασία του υπολογιζόμενου συντελεστή συσχέτισης ζεύγους.
  • 4. Κατασκευάστε έναν πίνακα συντελεστών συσχέτισης κατά ζεύγη για τρεις μεταβλητές.
  • 5. Βρείτε μια εκτίμηση του πολλαπλού συντελεστή συσχέτισης.
  • 6. Βρείτε εκτιμήσεις των συντελεστών μερικής συσχέτισης.

1. Στο παράδειγμά μας, το διάγραμμα διασποράς έχει τη μορφή που φαίνεται στο Σχ. 3.2.1. Η επιμήκυνση του νέφους σημείων στο διάγραμμα διασποράς κατά μήκος της κεκλιμένης γραμμής μας επιτρέπει να κάνουμε την υπόθεση ότι υπάρχει κάποια αντικειμενική τάση για μια άμεση γραμμική σχέση μεταξύ των τιμών των μεταβλητών Χ 2 Υ(όγκος πωλήσεων).

Ρύζι. 3.2.1.

2. Ενδιάμεσοι υπολογισμοί κατά τον υπολογισμό του συντελεστή συσχέτισης μεταξύ των μεταβλητών Χ 2(Δείκτης Καταναλωτικών Δαπανών) και Υ(όγκος πωλήσεων) δίνονται στον πίνακα. 3.2.3.

Μέσες τιμέςτυχαίες μεταβλητές Χ 2Και Υ,ποιοι είναι οι απλούστεροι δείκτες που χαρακτηρίζουν τις ακολουθίες jCj, x 2,..., x 16 και y v y 2,..., y 16, υπολογίστε χρησιμοποιώντας τους ακόλουθους τύπους:


Όγκος πωλήσεων Y, χιλιάδες ρούβλια.

Δείκτης

καταναλώνω

telsky

έξοδα

Όγκος πωλήσεων Y, χιλιάδες ρούβλια.

Δείκτης

καταναλώνω

telsky

έξοδα

Πίνακας 3.2.3

λ:, - Χ

(ΚΑΙ - U)(x, - x)

(x, - x) 2

(y, - - y) 2

Διασποράχαρακτηρίζει το βαθμό διάδοσης των αξιών x v x 2,x:

Ας εξετάσουμε τώρα τη λύση στο παράδειγμα 3.2.1 στο Excel.

Για να υπολογίσετε τη συσχέτιση χρησιμοποιώντας το Excel, μπορείτε να χρησιμοποιήσετε τη συνάρτηση =correl(), προσδιορίζοντας τις διευθύνσεις δύο στηλών αριθμών, όπως φαίνεται στο Σχ. 3.2.2. Η απάντηση τοποθετείται στο Δ8 και ισούται με 0,816.

Ρύζι. 3.2.2.

(Σημείωση: Ορίσματα συνάρτησης Οι συσχετισμοί πρέπει να είναι αριθμοί ή ονόματα, πίνακες ή αναφορές που περιέχουν αριθμούς. Εάν το όρισμα, το οποίο είναι ένας πίνακας ή μια αναφορά, περιέχει κείμενο, τιμές boolean ή κενά κελιά, τότε αυτές οι τιμές αγνοούνται. Ωστόσο, τα κελιά που περιέχουν μηδενικές τιμές καταμετρώνται.

Αν συστοιχία! και ο πίνακας2 έχουν διαφορετικούς αριθμούς σημείων δεδομένων και στη συνέχεια η συνάρτηση Το correl επιστρέφει την τιμή σφάλματος #n/a.

Εάν ο πίνακας1 ή ο πίνακας2 είναι κενός ή εάν το o (τυπική απόκλιση) των τιμών τους είναι μηδέν, τότε η συνάρτηση Το correl επιστρέφει την τιμή σφάλματος #div/0!.)

Η κρίσιμη τιμή της στατιστικής t Student μπορεί επίσης να ληφθεί χρησιμοποιώντας τη συνάρτηση μελέτη διανομής 1 πακέτου Excel. Ως ορίσματα συνάρτησης, πρέπει να καθορίσετε τον αριθμό των βαθμών ελευθερίας ίσους με n- 2 (στο παράδειγμά μας 16 - 2= 14) και επίπεδο σημασίας a (στο παράδειγμά μας a = 0,1) (Εικ. 3.2.3). Αν πραγματική αξία/-statistics που λαμβάνονται modulo είναι μεγαλύτερο κρίσιμος,τότε με πιθανότητα (1 - α) ο συντελεστής συσχέτισης διαφέρει σημαντικά από το μηδέν.


Ρύζι. 3.2.3. Η κρίσιμη τιμή του /-statistic είναι 1,7613

Το Excel περιλαμβάνει ένα σύνολο εργαλείων ανάλυσης δεδομένων (το λεγόμενο πακέτο ανάλυσης) που έχουν σχεδιαστεί για την επίλυση διαφόρων στατιστικών προβλημάτων. Να υπολογιστεί ο πίνακας των συντελεστών συσχέτισης ζεύγους Rθα πρέπει να χρησιμοποιήσετε το εργαλείο συσχέτισης (Εικ. 3.2.4) και να ορίσετε τις παραμέτρους ανάλυσης στο αντίστοιχο πλαίσιο διαλόγου. Η απάντηση θα τοποθετηθεί σε νέο φύλλο εργασίας (Εικ. 3.2.5).

1 Στο Excel 2010, το όνομα της συνάρτησης studrasprobr άλλαξε σε stu-

DENT.OBR.2X.

Ρύζι. 3.2.4.


Ρύζι. 3.2.5.

  • Θεμελιωτές της θεωρίας της συσχέτισης θεωρούνται οι Άγγλοι στατιστικολόγοι F. Galton (1822-1911) και K. Pearson (1857-1936). Ο όρος «συσχέτιση» δανείστηκε από τη φυσική επιστήμη και σημαίνει «συσχέτιση, αντιστοιχία». Η ιδέα της συσχέτισης ως αλληλεξάρτησης μεταξύ τυχαίων μεταβλητών βασίζεται στη μαθηματική-στατιστική θεωρία της συσχέτισης.

Τα στοιχεία για το 2011 παρέχονται για τα εδάφη της Νότιας Ομοσπονδιακής Περιφέρειας της Ρωσικής Ομοσπονδίας

Εδάφη της Ομοσπονδιακής Περιφέρειας

Ακαθάριστο περιφερειακό προϊόν, δισεκατομμύρια ρούβλια, Y

Επενδύσεις σε πάγια στοιχεία ενεργητικού, δισεκατομμύρια ρούβλια, X1

1. Rep. Αδύγεα

2. Rep. Νταγκεστάν

3. Rep. Ινγκουσετία

4. Δημοκρατία της Καμπαρντίνο-Μπαλκαρίας

5. Rep. Καλμυκία

6. Δημοκρατία του Καρατσάι-Τσερκ

7. Rep. Βόρεια Οσετία - Αλανία

8. Περιοχή Κρασνοντάρ)

9. Περιφέρεια Σταυρούπολης

10. Περιοχή Αστραχάν.

11. Περιοχή Βόλγκογκραντ.

12. Περιοχή Ροστόφ.

  • 1. Υπολογίστε τον πίνακα των συντελεστών συσχέτισης ζεύγους. αξιολογήσει τη στατιστική σημασία των συντελεστών συσχέτισης.
  • 2. Κατασκευάστε ένα πεδίο συσχέτισης μεταξύ του αποτελεσματικού χαρακτηριστικού και του παράγοντα που σχετίζεται περισσότερο με αυτό.
  • 3. Υπολογίστε τις παραμέτρους της παλινδρόμησης γραμμικού ζεύγους για κάθε παράγοντα Χ.
  • 4. Αξιολογήστε την ποιότητα κάθε μοντέλου μέσω του συντελεστή προσδιορισμού, του μέσου σφάλματος προσέγγισης και του Fisher's F test. Επιλέξτε το καλύτερο μοντέλο.

θα είναι το 80% της μέγιστης τιμής του. Παρουσιάστε γραφικά: πραγματικές τιμές και τιμές μοντέλου, σημεία πρόβλεψης.

  • 6. Χρησιμοποιώντας πολλαπλή παλινδρόμηση βήμα προς βήμα (μέθοδος αποκλεισμού ή μέθοδος συμπερίληψης), δημιουργήστε ένα μοντέλο διαμόρφωσης τιμής διαμερίσματος λόγω σημαντικών παραγόντων. Δώστε μια οικονομική ερμηνεία των συντελεστών του μοντέλου παλινδρόμησης.
  • 7. Αξιολογήστε την ποιότητα του κατασκευασμένου μοντέλου. Έχει βελτιωθεί η ποιότητα του μοντέλου σε σύγκριση με το μοντέλο ενός παράγοντα; Εκτιμήστε την επίδραση σημαντικών παραγόντων στο αποτέλεσμα χρησιμοποιώντας τους συντελεστές ελαστικότητας, σε - και -; συντελεστές

Κατά την επίλυση αυτού του προβλήματος, θα πραγματοποιήσουμε υπολογισμούς και θα κατασκευάσουμε γραφήματα και διαγράμματα χρησιμοποιώντας τις ρυθμίσεις ανάλυσης δεδομένων του Excel.

1. Υπολογίστε τον πίνακα των συντελεστών συσχέτισης ζευγών και αξιολογήστε τη στατιστική σημασία των συντελεστών συσχέτισης

Στο πλαίσιο διαλόγου Συσχέτιση, στο πεδίο Διαστήματα εισόδου, εισαγάγετε την περιοχή των κελιών που περιέχουν τα δεδομένα προέλευσης. Εφόσον έχουμε επιλέξει και τις επικεφαλίδες στηλών, τσεκάρουμε το πλαίσιο ελέγχου Ετικέτες στην πρώτη σειρά.

Πήραμε τα εξής αποτελέσματα:

Πίνακας 1.1 Πίνακας συντελεστών συσχέτισης ζεύγους

Η ανάλυση του πίνακα των συντελεστών συσχέτισης ανά ζεύγη δείχνει ότι η εξαρτημένη μεταβλητή Υ, δηλαδή το ακαθάριστο περιφερειακό προϊόν, έχει στενότερη σχέση με το Χ1 (επένδυση σε πάγιο κεφάλαιο). Ο συντελεστής συσχέτισης είναι 0,936. Αυτό σημαίνει ότι το 93,6% της εξαρτημένης μεταβλητής Υ (ακαθάριστο περιφερειακό προϊόν) εξαρτάται από τον δείκτη Χ1 (επένδυση σε πάγιο κεφάλαιο).

Η στατιστική σημασία των συντελεστών συσχέτισης θα προσδιοριστεί χρησιμοποιώντας το Student's t-test. Συγκρίνουμε την τιμή του πίνακα με τις υπολογιζόμενες τιμές.

Ας υπολογίσουμε την τιμή του πίνακα χρησιμοποιώντας τη συνάρτηση STUDISCOVER.

t πίνακας = 0,129 με επίπεδο εμπιστοσύνης 0,9 και βαθμούς ελευθερίας (n-2).

Ο παράγοντας Χ1 είναι στατιστικά σημαντικός.

2. Ας δημιουργήσουμε ένα πεδίο συσχέτισης μεταξύ του αποτελεσματικού χαρακτηριστικού (ακαθάριστο περιφερειακό προϊόν) και του παράγοντα που σχετίζεται περισσότερο με αυτό (επένδυση σε πάγιο κεφάλαιο)

Για να το κάνουμε αυτό, θα χρησιμοποιήσουμε το εργαλείο σχεδίασης διασποράς του Excel.

Ως αποτέλεσμα, λαμβάνουμε ένα πεδίο συσχέτισης για την τιμή του ακαθάριστου περιφερειακού προϊόντος, δισεκατομμύρια ρούβλια. και επενδύσεις σε πάγια στοιχεία ενεργητικού, δισεκατομμύρια ρούβλια. (Εικόνα 1.1.).

Εικόνα 1.1

3. Υπολογίστε τις παραμέτρους της παλινδρόμησης γραμμικού ζεύγους για κάθε παράγοντα Χ

Για να υπολογίσουμε τις παραμέτρους της γραμμικής παλινδρόμησης κατά ζεύγη, θα χρησιμοποιήσουμε το εργαλείο παλινδρόμησης που περιλαμβάνεται στη ρύθμιση Ανάλυση δεδομένων.

Στο πλαίσιο διαλόγου Regression, στο πεδίο Input interval Y, εισαγάγετε τη διεύθυνση του εύρους των κελιών που αντιπροσωπεύει η εξαρτημένη μεταβλητή. Στο χωράφι

Το διάστημα εισαγωγής X εισάγουμε τη διεύθυνση του εύρους που περιέχει τις τιμές των ανεξάρτητων μεταβλητών. Ας υπολογίσουμε τις παραμέτρους της ζευγαρωμένης παλινδρόμησης για τον παράγοντα Χ.

Για το X1 λάβαμε τα ακόλουθα δεδομένα που παρουσιάζονται στον Πίνακα 1.2:

Πίνακας 1.2

Η εξίσωση παλινδρόμησης για την εξάρτηση της τιμής του ακαθάριστου περιφερειακού προϊόντος από την επένδυση σε πάγιο κεφάλαιο έχει τη μορφή:

4. Ας αξιολογήσουμε την ποιότητα κάθε μοντέλου μέσω του συντελεστή προσδιορισμού, του μέσου σφάλματος προσέγγισης και του Fisher's F-test. Ας προσδιορίσουμε ποιο μοντέλο είναι το καλύτερο.

Λάβαμε τον συντελεστή προσδιορισμού, το μέσο σφάλμα προσέγγισης, ως αποτέλεσμα των υπολογισμών που πραγματοποιήθηκαν στην παράγραφο 3. Τα δεδομένα που ελήφθησαν παρουσιάζονται στους ακόλουθους πίνακες:

Δεδομένα X1:

Πίνακας 1.3α

Πίνακας 1.4β

Α) Ο συντελεστής προσδιορισμού καθορίζει το ποσοστό της παραλλαγής του χαρακτηριστικού Υ που λαμβάνεται υπόψη στο μοντέλο και οφείλεται στην επίδραση του παράγοντα Χ σε αυτό χαρακτηριστικά στο κατασκευασμένο μαθηματικό μοντέλο.

Το Excel αναφέρεται σε R-τετράγωνο.

Με βάση αυτό το κριτήριο, το πιο κατάλληλο μοντέλο είναι η εξίσωση παλινδρόμησης της εξάρτησης της τιμής του ακαθάριστου περιφερειακού προϊόντος από την επένδυση σε πάγιο κεφάλαιο (Χ1).

Β) Υπολογίζουμε το μέσο σφάλμα προσέγγισης χρησιμοποιώντας τον τύπο:

όπου ο αριθμητής είναι το άθροισμα των τετραγώνων της απόκλισης των υπολογισμένων τιμών από τις πραγματικές. Στους πίνακες βρίσκεται στη στήλη SS, τη γραμμή Υπόλοιπο.

Υπολογίζουμε τη μέση τιμή ενός διαμερίσματος στο Excel χρησιμοποιώντας τη συνάρτηση AVERAGE. = 24,18182 δισεκατομμύρια ρούβλια.

Κατά τη διεξαγωγή οικονομικών υπολογισμών, ένα μοντέλο θεωρείται επαρκώς ακριβές εάν το μέσο σφάλμα προσέγγισης είναι μικρότερο από 5%, το μοντέλο θεωρείται αποδεκτό εάν το μέσο σφάλμα προσέγγισης είναι μικρότερο από 15%.

Σύμφωνα με αυτό το κριτήριο, το πιο επαρκές είναι το μαθηματικό μοντέλο για την εξίσωση παλινδρόμησης της εξάρτησης της τιμής του ακαθάριστου περιφερειακού προϊόντος από την επένδυση σε πάγιο κεφάλαιο (Χ1).

Γ) Το F-test χρησιμοποιείται για τον έλεγχο της σημασίας του μοντέλου παλινδρόμησης. Για να γίνει αυτό, γίνεται επίσης σύγκριση των κρίσιμων (πίνακα) τιμών του Fisher F-test.

Οι υπολογισμένες τιμές δίνονται στους πίνακες 1.4b (που υποδεικνύονται με το γράμμα F).

Θα υπολογίσουμε την τιμή του πίνακα της δοκιμής F Fisher στο Excel χρησιμοποιώντας τη συνάρτηση FDIST. Ας πάρουμε την πιθανότητα ίση με 0,05. Έλαβε: = 4,75

Οι υπολογισμένες τιμές της δοκιμής F Fisher για κάθε παράγοντα είναι συγκρίσιμες με την τιμή του πίνακα:

71,02 > = 4,75 το μοντέλο είναι επαρκές σύμφωνα με αυτό το κριτήριο.

Έχοντας αναλύσει τα δεδομένα και με βάση τα τρία κριτήρια, μπορούμε να συμπεράνουμε ότι το καλύτερο είναι το μαθηματικό μοντέλο που έχει κατασκευαστεί για τον παράγοντα ακαθάριστου περιφερειακού προϊόντος, ο οποίος περιγράφεται από τη γραμμική εξίσωση

5. Για το επιλεγμένο μοντέλο εξάρτησης της τιμής του ακαθάριστου περιφερειακού προϊόντος

Θα προβλέψουμε τη μέση τιμή του δείκτη σε επίπεδο σημαντικότητας εάν η προβλεπόμενη τιμή του παράγοντα είναι το 80% της μέγιστης τιμής του. Ας το παρουσιάσουμε γραφικά: πραγματικές τιμές και τιμές μοντέλου, σημεία πρόβλεψης.

Ας υπολογίσουμε την προβλεπόμενη τιμή του X σύμφωνα με την συνθήκη, θα είναι 80% της μέγιστης τιμής.

Ας υπολογίσουμε το X max στο Excel χρησιμοποιώντας τη συνάρτηση MAX.

0,8 *52,8 = 42,24

Για να λάβουμε προγνωστικές εκτιμήσεις της εξαρτημένης μεταβλητής, αντικαθιστούμε τη λαμβανόμενη τιμή της ανεξάρτητης μεταβλητής στη γραμμική εξίσωση:

5,07+2,14*42,24 = 304,55 δισεκατομμύρια ρούβλια.

Ας προσδιορίσουμε το διάστημα εμπιστοσύνης της πρόβλεψης, το οποίο θα έχει τα ακόλουθα όρια:

Για να υπολογίσουμε το διάστημα εμπιστοσύνης για την προβλεπόμενη τιμή, υπολογίζουμε την απόκλιση από τη γραμμή παλινδρόμησης.

Για ένα μοντέλο ζευγαρωμένης παλινδρόμησης, η τιμή απόκλισης υπολογίζεται:

εκείνοι. τυπική τιμή σφάλματος από τον Πίνακα 1.5α.

(Δεδομένου ότι ο αριθμός των βαθμών ελευθερίας είναι ίσος με έναν, ο παρονομαστής θα είναι ίσος με n-2). πρόβλεψη παλινδρόμησης ζεύγους συσχέτισης

Για να υπολογίσουμε τον συντελεστή, θα χρησιμοποιήσουμε τη συνάρτηση Excel STUDISCOVER, θα πάρουμε την πιθανότητα ίση με 0,1 και τον αριθμό των βαθμών ελευθερίας 38.

Υπολογίζουμε την τιμή χρησιμοποιώντας το Excel και παίρνουμε 12294.


Ας προσδιορίσουμε τα άνω και κάτω όρια του διαστήματος.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

Έτσι, η προβλεπόμενη τιμή = 304,55 χιλιάδες δολάρια θα είναι μεταξύ του κατώτερου ορίου ίσο με 277,078 χιλιάδες δολάρια. και ανώτατο όριο ίσο με 332,022 δις. Τρίψιμο.

Οι πραγματικές τιμές και οι τιμές του μοντέλου, τα σημεία πρόβλεψης παρουσιάζονται γραφικά στο Σχήμα 1.2.


Εικόνα 1.2

6. Χρησιμοποιώντας πολλαπλή παλινδρόμηση βήμα προς βήμα (μέθοδος εξάλειψης), θα δημιουργήσουμε ένα μοντέλο για τη διαμόρφωση της τιμής του ακαθάριστου περιφερειακού προϊόντος λόγω σημαντικών παραγόντων

Για τη δημιουργία πολλαπλής παλινδρόμησης, θα χρησιμοποιήσουμε τη συνάρτηση παλινδρόμησης του Excel, συμπεριλαμβανομένων όλων των παραγόντων. Ως αποτέλεσμα, λαμβάνουμε τους πίνακες αποτελεσμάτων, από τους οποίους χρειαζόμαστε το Student’s t-test.

Πίνακας 1.8α

Πίνακας 1.8β

Πίνακας 1.8γ.

Παίρνουμε ένα μοντέλο όπως:

Από< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

Ας επιλέξουμε τη μικρότερη απόλυτη τιμή του Student's t-test, είναι ίση με 8,427, τη συγκρίνουμε με την τιμή του πίνακα, που υπολογίζουμε στο Excel, πάρουμε το επίπεδο σημαντικότητας ίσο με 0,10, τον αριθμό των βαθμών ελευθερίας n-m-1= 12-4=8: =1,8595

Δεδομένου ότι 8,427>1,8595 το μοντέλο θα πρέπει να θεωρείται επαρκές.

7. Για να εκτιμήσουμε τον σημαντικό παράγοντα του μαθηματικού μοντέλου που προκύπτει, υπολογίζουμε τους συντελεστές ελαστικότητας και - συντελεστές

Ο συντελεστής ελαστικότητας δείχνει σε ποιο ποσοστό θα αλλάξει το ενεργό χαρακτηριστικό όταν το χαρακτηριστικό παράγοντα αλλάξει κατά 1%:

E X4 = 2,137 * (10,69/24,182) = 0,94%

Δηλαδή, με αύξηση της επένδυσης σε πάγιο κεφάλαιο 1%, το κόστος κατά μέσο όρο αυξάνεται κατά 0,94%.

Ο συντελεστής δείχνει με ποιο μέρος της τυπικής απόκλισης η μέση τιμή της εξαρτημένης μεταβλητής αλλάζει με μια αλλαγή στην ανεξάρτητη μεταβλητή κατά μία τυπική απόκλιση.

2,137* (14.736/33,632) = 0,936.

Τα δεδομένα τυπικής απόκλισης λαμβάνονται από πίνακες που λαμβάνονται χρησιμοποιώντας το εργαλείο Περιγραφικής Στατιστικής.

Πίνακας 1.11 Περιγραφικές στατιστικές (Υ)

Πίνακας 1.12 Περιγραφικά στατιστικά στοιχεία (Χ4)

Ο συντελεστής καθορίζει το μερίδιο της επιρροής του παράγοντα στη συνολική επιρροή όλων των παραγόντων:

Για να υπολογίσουμε τους συντελεστές συσχέτισης ζεύγους, υπολογίζουμε τον πίνακα των συντελεστών συσχέτισης ζεύγους στο Excel χρησιμοποιώντας το εργαλείο Συσχέτισης των ρυθμίσεων Ανάλυση δεδομένων.

Πίνακας 1.14

(0,93633*0,93626) / 0,87 = 1,00.

Συμπέρασμα: Από τους υπολογισμούς που προέκυψαν, μπορούμε να συμπεράνουμε ότι το αποτελεσματικό χαρακτηριστικό Υ (ακαθάριστο περιφερειακό προϊόν) έχει μεγάλη εξάρτηση από τον παράγοντα X1 (επένδυση σε πάγιο κεφάλαιο) (κατά 100%).

Αναφορές

  • 1. Magnus Y.R., Katyshev P.K., Peresetsky A.A. Οικονομετρία. Μάθημα για αρχάριους. Οδηγός μελέτης. 2η έκδ. - Μ.: Delo, 1998. - Σελ. 69 - 74.
  • 2. Εργαστήριο οικονομετρίας: Σχολικό βιβλίο / Ι.Ι. Eliseeva, S.V. Kurysheva, N.M. Gordeenko et al 2002. - Σελ. 49 - 105.
  • 3. Dougherty K. Εισαγωγή στην οικονομετρία: Μετάφρ. από τα αγγλικά - Μ.: INFRA-M, 1999. - XIV, σελ. 262 - 285.
  • 4. Ayvyzyan S.A., Mikhtiryan V.S. Εφαρμοσμένα μαθηματικά και βασικές αρχές της οικονομετρίας. -1998., σσ. 115-147.
  • 5. Kremer N.Sh., Putko B.A. Οικονομετρία. -2007. από 175-251.
y x (1) x (2) x (3) x (4) x (5)
y 1.00 0.43 0.37 0.40 0.58 0.33
x (1) 0.43 1.00 0.85 0.98 0.11 0.34
x (2) 0.37 0.85 1.00 0.88 0.03 0.46
x (3) 0.40 0.98 0.88 1.00 0.03 0.28
x (4) 0.58 0.11 0.03 0.03 1.00 0.57
x (5) 0.33 0.34 0.46 0.28 0.57 1.00

Η ανάλυση του πίνακα των ζευγαρωμένων συντελεστών συσχέτισης δείχνει ότι ο αποτελεσματικός δείκτης σχετίζεται στενότερα με τον δείκτη x(4) - η ποσότητα του λιπάσματος που καταναλώνεται ανά 1 εκτάριο ().

Ταυτόχρονα, η σύνδεση μεταξύ των χαρακτηριστικών-επιχειρημάτων είναι αρκετά στενή. Έτσι, υπάρχει μια πρακτικά λειτουργική σχέση μεταξύ του αριθμού των τροχοφόρων τρακτέρ ( x(1)) και τον αριθμό των εργαλείων επιφανειακής άροσης .

Η παρουσία πολυσυγγραμμικότητας υποδεικνύεται επίσης από τους συντελεστές συσχέτισης και . Λαμβάνοντας υπόψη τη στενή σχέση μεταξύ των δεικτών x (1) , x(2) και x(3), μόνο ένα από αυτά μπορεί να συμπεριληφθεί στο μοντέλο παλινδρόμησης απόδοσης.

Για να δείξετε τον αρνητικό αντίκτυπο της πολυσυγγραμμικότητας, εξετάστε ένα μοντέλο παλινδρόμησης της απόδοσης, συμπεριλαμβανομένων όλων των δεικτών εισόδου:

F obs = 121.

Οι τιμές των διορθωμένων εκτιμήσεων των τυπικών αποκλίσεων των εκτιμήσεων των συντελεστών της εξίσωσης αναφέρονται σε παρένθεση .

Οι ακόλουθες παράμετροι επάρκειας παρουσιάζονται κάτω από την εξίσωση παλινδρόμησης: πολλαπλός συντελεστής προσδιορισμού; διορθωμένη εκτίμηση της υπολειπόμενης διακύμανσης, μέσο σχετικό σφάλμα προσέγγισης και υπολογισμένη τιμή του κριτηρίου F obs = 121.

Η εξίσωση παλινδρόμησης είναι σημαντική γιατί F obs = 121 > F kp = 2,85 που βρέθηκαν από τον πίνακα φά-διανομές σε a=0,05; n 1 =6 και n 2 =14.

Από αυτό προκύπτει ότι το Q10, δηλ. και τουλάχιστον έναν από τους συντελεστές της εξίσωσης q ι (ι= 0, 1, 2, ..., 5) δεν είναι μηδέν.

Για να ελεγχθεί η υπόθεση σχετικά με τη σημασία των επιμέρους συντελεστών παλινδρόμησης H0: q j =0, όπου ι=1,2,3,4,5, συγκρίνετε την κρίσιμη τιμή t kp = 2,14, βρέθηκε από τον πίνακα t-κατανομές σε επίπεδο σημαντικότητας α=2 Q=0,05 και ο αριθμός των βαθμών ελευθερίας n=14, με την υπολογιζόμενη τιμή . Από την εξίσωση προκύπτει ότι ο συντελεστής παλινδρόμησης είναι στατιστικά σημαντικός μόνο όταν x(4) από το ½ t 4 ½=2,90 > t kp =2,14.



Τα αρνητικά σημάδια των συντελεστών παλινδρόμησης δεν προσφέρονται για οικονομική ερμηνεία όταν x(1) και x(5) . Από τις αρνητικές τιμές των συντελεστών προκύπτει ότι η αύξηση του κορεσμού της γεωργίας με τροχοφόρα τρακτέρ ( x(1)) και φυτοϋγειονομικά προϊόντα ( x(5)) έχει αρνητική επίδραση στην απόδοση. Επομένως, η προκύπτουσα εξίσωση παλινδρόμησης είναι απαράδεκτη.

Για να λάβουμε μια εξίσωση παλινδρόμησης με σημαντικούς συντελεστές, χρησιμοποιούμε έναν αλγόριθμο ανάλυσης παλινδρόμησης βήμα προς βήμα. Αρχικά, χρησιμοποιούμε έναν αλγόριθμο βήμα προς βήμα με εξάλειψη μεταβλητών.

Ας εξαιρέσουμε τη μεταβλητή από το μοντέλο x(1) , που αντιστοιχεί στην ελάχιστη απόλυτη τιμή του ½ t 1 ½=0,01. Για τις υπόλοιπες μεταβλητές, κατασκευάζουμε και πάλι την εξίσωση παλινδρόμησης:

Η εξίσωση που προκύπτει είναι σημαντική γιατί F παρατηρήθηκε = 155 > F kp = 2,90, βρέθηκε στο επίπεδο σημαντικότητας a=0,05 και οι αριθμοί βαθμών ελευθερίας n 1 =5 και n 2 =15 σύμφωνα με τον πίνακα φά-διανομή, δηλ. διάνυσμα q10. Ωστόσο, μόνο ο συντελεστής παλινδρόμησης στο x(4) . Εκτιμώμενες τιμές ½ tΤο j ½ για άλλους συντελεστές είναι μικρότερο t kr = 2,131, βρέθηκε από τον πίνακα t-διανομές σε a=2 Q=0,05 και n=15.

Εξαιρώντας τη μεταβλητή από το μοντέλο x(3) , που αντιστοιχεί στην ελάχιστη τιμή t 3 = 0,35 και παίρνουμε την εξίσωση παλινδρόμησης:

(2.9)

Στην εξίσωση που προκύπτει, ο συντελεστής στο x(5) . Με τον αποκλεισμό x(5) λαμβάνουμε την εξίσωση παλινδρόμησης:

(2.10)

Λάβαμε μια σημαντική εξίσωση παλινδρόμησης με σημαντικούς και ερμηνεύσιμους συντελεστές.

Ωστόσο, η εξίσωση που προκύπτει δεν είναι το μόνο «καλό» και όχι το «καλύτερο» μοντέλο απόδοσης στο παράδειγμά μας.

Ας το δείξουμε Στη συνθήκη πολυσυγγραμμικότητας, ένας σταδιακός αλγόριθμος με τη συμπερίληψη μεταβλητών είναι πιο αποτελεσματικός.Το πρώτο βήμα στο μοντέλο απόδοσης yπεριλαμβάνεται μεταβλητή x(4) , που έχει τον υψηλότερο συντελεστή συσχέτισης με y, εξηγείται από τη μεταβλητή - r(y,x(4))=0,58. Στο δεύτερο βήμα, συμπεριλαμβανομένης της εξίσωσης μαζί με x(4) μεταβλητές x(1) ή x(3), θα λάβουμε μοντέλα που, για οικονομικούς λόγους και στατιστικά χαρακτηριστικά, υπερβαίνουν το (2.10):

(2.11)

(2.12)

Η συμπερίληψη οποιασδήποτε από τις τρεις υπόλοιπες μεταβλητές στην εξίσωση επιδεινώνει τις ιδιότητές της. Βλέπε, για παράδειγμα, την εξίσωση (2.9).

Έτσι, έχουμε τρία «καλά» μοντέλα απόδοσης, από τα οποία πρέπει να επιλέξουμε ένα για οικονομικούς και στατιστικούς λόγους.

Σύμφωνα με στατιστικά κριτήρια, το μοντέλο (2.11) είναι το πλέον κατάλληλο. Αντιστοιχεί στις ελάχιστες τιμές υπολειπόμενης διακύμανσης = 2,26 και στο μέσο σχετικό σφάλμα προσέγγισης και στις μεγαλύτερες τιμές και Fob = 273.

Το μοντέλο (2.12) έχει ελαφρώς χειρότερους δείκτες επάρκειας, ακολουθούμενο από το μοντέλο (2.10).

Τώρα θα επιλέξουμε το καλύτερο από τα μοντέλα (2.11) και (2.12). Αυτά τα μοντέλα διαφέρουν μεταξύ τους ως προς τις μεταβλητές x(1) και x(3) . Ωστόσο, στα μοντέλα απόδοσης η μεταβλητή x(1) (αριθμός τροχοφόρων τρακτέρ ανά 100 εκτάρια) προτιμάται περισσότερο από το μεταβλητό x(3) (αριθμός εργαλείων επιφανειακής άροσης ανά 100 εκτάρια), το οποίο είναι σε κάποιο βαθμό δευτερεύον (ή προέρχεται από x (1)).

Από την άποψη αυτή, για οικονομικούς λόγους, θα πρέπει να προτιμάται το μοντέλο (2.12). Έτσι, μετά την εφαρμογή του αλγόριθμου της σταδιακής ανάλυσης παλινδρόμησης με συμπερίληψη μεταβλητών και λαμβάνοντας υπόψη το γεγονός ότι μόνο μία από τις τρεις σχετικές μεταβλητές θα πρέπει να εισέλθει στην εξίσωση ( x (1) , x(2) ή x(3)) επιλέξτε την τελική εξίσωση παλινδρόμησης:

Η εξίσωση είναι σημαντική στο a=0,05, γιατί F obs = 266 > F kp = 3,20, βρέθηκε από τον πίνακα φά-διανομές σε α= Q=0,05; n 1 =3 και n 2 =17. Όλοι οι συντελεστές παλινδρόμησης στην εξίσωση ½ είναι επίσης σημαντικοί t j½> t kp(a=2 Q=0,05; n=17)=2,11. Ο συντελεστής παλινδρόμησης q 1 θα πρέπει να θεωρείται σημαντικός (q 1 ¹0) για οικονομικούς λόγους, ενώ t 1 =2,09 μόνο ελαφρώς λιγότερο t kp = 2,11.

Από την εξίσωση παλινδρόμησης προκύπτει ότι μια αύξηση κατά ένα στον αριθμό των τρακτέρ ανά 100 εκτάρια καλλιεργήσιμης γης (σε σταθερή τιμή x(4)) οδηγεί σε αύξηση των αποδόσεων των σιτηρών κατά μέσο όρο 0,345 c/ha.

Ένας κατά προσέγγιση υπολογισμός των συντελεστών ελαστικότητας e 1 »0,068 και e 2 »0,161 δείχνει ότι με αυξανόμενους δείκτες x(1) και x(4) κατά 1%, η απόδοση των κόκκων αυξάνεται κατά μέσο όρο κατά 0,068% και 0,161%, αντίστοιχα.

Ο πολλαπλός συντελεστής προσδιορισμού δείχνει ότι μόνο το 46,9% της διακύμανσης της απόδοσης εξηγείται από τους δείκτες που περιλαμβάνονται στο μοντέλο ( x(1) και x(4)), δηλαδή τον κορεσμό της φυτικής παραγωγής με τρακτέρ και λιπάσματα. Η υπόλοιπη παραλλαγή οφείλεται στη δράση μη υπολογιζόμενων παραγόντων ( x (2) , x (3) , x(5), καιρικές συνθήκες κ.λπ.). Το μέσο σχετικό σφάλμα προσέγγισης χαρακτηρίζει την επάρκεια του μοντέλου, καθώς και την τιμή της υπολειπόμενης διακύμανσης. Κατά την ερμηνεία της εξίσωσης παλινδρόμησης, ενδιαφέρουν οι τιμές των σχετικών σφαλμάτων προσέγγισης . Ας θυμηθούμε ότι - η τιμή μοντέλου του ενεργού δείκτη χαρακτηρίζει τη μέση τιμή απόδοσης για το σύνολο των υπό εξέταση περιοχών, υπό την προϋπόθεση ότι οι τιμές των επεξηγηματικών μεταβλητών x(1) και x(4) καθορίζονται στο ίδιο επίπεδο, δηλαδή x (1) = x i(1) και x (4) = xi(4) . Στη συνέχεια, σύμφωνα με τις τιμές του d εγώΜπορείτε να συγκρίνετε τις περιοχές με βάση την απόδοση. Περιοχές στις οποίες αντιστοιχούν οι τιμές d εγώ>0, έχουν απόδοση άνω του μέσου όρου και δ εγώ<0 - ниже среднего.

Στο παράδειγμά μας, ως προς την απόδοση, η φυτική παραγωγή είναι πιο αποτελεσματική στην περιοχή που αντιστοιχεί στο δ 7 =28%, όπου η απόδοση είναι 28% υψηλότερη από τον περιφερειακό μέσο όρο και η λιγότερο αποτελεσματική είναι στην περιοχή με d 20 =-27,3%.


Εργασίες και ασκήσεις

2.1. Από τον γενικό πληθυσμό ( y, x (1) , ..., x(p)), όπου yέχει νόμο κανονικής κατανομής με μαθηματική προσδοκία υπό όρους και διακύμανση s 2, λήφθηκε ένα τυχαίο δείγμα όγκου nκαι ας ( y i, x i (1) , ..., x i(p)) - αποτέλεσμα εγώη παρατήρηση ( εγώ=1, 2, ..., n). Να προσδιορίσετε: α) τη μαθηματική προσδοκία της εκτίμησης των ελαχίστων τετραγώνων του διανύσματος q; β) Πίνακας συνδιακύμανσης της εκτίμησης των ελαχίστων τετραγώνων του διανύσματος q; γ) μαθηματική προσδοκία της αξιολόγησης.

2.2. Σύμφωνα με τις συνθήκες του προβλήματος 2.1, να βρείτε τη μαθηματική προσδοκία του αθροίσματος των τετραγωνικών αποκλίσεων λόγω παλινδρόμησης, δηλ. EQ R, Πού

.

2.3. Σύμφωνα με τις συνθήκες του προβλήματος 2.1, προσδιορίστε τη μαθηματική προσδοκία του αθροίσματος των τετραγωνικών αποκλίσεων που προκαλούνται από την υπολειπόμενη διακύμανση σε σχέση με τις γραμμές παλινδρόμησης, δηλ. EQ ost, όπου

2.4. Να αποδείξετε ότι όταν εκπληρώνεται η υπόθεση H 0: q=0 στατιστικά

έχει κατανομή F με βαθμούς ελευθερίας n 1 =p+1 και n 2 =n-p-1.

2.5. Να αποδείξετε ότι όταν εκπληρώνεται η υπόθεση H 0: q j =0, η στατιστική έχει t-κατανομή με τον αριθμό των βαθμών ελευθερίας n=n-p-1.

2.6. Με βάση τα δεδομένα (Πίνακας 2.3) για την εξάρτηση της συρρίκνωσης του κτηνοτροφικού ψωμιού ( y) κατά τη διάρκεια αποθήκευσης ( x) βρείτε μια σημειακή εκτίμηση της υπό όρους προσδοκίας με την υπόθεση ότι η γενική εξίσωση παλινδρόμησης είναι γραμμική.

Πίνακας 2.3.

Απαιτείται: α) να βρείτε εκτιμήσεις της υπολειπόμενης διακύμανσης s 2 με την υπόθεση ότι η γενική εξίσωση παλινδρόμησης έχει τη μορφή ; β) ελέγξτε στο a=0,05 τη σημασία της εξίσωσης παλινδρόμησης, δηλ. υπόθεση Η 0: q=0; γ) με αξιοπιστία g=0,9, προσδιορίστε τις εκτιμήσεις διαστήματος των παραμέτρων q 0, q 1; δ) με αξιοπιστία g=0,95, προσδιορίστε την εκτίμηση διαστήματος της υπό όρους μαθηματικής προσδοκίας στο Χ 0 =6; ε) να προσδιορίσετε στο g=0,95 το διάστημα εμπιστοσύνης της πρόβλεψης στο σημείο Χ=12.

2.7. Με βάση τα στοιχεία για τη δυναμική του ρυθμού αύξησης των τιμών των μετοχών για 5 μήνες, που δίνονται στον πίνακα. 2.4.

Πίνακας 2.4.

μήνες ( x)
y (%)

και με την παραδοχή ότι η γενική εξίσωση παλινδρόμησης έχει τη μορφή , απαιτείται: α) να καθοριστούν εκτιμήσεις τόσο των παραμέτρων της εξίσωσης παλινδρόμησης όσο και της υπολειπόμενης διακύμανσης s 2 . β) ελέγξτε στο a=0,01 τη σημασία του συντελεστή παλινδρόμησης, δηλ. υποθέσεις H 0: q 1 =0;

γ) με αξιοπιστία g=0,95, βρείτε εκτιμήσεις διαστήματος των παραμέτρων q 0 και q 1. δ) με αξιοπιστία g=0,9, ορίστε μια εκτίμηση διαστήματος της υπό όρους μαθηματικής προσδοκίας στο x 0 =4; ε) να προσδιορίσετε στο g=0,9 το διάστημα εμπιστοσύνης της πρόβλεψης στο σημείο x=5.

2.8. Τα αποτελέσματα της μελέτης της δυναμικής αύξησης βάρους νεαρών ζώων δίνονται στον Πίνακα 2.5.

Πίνακας 2.5.

Υποθέτοντας ότι η γενική εξίσωση παλινδρόμησης είναι γραμμική, απαιτείται: α) να προσδιοριστούν εκτιμήσεις τόσο των παραμέτρων της εξίσωσης παλινδρόμησης όσο και της υπολειπόμενης διακύμανσης s 2 . β) ελέγξτε στο a=0,05 τη σημασία της εξίσωσης παλινδρόμησης, δηλ. υποθέσεις H 0: q=0;

γ) με αξιοπιστία g=0,8, βρείτε εκτιμήσεις διαστήματος των παραμέτρων q 0 και q 1. δ) με αξιοπιστία g=0,98, προσδιορίστε και συγκρίνετε εκτιμήσεις διαστήματος της υπό όρους μαθηματικής προσδοκίας στο x 0 =3 και x 1 =6;

ε) να προσδιορίσετε στο g=0,98 το διάστημα εμπιστοσύνης της πρόβλεψης στο σημείο x=8.

2.9. Κόστος ( y) ένα αντίτυπο του βιβλίου ανάλογα με την κυκλοφορία ( x) (χιλιάδες αντίτυπα) χαρακτηρίζεται από δεδομένα που συλλέγονται από τον εκδοτικό οίκο (Πίνακας 2.6). Προσδιορίστε τις εκτιμήσεις ελαχίστων τετραγώνων και τις παραμέτρους μιας υπερβολικής εξίσωσης παλινδρόμησης, με αξιοπιστία g=0,9, κατασκευάστε διαστήματα εμπιστοσύνης για τις παραμέτρους q 0 και q 1, καθώς και την υπό όρους προσδοκία στο x=10.

Πίνακας 2.6.

Προσδιορίστε τις εκτιμήσεις και τις παραμέτρους της εξίσωσης παλινδρόμησης της φόρμας, δοκιμάστε την υπόθεση H 0 στο a = 0,05: q 1 = 0 και κατασκευάστε διαστήματα εμπιστοσύνης με αξιοπιστία g = 0,9 για τις παραμέτρους q 0 και q 1 και την υπό όρους μαθηματική προσδοκία στο x=20.

2.11. Στον πίνακα 2.8 παρουσίασε στοιχεία για τους ρυθμούς ανάπτυξης (%) των παρακάτω μακροοικονομικών δεικτών n=10 ανεπτυγμένες χώρες του κόσμου για το 1992: ΑΕΠ - x(1) , βιομηχανική παραγωγή - x(2) , δείκτης τιμών - x (3) .

Πίνακας 2.8.

χωρών x και παραμέτρους της εξίσωσης παλινδρόμησης, εκτίμηση της υπολειπόμενης διακύμανσης. β) ελέγξτε στο a=0,05 τη σημασία του συντελεστή παλινδρόμησης, δηλ. Η 0: q 1 =0; γ) με αξιοπιστία g=0,9, βρείτε εκτιμήσεις διαστήματος q 0 και q 1; δ) βρείτε στο g=0,95 το διάστημα εμπιστοσύνης για στο σημείο Χ 0 =x i, Πού εγώ=5; ε) συγκρίνετε τα στατιστικά χαρακτηριστικά των εξισώσεων παλινδρόμησης: 1, 2 και 3.

2.12. Λύστε το πρόβλημα 2.11 παίρνοντας ( στο) δείκτης x(1) , και για την επεξηγηματική ( Χ) μεταβλητή x (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Εφαρμοσμένη στατιστική και βασικά στοιχεία της οικονομετρίας: Σχολικό βιβλίο. M., UNITY, 1998 (2η έκδοση 2001);

2. Ayvazyan S.A., Mkhitaryan V.S. Εφαρμοσμένη στατιστική σε προβλήματα και ασκήσεις: Σχολικό βιβλίο. M. UNITY - DANA, 2001;

3. Ayvazyan S.A., Enyukov I.S., Meshalkin L.D. Εφαρμοσμένα στατιστικά στοιχεία. Έρευνα εξάρτησης. M., Finance and Statistics, 1985, 487 pp.;

4. Ayvazyan S.A., Bukhstaber V.M., Enyukov I.S., Meshalkin L.D. Εφαρμοσμένα στατιστικά στοιχεία. Ταξινόμηση και μείωση διαστάσεων. M., Finance and Statistics, 1989, 607 pp.;

5. Johnston J. Econometric method, M.: Statistics, 1980, 446 pp.;

6. Dubrov A.V., Mkhitaryan V.S., Troshin L.I. Πολυμεταβλητές στατιστικές μέθοδοι. M., Finance and Statistics, 2000;

7. Mkhitaryan V.S., Troshin L.I. Μελέτη εξαρτήσεων με χρήση μεθόδων συσχέτισης και παλινδρόμησης. Μ., MESI, 1995, 120 σελ.;

8. Mkhitaryan V.S., Dubrov A.M., Troshin L.I. Πολυμεταβλητές στατιστικές μέθοδοι στα οικονομικά. Μ., MESI, 1995, 149 σελ.;

9. Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Μαθηματικές στατιστικές για επιχειρηματίες και μάνατζερ. Μ., MESI, 2000, 140 σελ.;

10. Lukashin Yu.I. Παλινδρόμηση και προσαρμοστικές μέθοδοι πρόβλεψης: Textbook, M., MESI, 1997.

11. Lukashin Yu.I. Προσαρμοστικές μέθοδοι βραχυπρόθεσμης πρόβλεψης. - Μ., Στατιστική, 1979.


ΕΦΑΡΜΟΓΕΣ


Παράρτημα 1. Επιλογές για εργασίες για ανεξάρτητη έρευνα υπολογιστή.



ΚΑΤΗΓΟΡΙΕΣ

Δημοφιλή ΑΡΘΡΑ

2024 "kingad.ru" - υπερηχογραφική εξέταση ανθρώπινων οργάνων