Δίνεται ένας πίνακας ζευγαρωμένων συντελεστών συσχέτισης. Κατασκευή πίνακα συντελεστών συσχέτισης ζεύγους

Ζ 1 (t)

Ζ 2 (t)

t

y(t)

Ζ 1 (t)

Ζ 2 (t)

t

y(t)

Το κύριο καθήκον κατά την επιλογή των παραγόντων που περιλαμβάνονται στο μοντέλο συσχέτισης είναι να συμπεριληφθούν στην ανάλυση όλοι οι κύριοι παράγοντες που επηρεάζουν το επίπεδο του υπό μελέτη φαινομένου. Ωστόσο, δεν είναι σκόπιμο να εισαχθεί ένας μεγάλος αριθμός παραγόντων στο μοντέλο· είναι πιο σωστό να επιλέξετε μόνο έναν σχετικά μικρό αριθμό από τους κύριους παράγοντες που πιθανώς συσχετίζονται με τον επιλεγμένο λειτουργικό δείκτη.

Αυτό μπορεί να γίνει χρησιμοποιώντας τη λεγόμενη επιλογή δύο σταδίων. Σύμφωνα με αυτό, όλοι οι προεπιλεγμένοι παράγοντες περιλαμβάνονται στο μοντέλο. Στη συνέχεια, ανάμεσά τους, βάσει ειδικής ποσοτικής εκτίμησης και πρόσθετης ποιοτικής ανάλυσης, εντοπίζονται ασήμαντοι παράγοντες που επηρεάζουν σταδιακά μέχρι να απομείνουν αυτοί για τους οποίους μπορεί να υποστηριχθεί ότι το διαθέσιμο στατιστικό υλικό είναι σύμφωνο με την υπόθεση τους. κοινή σημαντική επίδραση στην εξαρτημένη μεταβλητή με την επιλεγμένη μορφή σύνδεσης.

Η επιλογή δύο σταδίων έλαβε την πληρέστερη έκφρασή της στη μέθοδο της λεγόμενης ανάλυσης παλινδρόμησης πολλαπλών σταδίων, στην οποία ο έλεγχος των ασήμαντων παραγόντων γίνεται με βάση τους δείκτες σημασίας τους, ιδίως με βάση την τιμή του t f - η υπολογισμένη τιμή του κριτηρίου του Μαθητή.

Υπολογίστε το t f σύμφωνα με τους συντελεστές συσχέτισης που βρέθηκαν ζεύγους και συγκρίνετε τους με t κρίσιμο για 5% επίπεδο σημαντικότητας (δύο όψεων) και 18 βαθμούς ελευθερίας (ν = n-2).

όπου r είναι η τιμή του συντελεστή συσχέτισης ζεύγους.

n – αριθμός παρατηρήσεων (n=20)

Όταν συγκρίνετε t f για κάθε συντελεστή με t kr = 2,101 παίρνουμε ότι οι συντελεστές που βρέθηκαν αναγνωρίζονται ως σημαντικοί, αφού t f > t cr.

t f για r yx 1 = 2, 5599 ;

t f για r yx 2 = 7,064206 ;

t f για r yx 3 = 2,40218 ;

t f για r x1 x 2 = 4,338906 ;

t f για r x1 x 3 = 15,35065;

t f για r x2 x 3 = 4,749981

Κατά την επιλογή των παραγόντων που περιλαμβάνονται στην ανάλυση, υπόκεινται σε συγκεκριμένες απαιτήσεις. Πρώτα απ 'όλα, οι δείκτες που εκφράζουν αυτούς τους παράγοντες πρέπει να είναι ποσοτικοποιήσιμοι.

Οι παράγοντες που περιλαμβάνονται στο μοντέλο δεν πρέπει να βρίσκονται σε λειτουργική ή στενή σχέση μεταξύ τους. Η παρουσία τέτοιων δεσμών χαρακτηρίζεται από πολυσυγγραμμικότητα.

Η πολυσυγγραμμικότητα δείχνει ότι ορισμένοι παράγοντες χαρακτηρίζουν την ίδια πλευρά του υπό μελέτη φαινομένου. Επομένως, η ταυτόχρονη συμπερίληψή τους στο μοντέλο δεν είναι πρακτική, καθώς αντιγράφουν το ένα το άλλο σε κάποιο βαθμό. Εάν δεν υπάρχουν ειδικές υποθέσεις που να μιλούν υπέρ ενός από αυτούς τους παράγοντες, θα πρέπει να προτιμάται ένας από αυτούς, ο οποίος χαρακτηρίζεται από μεγάλο συντελεστή ζεύγους (ή μερικής) συσχέτισης.

Πιστεύεται ότι η οριακή τιμή είναι η τιμή του συντελεστή συσχέτισης μεταξύ των δύο παραγόντων, ίση με 0,8.

Η πολυσυγγραμμικότητα συνήθως οδηγεί στον εκφυλισμό του πίνακα των μεταβλητών και, κατά συνέπεια, στο γεγονός ότι η κύρια ορίζουσα μειώνει την τιμή της και, στο όριο, πλησιάζει το μηδέν. Οι εκτιμήσεις των συντελεστών της εξίσωσης παλινδρόμησης εξαρτώνται σε μεγάλο βαθμό από την ακρίβεια εύρεσης των αρχικών δεδομένων και αλλάζουν δραματικά τις τιμές τους όταν αλλάζει ο αριθμός των παρατηρήσεων.

Πίνακας συντελεστών συσχέτισης κατά ζεύγη

Υ Χ1 X2 X3 Χ4 Χ5
Υ
Χ1 0,732705
X2 0,785156 0,706287
X3 0,179211 -0,29849 0,208514
Χ4 0,667343 0,924333 0,70069 0,299583
Χ5 0,709204 0,940488 0,691809 0,326602 0,992945

Οι κόμβοι του πίνακα περιέχουν ζευγαρωμένους συντελεστές συσχέτισης που χαρακτηρίζουν την εγγύτητα της σχέσης μεταξύ των χαρακτηριστικών παραγόντων. Αναλύοντας αυτούς τους συντελεστές, σημειώνουμε ότι όσο μεγαλύτερη είναι η απόλυτη τιμή τους, τόσο μεγαλύτερη είναι η επίδραση του αντίστοιχου πρόσημου του παράγοντα στο προκύπτον. Η ανάλυση του προκύπτοντος πίνακα πραγματοποιείται σε δύο στάδια:

1. Εάν η πρώτη στήλη του πίνακα περιέχει συντελεστές συσχέτισης για τους οποίους /r /< 0,5, то соответствующие признаки из модели исключаются. В данном случае в первом столбце матрицы коэффициентов корреляции исключается фактор или коэффициент роста уровня инфляции. Данный фактор оказывает меньшее влияние на результативный признак, нежели оставшиеся четыре признака.

2. Αναλύοντας τους συντελεστές συσχέτισης ζεύγους των χαρακτηριστικών παραγόντων μεταξύ τους, (r XiXj), χαρακτηρίζοντας τη στενότητα της σχέσης τους, είναι απαραίτητο να αξιολογηθεί η ανεξαρτησία τους μεταξύ τους, καθώς αυτό είναι απαραίτητη προϋπόθεση για περαιτέρω ανάλυση παλινδρόμησης. Δεδομένου ότι δεν υπάρχουν απολύτως ανεξάρτητα σημάδια στην οικονομία, είναι απαραίτητο να ξεχωρίσουμε, αν είναι δυνατόν, τα πιο ανεξάρτητα. Τα ζώδια παραγόντων που βρίσκονται σε στενή συσχέτιση μεταξύ τους ονομάζονται πολυσυγγραμμικά. Η συμπερίληψη πολυσυγγραμμικών χαρακτηριστικών στο μοντέλο καθιστά αδύνατη την οικονομική ερμηνεία του μοντέλου παλινδρόμησης, καθώς μια αλλαγή σε έναν παράγοντα συνεπάγεται αλλαγή των παραγόντων που σχετίζονται με αυτό, γεγονός που μπορεί να οδηγήσει σε «κατάρρευση» του μοντέλου στο σύνολό του.

Το κριτήριο για την πολυσυλλογικότητα των παραγόντων είναι το εξής:

/r XiXj / > 0,8

Στον προκύπτοντα πίνακα των ζευγαρωμένων συντελεστών συσχέτισης, αυτό το κριτήριο ικανοποιείται από δύο δείκτες που βρίσκονται στη διασταύρωση των σειρών και . Από κάθε ζεύγος αυτών των χαρακτηριστικών, ένα πρέπει να μείνει στο μοντέλο, θα πρέπει να έχει μεγαλύτερο αντίκτυπο στο χαρακτηριστικό που προκύπτει. Ως αποτέλεσμα, οι παράγοντες και εξαιρούνται από το μοντέλο? ο ρυθμός αύξησης του κόστους πωλήσεων και ο ρυθμός αύξησης του όγκου της υλοποίησής του.

Έτσι, εισάγουμε τους παράγοντες X1 και X2 στο μοντέλο παλινδρόμησης.

Στη συνέχεια, πραγματοποιείται ανάλυση παλινδρόμησης (υπηρεσία, ανάλυση δεδομένων, παλινδρόμηση). Και πάλι συντάσσει έναν πίνακα αρχικών δεδομένων με τους παράγοντες X1 και X2. Η παλινδρόμηση στο σύνολό της χρησιμοποιείται για την ανάλυση της επίδρασης σε μια ξεχωριστή εξαρτημένη μεταβλητή των τιμών των ανεξάρτητων μεταβλητών (παράγοντες) και επιτρέπει τη συσχέτιση μεταξύ των χαρακτηριστικών να παρουσιάζεται με τη μορφή κάποιας λειτουργικής εξάρτησης που ονομάζεται εξίσωση παλινδρόμησης ή συσχέτιση- μοντέλο παλινδρόμησης.

Ως αποτέλεσμα της ανάλυσης παλινδρόμησης, λαμβάνουμε τα αποτελέσματα του υπολογισμού της πολυμεταβλητής παλινδρόμησης. Ας αναλύσουμε τα ληφθέντα αποτελέσματα.

Όλοι οι συντελεστές παλινδρόμησης είναι σημαντικοί σύμφωνα με το Student's t-test. Ο πολλαπλός συντελεστής συσχέτισης R ήταν 0,925, το τετράγωνο αυτής της τιμής (συντελεστής προσδιορισμού) σημαίνει ότι η διακύμανση του χαρακτηριστικού που προκύπτει είναι κατά μέσο όρο 85,5% λόγω της διακύμανσης των χαρακτηριστικών παραγόντων που περιλαμβάνονται στο μοντέλο. Ο συντελεστής ντετερμινισμού χαρακτηρίζει τη στενότητα της σχέσης μεταξύ του συνόλου των χαρακτηριστικών παραγόντων και του δείκτη απόδοσης. Όσο πιο κοντά είναι η τιμή του R στο 1, τόσο ισχυρότερη είναι η σχέση. Στην περίπτωσή μας, ένας δείκτης ίσος με 0,855 υποδηλώνει τη σωστή επιλογή παραγόντων και την ύπαρξη σχέσης μεταξύ των παραγόντων και του δείκτη απόδοσης.

Το υπό εξέταση μοντέλο είναι επαρκές, καθώς η υπολογισμένη τιμή του κριτηρίου F του Fisher υπερβαίνει σημαντικά την τιμή του πίνακα (F obl = 52,401, F tabl = 1,53).

Ως γενικό αποτέλεσμα της διεξαγόμενης ανάλυσης συσχέτισης-παλίνδρομης, υπάρχει μια εξίσωση πολλαπλής παλινδρόμησης, η οποία έχει τη μορφή:

Η εξίσωση παλινδρόμησης που προκύπτει ανταποκρίνεται στο σκοπό της ανάλυσης συσχέτισης και παλινδρόμησης και είναι ένα γραμμικό μοντέλο της εξάρτησης του κέρδους του ισολογισμού της εταιρείας από δύο παράγοντες: τον ρυθμό αύξησης της παραγωγικότητας της εργασίας και τον συντελεστή βιομηχανικής ιδιοκτησίας.

Με βάση το μοντέλο που προέκυψε, μπορούμε να συμπεράνουμε ότι με αύξηση του επιπέδου της παραγωγικότητας της εργασίας κατά 1% σε σύγκριση με την προηγούμενη περίοδο, το κέρδος του ισολογισμού θα αυξηθεί κατά 0,95 ποσοστιαίες μονάδες. αύξηση του συντελεστή βιομηχανικής ιδιοκτησίας κατά 1% θα οδηγήσει σε αύξηση του πραγματικού δείκτη κατά 27,9 ποσοστιαίες μονάδες. Κατά συνέπεια, η κυρίαρχη επιρροή στην αύξηση των κερδών του ισολογισμού είναι η αύξηση της αξίας της βιομηχανικής ιδιοκτησίας (ανακαίνιση και αύξηση των παγίων της επιχείρησης).

Σύμφωνα με το μοντέλο πολλαπλής παλινδρόμησης, εκτελείται μια πολυπαραγοντική πρόβλεψη του αποτελεσματικού χαρακτηριστικού. Ας είναι γνωστό ότι Χ1 = 3,0 και Χ3 = 0,7. Ας αντικαταστήσουμε τις τιμές των σημάτων παραγόντων στο μοντέλο, παίρνουμε Cm = 0,95 * 3,0 + 27,9 * 0,7 - 19,4 = 2,98. Έτσι, με την αύξηση της παραγωγικότητας της εργασίας και τον εκσυγχρονισμό των παγίων στοιχείων της επιχείρησης, τα κέρδη του ισολογισμού το 1ο τρίμηνο του 2005 σε σχέση με την προηγούμενη περίοδο (4ο τρίμηνο 2004) θα αυξηθούν κατά 2,98%.

Τα οικονομικά δεδομένα είναι ποσοτικά χαρακτηριστικά οποιωνδήποτε οικονομικών αντικειμένων ή διαδικασιών. Σχηματίζονται υπό την επίδραση πολλών παραγόντων, οι οποίοι δεν είναι όλοι διαθέσιμοι σε εξωτερικό έλεγχο. Οι μη ελεγχόμενοι παράγοντες μπορούν να λάβουν τυχαίες τιμές από ένα σύνολο τιμών και έτσι να προκαλέσουν την τυχαιότητα των δεδομένων που καθορίζουν. Ένα από τα κύρια καθήκοντα στην οικονομική έρευνα είναι ανάλυση των εξαρτήσεων μεταξύ των μεταβλητών.

Λαμβάνοντας υπόψη τις εξαρτήσεις μεταξύ των χαρακτηριστικών, είναι απαραίτητο να διακρίνουμε πρώτα από όλα δύο τύπους σχέσεων:

  • λειτουργικό -χαρακτηρίζονται από πλήρη αντιστοιχία μεταξύ της αλλαγής στο χαρακτηριστικό παράγοντα και της αλλαγής στην τιμή που προκύπτει: κάθε τιμή του παράγοντα-χαρακτηριστικού αντιστοιχεί σε καλά καθορισμένες τιμές του ενεργού χαρακτηριστικού.Αυτός ο τύπος σχέσης εκφράζεται ως σχέση τύπου. Μια λειτουργική εξάρτηση μπορεί να συνδέσει ένα προκύπτον χαρακτηριστικό με ένα ή περισσότερα χαρακτηριστικά παραγόντων. Έτσι, το ύψος των ημερομισθίων για χρονομισθίους εξαρτάται από τον αριθμό των ωρών εργασίας.
  • συσχέτιση- δεν υπάρχει πλήρης αντιστοιχία μεταξύ της αλλαγής δύο ζωδίων, η επίδραση μεμονωμένων παραγόντων εκδηλώνεται μόνο κατά μέσο όρο, με τη μαζική παρατήρηση των πραγματικών δεδομένων. Η ταυτόχρονη επίδραση στο μελετημένο χαρακτηριστικό ενός μεγάλου αριθμού διαφόρων παραγόντων οδηγεί στο γεγονός ότι η ίδια τιμή του παράγοντα-χαρακτηριστικού αντιστοιχεί σε ολόκληρη την κατανομή των τιμών του προκύπτοντος χαρακτηριστικού,αφού σε κάθε συγκεκριμένη περίπτωση, άλλα ζώδια παραγόντων μπορούν να αλλάξουν τη δύναμη και την κατεύθυνση της πρόσκρουσής τους.

Θα πρέπει να ληφθεί υπόψη ότι εάν υπάρχει λειτουργική σχέση μεταξύ των ζωδίων, είναι δυνατόν, γνωρίζοντας την τιμή του πρόσημου παράγοντα, να προσδιοριστεί με ακρίβεια την αξία του αποτελέσματος.Παρουσία εξάρτησης συσχέτισης, μόνο τάση αλλαγής του αποτελεσματικού χαρακτηριστικούκατά την αλλαγή της τιμής του πρόσημου παράγοντα.

Μελετώντας τη σχέση μεταξύ των ζωδίων, ταξινομούνται ανάλογα με την κατεύθυνση, τη μορφή, τον αριθμό παραγόντων:

  • προςοι συνδέσεις χωρίζονται σε ευθείακαι ΑΝΤΙΣΤΡΟΦΗ.Με μια άμεση σύνδεση, η κατεύθυνση της αλλαγής στο ενεργό χαρακτηριστικό συμπίπτει με την κατεύθυνση της αλλαγής στον παράγοντα πρόσημο. Με την ανάδραση, η κατεύθυνση της αλλαγής στο αποτελεσματικό χαρακτηριστικό είναι αντίθετη από την κατεύθυνση της αλλαγής στον παράγοντα-χαρακτηριστικό. Για παράδειγμα, όσο υψηλότερα είναι τα προσόντα ενός εργαζομένου, τόσο υψηλότερο είναι το επίπεδο παραγωγικότητας της εργασίας του (άμεση σχέση). Όσο υψηλότερη είναι η παραγωγικότητα της εργασίας, τόσο χαμηλότερο είναι το μοναδιαίο κόστος παραγωγής (ανατροφοδότηση).
  • σε μορφή(τύπος λειτουργίας) οι συνδέσεις χωρίζονται σε γραμμικός(ευθύγραμμο) και μη γραμμικό(καμπυλόγραμμος). Μια γραμμική σχέση εμφανίζεται ως ευθεία γραμμή, μια μη γραμμική σχέση - ως καμπύλη (παραβολή, υπερβολή κ.λπ.). Με μια γραμμική σχέση με την αύξηση της τιμής του χαρακτηριστικού παράγοντα, υπάρχει μια ομοιόμορφη αύξηση (μείωση) στην τιμή του χαρακτηριστικού που προκύπτει.
  • από τον αριθμό των παραγόντων που επηρεάζουν το αποτελεσματικό πρόσημο,οι επικοινωνίες χωρίζονται σε μονοπαράγοντα(ζευγοποιημένο) και πολυπαραγοντική.

Η μελέτη της εξάρτησης της παραλλαγής ενός ζωδίου από τις συνθήκες του περιβάλλοντος είναι το περιεχόμενο της θεωρίας της συσχέτισης.

Κατά τη διεξαγωγή μιας ανάλυσης συσχέτισης, ολόκληρο το σύνολο δεδομένων θεωρείται ως ένα σύνολο μεταβλητών (παράγοντες), καθεμία από τις οποίες περιέχει Ππαρατηρήσεις.

Κατά τη μελέτη της σχέσης μεταξύ δύο παραγόντων, συνήθως συμβολίζονται Χ=(x σελ x 2,...,x p)και Y= (y ( , y 2 ,..., y και).

Συνδιακύμανση -είναι στατιστικό μέτρο αλληλεπίδρασηςδύο μεταβλητές. Για παράδειγμα, μια θετική τιμή για τη συνδιακύμανση των αποδόσεων σε δύο τίτλους δείχνει ότι οι αποδόσεις αυτών των τίτλων τείνουν να κινούνται προς την ίδια κατεύθυνση.

Συνδιακύμανση μεταξύ δύο μεταβλητών Χκαι Υυπολογίζεται ως εξής:

όπου είναι οι πραγματικές τιμές των μεταβλητών

Χκαι ΣΟΛ;

Αν τυχαίες μεταβλητές Hee Yείναι ανεξάρτητες, η θεωρητική συνδιακύμανση είναι μηδέν.

Η συνδιακύμανση εξαρτάται από τις μονάδες στις οποίες μετρώνται οι μεταβλητές Χι Y, είναι μια μη κανονικοποιημένη ποσότητα. Επομένως, για να μετρήσετε επικοινωνιακές δυνάμειςμεταξύ δύο μεταβλητών, χρησιμοποιείται ένα άλλο στατιστικό, που ονομάζεται συντελεστής συσχέτισης.

Για δύο μεταβλητές Χκαι Συντελεστής συσχέτισης ζεύγους Υ

ορίζεται ως εξής:

όπου SSy-εκτιμήσεις διακύμανσης Hee Y.Οι εκτιμήσεις αυτές χαρακτηρίζουν βαθμός διασποράςαξίες x ( , x 2 , ..., x n (y 1 , y 2 , y n)γύρω από τον μέσο όρο σας x (yαντίστοιχα), ή μεταβλητότητα(μεταβλητότητα) αυτών των μεταβλητών σε ένα σύνολο παρατηρήσεων.

Διασπορά(εκτίμηση διακύμανσης) προσδιορίζεται από τον τύπο

Στη γενική περίπτωση, για να ληφθεί μια αμερόληπτη εκτίμηση της διακύμανσης, το άθροισμα των τετραγώνων θα πρέπει να διαιρεθεί με τον αριθμό των βαθμών ελευθερίας της εκτίμησης (και τα λοιπά),όπου Π -το μέγεθος του δείγματος, R -τον αριθμό των συνδέσμων που επιβλήθηκαν στο δείγμα. Δεδομένου ότι το δείγμα έχει ήδη χρησιμοποιηθεί μία φορά για τον προσδιορισμό του μέσου όρου Χ,τότε ο αριθμός των επάλληλων δεσμών σε αυτή την περίπτωση είναι ίσος με ένα (p = 1), και ο αριθμός των βαθμών ελευθερίας της εκτίμησης (δηλαδή, ο αριθμός των ανεξάρτητων στοιχείων δείγματος) είναι ίσος με (Π - 1).

Είναι πιο φυσικό να μετράμε τον βαθμό διασποράς στις τιμές των μεταβλητών στις ίδιες μονάδες στις οποίες μετράται η ίδια η μεταβλητή. Αυτό το πρόβλημα επιλύεται από μια ένδειξη που ονομάζεται τυπική απόκλιση (τυπική απόκλιση) ή τυπικό σφάλμαμεταβλητός Χ(μεταβλητός Υ)και καθορίζεται από την αναλογία

Οι όροι στον αριθμητή του τύπου (3.2.1) εκφράζουν την αλληλεπίδραση δύο μεταβλητών και καθορίζουν το πρόσημο της συσχέτισης (θετική ή αρνητική). Εάν, για παράδειγμα, υπάρχει ισχυρή θετική σχέση μεταξύ των μεταβλητών (αύξηση της μίας μεταβλητής όταν η άλλη αυξάνεται), κάθε όρος θα είναι ένας θετικός αριθμός. Ομοίως, εάν υπάρχει ισχυρή αρνητική σχέση μεταξύ των μεταβλητών, όλοι οι όροι στον αριθμητή θα είναι αρνητικοί αριθμοί, με αποτέλεσμα μια αρνητική τιμή συσχέτισης.

Ο παρονομαστής της έκφρασης για τον συντελεστή συσχέτισης ζεύγους [βλ. ο τύπος (3.2.2)] απλώς κανονικοποιεί τον αριθμητή με τέτοιο τρόπο ώστε ο συντελεστής συσχέτισης να αποδειχθεί ένας εύκολα ερμηνευόμενος αριθμός που δεν έχει διάσταση και παίρνει τιμές από -1 έως +1.

Ο αριθμητής της έκφρασης για τον συντελεστή συσχέτισης, ο οποίος είναι δύσκολο να ερμηνευτεί λόγω ασυνήθιστων μονάδων, είναι XY συνδιακύμανση.Παρά το γεγονός ότι μερικές φορές χρησιμοποιείται ως ανεξάρτητο χαρακτηριστικό (για παράδειγμα, στη θεωρία της χρηματοδότησης για την περιγραφή της κοινής μεταβολής των τιμών των μετοχών σε δύο χρηματιστήρια), είναι πιο βολικό να χρησιμοποιηθεί ο συντελεστής συσχέτισης. Η συσχέτιση και η συνδιακύμανση αντιπροσωπεύουν ουσιαστικά τις ίδιες πληροφορίες, αλλά η συσχέτιση παρουσιάζει αυτές τις πληροφορίες σε μια πιο βολική μορφή.

Για την ποιοτική αξιολόγηση του συντελεστή συσχέτισης χρησιμοποιούνται διάφορες κλίμακες, πιο συχνά η κλίμακα Chaddock. Ανάλογα με την τιμή του συντελεστή συσχέτισης, η σχέση μπορεί να έχει μία από τις ακόλουθες εκτιμήσεις:

  • 0,1-0,3 - αδύναμο;
  • 0,3-0,5 - αισθητό.
  • 0,5-0,7 - μέτρια;
  • 0,7-0,9 - υψηλό;
  • 0,9-1,0 - πολύ υψηλό.

Η αξιολόγηση του βαθμού εγγύτητας της σύνδεσης με τη χρήση του συντελεστή συσχέτισης πραγματοποιείται, κατά κανόνα, με βάση περισσότερο ή λιγότερο περιορισμένες πληροφορίες σχετικά με το υπό μελέτη φαινόμενο. Από αυτή την άποψη, υπάρχει ανάγκη να αξιολογηθεί η σημασία του συντελεστή γραμμικής συσχέτισης, ο οποίος καθιστά δυνατή την επέκταση των συμπερασμάτων με βάση τα αποτελέσματα του δείγματος στον γενικό πληθυσμό.

Η αξιολόγηση της σημασίας του συντελεστή συσχέτισης για μικρά μεγέθη δείγματος πραγματοποιείται με τη χρήση του Student's 7-test. Στην περίπτωση αυτή, η πραγματική (παρατηρηθείσα) τιμή αυτού του κριτηρίου καθορίζεται από τον τύπο

Η τιμή / obs που υπολογίζεται χρησιμοποιώντας αυτόν τον τύπο συγκρίνεται με την κρίσιμη τιμή του κριτηρίου θ, το οποίο λαμβάνεται από τον πίνακα τιμών του Student's /-test (βλ. Παράρτημα 2), λαμβάνοντας υπόψη το δεδομένο επίπεδο σημασίας σ και ο αριθμός των βαθμών ελευθερίας - 2).

Εάν 7 obs > 7 καρτέλα, τότε η λαμβανόμενη τιμή του συντελεστή συσχέτισης αναγνωρίζεται ως σημαντική (δηλαδή, η μηδενική υπόθεση που βεβαιώνει ότι ο συντελεστής συσχέτισης είναι ίσος με μηδέν απορρίπτεται). Και έτσι συμπεραίνεται ότι υπάρχει στενή στατιστική σχέση μεταξύ των μεταβλητών που μελετήθηκαν.

Εάν η τιμή y xκοντά στο μηδέν, η σχέση μεταξύ των μεταβλητών είναι ασθενής. Εάν η συσχέτιση μεταξύ τυχαίων μεταβλητών:

  • είναι θετική, τότε καθώς η μία τυχαία μεταβλητή αυξάνεται, η άλλη τείνει να αυξάνεται κατά μέσο όρο.
  • είναι αρνητικό, τότε καθώς η μία τυχαία μεταβλητή αυξάνεται, η άλλη τείνει να μειώνεται κατά μέσο όρο. Ένα βολικό γραφικό εργαλείο για την ανάλυση ζευγαρωμένων δεδομένων είναι διάγραμμα διασποράς, που αντιπροσωπεύει κάθε παρατήρηση σε ένα χώρο δύο διαστάσεων που αντιστοιχούν σε δύο παράγοντες. Ένα scatterplot, το οποίο απεικονίζει ένα σύνολο τιμών δύο χαρακτηριστικών, ονομάζεται επίσης πεδίο συσχέτισης.Κάθε σημείο αυτού του διαγράμματος έχει x συντεταγμένες (. και y gΚαθώς αυξάνεται η ισχύς της γραμμικής σχέσης, τα σημεία στο γράφημα θα βρίσκονται πιο κοντά σε μια ευθεία γραμμή και το μέγεθος σολθα είναι πιο κοντά στην ενότητα.

Οι συντελεστές συσχέτισης ζεύγους χρησιμοποιούνται για τη μέτρηση της ισχύος των γραμμικών σχέσεων μεταξύ διαφορετικών ζευγών χαρακτηριστικών από το σύνολο τους. Για ένα σύνολο λειτουργιών, αποκτήστε πίνακας συντελεστών συσχέτισης ζεύγους.

Αφήστε ολόκληρο το σύνολο δεδομένων να αποτελείται από μια μεταβλητή Υ==(στο r y 2, ..., y p)και tμεταβλητές (παράγοντες) Χ,καθένα από τα οποία περιέχει Ππαρατηρήσεις. Μεταβλητές τιμές Υκαι Χ,που περιέχονται στον παρατηρούμενο πληθυσμό καταγράφονται στον πίνακα (Πίνακας 3.2.1).

Πίνακας 3.2.1

Μεταβλητός

Αριθμός

παρατηρήσεις

X t3

Χ tp

Με βάση τα δεδομένα που περιέχονται σε αυτόν τον πίνακα, υπολογίστε ο πίνακας των συντελεστών συσχέτισης ζεύγους R,είναι συμμετρικό ως προς την κύρια διαγώνιο:


Η ανάλυση του πίνακα των συντελεστών συσχέτισης ζευγών χρησιμοποιείται στην κατασκευή μοντέλων πολλαπλής παλινδρόμησης.

Ένας πίνακας συσχέτισης δεν μπορεί να περιγράψει πλήρως τις εξαρτήσεις μεταξύ των ποσοτήτων. Από αυτή την άποψη, δύο προβλήματα εξετάζονται στην ανάλυση πολυμεταβλητής συσχέτισης:

  • 1. Προσδιορισμός της στενότητας της σχέσης μιας τυχαίας μεταβλητής με το σύνολο των άλλων μεταβλητών που περιλαμβάνονται στην ανάλυση.
  • 2. Προσδιορισμός της στεγανότητας της σχέσης μεταξύ δύο μεγεθών ενώ καθορίζεται ή αποκλείεται η επίδραση άλλων ποσοτήτων.

Αυτά τα προβλήματα επιλύονται, αντίστοιχα, με τη βοήθεια πολλαπλών και μερικών συντελεστών συσχέτισης.

Η λύση του πρώτου προβλήματος (καθορισμός της εγγύτητας της σύνδεσης μιας τυχαίας μεταβλητής με το σύνολο των άλλων μεταβλητών που περιλαμβάνονται στην ανάλυση) πραγματοποιείται χρησιμοποιώντας δείγμα πολλαπλού συντελεστή συσχέτισηςσύμφωνα με τον τύπο

όπου R- R[εκ. τύπος (3.2.6)]; Rjj-αλγεβρικό συμπλήρωμα στοιχείου του ίδιου πίνακα R.

Το τετράγωνο του πολλαπλού συντελεστή συσχέτισης SCHj2 ι _j J+l mπου ονομάζεται επιλεκτικός πολλαπλός συντελεστής προσδιορισμού; δείχνει ποια αναλογία της διακύμανσης (τυχαία διασπορά) της ποσότητας που μελετάται Xjεξηγεί την παραλλαγή άλλων τυχαίων μεταβλητών Χ ( , Χ 2 ,..., X t.

Οι συντελεστές πολλαπλής συσχέτισης και προσδιορισμού είναι θετικές τιμές, λαμβάνοντας τιμές στην περιοχή από 0 έως 1. Όταν ο συντελεστής πλησιάζει R 2 στην ενότητα, μπορούμε να συμπεράνουμε ότι η σχέση των τυχαίων μεταβλητών είναι στενή, αλλά όχι ως προς την κατεύθυνσή της. Ο πολλαπλός συντελεστής συσχέτισης μπορεί να αυξηθεί μόνο εάν συμπεριληφθούν πρόσθετες μεταβλητές στο μοντέλο και δεν θα αυξηθεί εάν εξαιρεθεί κάποιο από τα διαθέσιμα χαρακτηριστικά.

Ο έλεγχος της σημασίας του συντελεστή προσδιορισμού πραγματοποιείται συγκρίνοντας την υπολογισμένη τιμή του κριτηρίου /'-Fisher

με πίνακα φά rabl. Η τιμή του πίνακα του κριτηρίου (βλ. Παράρτημα 1) καθορίζεται από το δεδομένο επίπεδο σημασίας α και τους βαθμούς ελευθερίας v l \u003d mnv 2 \u003d n-m-l.Συντελεστής R2διαφέρει σημαντικά από το μηδέν εάν η ανισότητα

Αν οι θεωρούμενες τυχαίες μεταβλητές συσχετίζονται μεταξύ τουςτότε η τιμή του συντελεστή συσχέτισης ζεύγους επηρεάζεται εν μέρει από την επίδραση άλλων μεγεθών. Από αυτή την άποψη, υπάρχει ανάγκη να μελετηθεί η μερική συσχέτιση μεταξύ των μεταβλητών, ενώ αποκλείεται η επιρροή άλλων τυχαίων μεταβλητών (μία ή περισσότερες).

Δείγμα συντελεστή μερικής συσχέτισηςκαθορίζεται από τον τύπο

όπου RJk , Rjj, Rkk -αλγεβρικές προσθήκες στα αντίστοιχα στοιχεία του πίνακα R[εκ. τύπος (3.2.6)].

Ο συντελεστής μερικής συσχέτισης, καθώς και ο συντελεστής συσχέτισης κατά ζεύγη, ποικίλλει από -1 έως +1.

Έκφραση (3.2.9) υπό την προϋπόθεση t = 3 θα μοιάζει

Ο συντελεστής r 12(3) ονομάζεται συντελεστής συσχέτισης μεταξύ x (και x 2 για σταθερό x yΕίναι συμμετρικό σε σχέση με τους πρωτεύοντες δείκτες 1, 2. Ο δευτερεύων δείκτης του 3 αναφέρεται σε μια σταθερή μεταβλητή.

Παράδειγμα 3.2.1. Υπολογισμός συντελεστών ζεύγους,

πολλαπλή και μερική συσχέτιση.

Στον πίνακα. 3.2.2 παρέχει πληροφορίες για τους όγκους πωλήσεων και το κόστος διαφήμισης μιας εταιρείας, καθώς και τον δείκτη καταναλωτικών δαπανών για ορισμένα τρέχοντα έτη.

  • 1. Κατασκευάστε ένα scatterplot (πεδίο συσχέτισης) για τις μεταβλητές "όγκος πωλήσεων" και "δείκτης καταναλωτικών δαπανών".
  • 2. Προσδιορίστε τον βαθμό επιρροής του δείκτη καταναλωτικών δαπανών στον όγκο πωλήσεων (υπολογίστε τον συντελεστή συσχέτισης ζεύγους).
  • 3. Εκτιμήστε τη σημασία του υπολογιζόμενου συντελεστή συσχέτισης ζεύγους.
  • 4. Δημιουργήστε έναν πίνακα συντελεστών συσχέτισης ζεύγους για τρεις μεταβλητές.
  • 5. Βρείτε μια εκτίμηση του πολλαπλού συντελεστή συσχέτισης.
  • 6. Βρείτε εκτιμήσεις των συντελεστών μερικής συσχέτισης.

1. Στο παράδειγμά μας, το διάγραμμα διασποράς έχει τη μορφή που φαίνεται στο σχ. 3.2.1. Η επιμήκυνση του νέφους σημείου στο διάγραμμα διασποράς κατά μήκος μιας κεκλιμένης ευθείας μας επιτρέπει να κάνουμε μια υπόθεση ότι υπάρχει κάποια αντικειμενική τάση για μια άμεση γραμμική σχέση μεταξύ των τιμών των μεταβλητών Χ 2 Υ(όγκος πωλήσεων).

Ρύζι. 3.2.1.

2. Ενδιάμεσοι υπολογισμοί κατά τον υπολογισμό του συντελεστή συσχέτισης μεταξύ των μεταβλητών Χ 2(δείκτης καταναλωτικών δαπανών) και Υ(όγκος πωλήσεων) δίνονται στον πίνακα. 3.2.3.

Μέσοι όροιτυχαίες μεταβλητές Χ 2και Υ,ποιοι είναι οι απλούστεροι δείκτες που χαρακτηρίζουν τις ακολουθίες jCj, x 2,..., x 16 και y v y 2,..., y 16 , υπολογίζουμε με τους ακόλουθους τύπους:


Όγκος πωλήσεων Y, χιλιάδες ρούβλια

Δείκτης

καταναλώνω

Telsky

έξοδα

Όγκος πωλήσεων Y, χιλιάδες ρούβλια

Δείκτης

καταναλώνω

Telsky

έξοδα

Πίνακας 3.2.3

λ:, - Χ

(ΚΑΙ - Υ)(x, - x)

(x, - x) 2

(y, - - y) 2

Διασποράχαρακτηρίζει το βαθμό διάδοσης των αξιών x v x 2, x :

Εξετάστε τώρα τη λύση στο Παράδειγμα 3.2.1 στο Excel.

Για να υπολογίσετε τη συσχέτιση χρησιμοποιώντας το Excel, μπορείτε να χρησιμοποιήσετε τη συνάρτηση =correl(), προσδιορίζοντας τις διευθύνσεις δύο στηλών αριθμών, όπως φαίνεται στο σχ. 3.2.2. Η απάντηση τοποθετείται στο D8 και ισούται με 0,816.

Ρύζι. 3.2.2.

(Σημείωση: Ορίσματα συνάρτησης Οι συσχετισμοί πρέπει να είναι αριθμοί ή ονόματα, πίνακες ή αναφορές που περιέχουν αριθμούς. Εάν το όρισμα, το οποίο είναι ένας πίνακας ή ένας σύνδεσμος, περιέχει κείμενο, δυαδικούς υπολογισμούς ή κενά κελιά, τότε αυτές οι τιμές αγνοούνται. Ωστόσο, τα κελιά που περιέχουν μηδενικές τιμές καταμετρώνται.

Αν μια συστοιχία! και ο πίνακας2 έχουν διαφορετικό αριθμό σημείων δεδομένων και στη συνέχεια η συνάρτηση Το correl επιστρέφει την τιμή σφάλματος #n/a.

Εάν ο πίνακας1 ή ο πίνακας2 είναι κενός ή εάν το o (τυπική απόκλιση) των τιμών τους είναι μηδέν, τότε η συνάρτηση Το correl επιστρέφει την τιμή σφάλματος #div/0 !.)

Η κρίσιμη τιμή της στατιστικής /-Student μπορεί επίσης να ληφθεί χρησιμοποιώντας τη συνάρτηση steudrasprobr 1 πακέτο Excel. Ως ορίσματα της συνάρτησης, πρέπει να καθορίσετε τον αριθμό των βαθμών ελευθερίας, ίσο με Π- 2 (στο παράδειγμά μας 16 - 2= 14) και επίπεδο σημασίας a (στο παράδειγμά μας a = 0,1) (Εικ. 3.2.3). Αν ένα πραγματική αξία/-statistics, take modulo, περισσότερα κρίσιμος,τότε με πιθανότητα (1 - α) ο συντελεστής συσχέτισης διαφέρει σημαντικά από το μηδέν.


Ρύζι. 3.2.3. Η κρίσιμη τιμή του /-statistic είναι 1,7613

Το Excel περιλαμβάνει ένα σύνολο εργαλείων ανάλυσης δεδομένων (το λεγόμενο πακέτο ανάλυσης) που έχουν σχεδιαστεί για την επίλυση διαφόρων στατιστικών προβλημάτων. Να υπολογιστεί ο πίνακας των συντελεστών συσχέτισης ζεύγους Rχρησιμοποιήστε το εργαλείο συσχέτισης (Εικ. 3.2.4) και ορίστε τις παραμέτρους ανάλυσης στο αντίστοιχο πλαίσιο διαλόγου. Η απάντηση θα τοποθετηθεί σε νέο φύλλο εργασίας (Εικ. 3.2.5).

1 Στο Excel 2010, το όνομα της συνάρτησης steudrasprobr άλλαξε σε steu-

DENT.ORD.2X.

Ρύζι. 3.2.4.


Ρύζι. 3.2.5.

  • Θεμελιωτές της θεωρίας της συσχέτισης θεωρούνται οι Άγγλοι στατιστικολόγοι F. Galton (1822-1911) και K. Pearson (1857-1936). Ο όρος «συσχέτιση» δανείστηκε από τη φυσική επιστήμη και σημαίνει «συσχέτιση, αντιστοιχία». Η έννοια της συσχέτισης ως αλληλεξάρτησης μεταξύ τυχαίων μεταβλητών βασίζεται στη μαθηματική-στατιστική θεωρία της συσχέτισης.

Για τα εδάφη της Νότιας Ομοσπονδιακής Περιφέρειας της Ρωσικής Ομοσπονδίας, δίνονται στοιχεία για το 2011

Εδάφη της ομοσπονδιακής περιφέρειας

Ακαθάριστο περιφερειακό προϊόν, δισεκατομμύρια ρούβλια, Y

Επενδύσεις σε πάγιο κεφάλαιο, δισεκατομμύρια ρούβλια, X1

1. Rep. Αδύγεα

2. Rep. Νταγκεστάν

3. Rep. Ινγκουσετία

4. Δημοκρατία της Καμπαρντίνο-Μπαλκαρίας

5. Rep. Καλμυκία

6. Δημοκρατία του Καρατσάι-Τσερκ

7. Rep. Βόρεια Οσετία Αλανία

8. Περιοχή Κρασνοντάρ)

9. Επικράτεια Σταυρούπολης

10. Περιοχή Αστραχάν

11. Περιοχή Βόλγκογκραντ

12. Περιοχή Ροστόφ

  • 1. Υπολογίστε τον πίνακα των ζευγαρωμένων συντελεστών συσχέτισης. αξιολογήσει τη στατιστική σημασία των συντελεστών συσχέτισης.
  • 2. Δημιουργήστε το πεδίο συσχέτισης του προκύπτοντος χαρακτηριστικού και του πιο στενά συνδεδεμένου παράγοντα.
  • 3. Υπολογίστε τις παραμέτρους της παλινδρόμησης γραμμικού ζεύγους για κάθε παράγοντα Χ.
  • 4. Αξιολογήστε την ποιότητα κάθε μοντέλου μέσω του συντελεστή προσδιορισμού, του μέσου σφάλματος προσέγγισης και του Fisher's F-test. Επιλέξτε το καλύτερο μοντέλο.

θα είναι το 80% της μέγιστης τιμής του. Παρουσιάστε γραφικά: πραγματικές τιμές και τιμές μοντέλου, σημεία πρόβλεψης.

  • 6. Χρησιμοποιώντας σταδιακή πολλαπλή παλινδρόμηση (μέθοδος αποκλεισμού ή μέθοδος συμπερίληψης), δημιουργήστε ένα μοντέλο διαμόρφωσης της τιμής του διαμερίσματος λόγω σημαντικών παραγόντων. Δώστε μια οικονομική ερμηνεία των συντελεστών του μοντέλου παλινδρόμησης.
  • 7. Αξιολογήστε την ποιότητα του κατασκευασμένου μοντέλου. Έχει βελτιωθεί η ποιότητα του μοντέλου σε σύγκριση με το μοντέλο ενός παράγοντα; Δώστε μια εκτίμηση της επίδρασης σημαντικών παραγόντων στο αποτέλεσμα χρησιμοποιώντας συντελεστές ελαστικότητας, σε - και -; συντελεστές.

Κατά την επίλυση αυτού του προβλήματος, θα πραγματοποιήσουμε υπολογισμούς και θα σχεδιάσουμε γραφήματα και γραφήματα χρησιμοποιώντας τις ρυθμίσεις του Excel Ανάλυση δεδομένων.

1. Υπολογίστε τον πίνακα των ζευγαρωμένων συντελεστών συσχέτισης και αξιολογήστε τη στατιστική σημασία των συντελεστών συσχέτισης

Στο πλαίσιο διαλόγου Συσχέτιση, στο πεδίο Διαστήματα εισόδου, εισαγάγετε την περιοχή των κελιών που περιέχουν τα δεδομένα προέλευσης. Δεδομένου ότι επιλέξαμε επίσης τις επικεφαλίδες στηλών, ελέγχουμε το πλαίσιο ελέγχου Ετικέτες στην πρώτη σειρά.

Πήραμε τα εξής αποτελέσματα:

Πίνακας 1.1 Πίνακας συντελεστών συσχέτισης κατά ζεύγη

Μια ανάλυση του πίνακα των συντελεστών συσχέτισης ζεύγους δείχνει ότι η εξαρτημένη μεταβλητή Υ, δηλαδή το ακαθάριστο περιφερειακό προϊόν, έχει στενότερη σχέση με το X1 (επένδυση σε πάγιο κεφάλαιο). Ο συντελεστής συσχέτισης είναι 0,936. Αυτό σημαίνει ότι η εξαρτημένη μεταβλητή Y (ακαθάριστο περιφερειακό προϊόν) εξαρτάται κατά 93,6% από το X1 (επένδυση σε πάγια στοιχεία ενεργητικού).

Η στατιστική σημασία των συντελεστών συσχέτισης θα προσδιοριστεί χρησιμοποιώντας το Student's t-test. Η τιμή του πίνακα συγκρίνεται με τις υπολογιζόμενες τιμές.

Ας υπολογίσουμε την τιμή του πίνακα χρησιμοποιώντας τη συνάρτηση STUDRIST.

t πίνακας = 0,129 με επίπεδο εμπιστοσύνης ίσο με 0,9 και βαθμό ελευθερίας (n-2).

Ο παράγοντας Χ1 είναι στατιστικά σημαντικός.

2. Ας κατασκευάσουμε το πεδίο συσχέτισης του αποτελεσματικού χαρακτηριστικού (ακαθάριστο περιφερειακό προϊόν) και του πιο στενά συνδεδεμένου παράγοντα (επένδυση σε πάγιο κεφάλαιο)

Για να το κάνουμε αυτό, θα χρησιμοποιήσουμε το εργαλείο για την κατασκευή ενός σχεδίου διασποράς στο Excel.

Ως αποτέλεσμα, λαμβάνουμε το πεδίο συσχέτισης της τιμής του ακαθάριστου περιφερειακού προϊόντος, δισεκατομμύρια ρούβλια. και επενδύσεις σε πάγιο κεφάλαιο, δισεκατομμύρια ρούβλια. (Εικόνα 1.1.).

Εικόνα 1.1

3. Υπολογίστε τις παραμέτρους της παλινδρόμησης γραμμικού ζεύγους για κάθε παράγοντα Χ

Για να υπολογίσουμε τις παραμέτρους μιας γραμμικής παλινδρόμησης κατά ζεύγη, θα χρησιμοποιήσουμε το εργαλείο παλινδρόμησης που περιλαμβάνεται στη ρύθμιση Ανάλυση δεδομένων.

Στο πλαίσιο διαλόγου Regression, στο πεδίο Input interval Y, εισαγάγετε τη διεύθυνση του εύρους των κελιών που αντιπροσωπεύει την εξαρτημένη μεταβλητή. Στο χωράφι

Το διάστημα εισαγωγής X εισάγουμε τη διεύθυνση του εύρους που περιέχει τις τιμές των ανεξάρτητων μεταβλητών. Ας υπολογίσουμε τις παραμέτρους παλινδρόμησης κατά ζεύγη για τον παράγοντα Χ.

Για το X1, ελήφθησαν τα ακόλουθα δεδομένα, που παρουσιάζονται στον Πίνακα 1.2:

Πίνακας 1.2

Η εξίσωση παλινδρόμησης για την εξάρτηση της τιμής του ακαθάριστου περιφερειακού προϊόντος από τις επενδύσεις σε πάγιο κεφάλαιο έχει τη μορφή:

4. Ας αξιολογήσουμε την ποιότητα κάθε μοντέλου μέσω του συντελεστή προσδιορισμού, του μέσου σφάλματος προσέγγισης και του κριτηρίου F του Fisher. Ας μάθουμε ποιο μοντέλο είναι το καλύτερο.

Ο συντελεστής προσδιορισμού, το μέσο σφάλμα προσέγγισης, που λάβαμε ως αποτέλεσμα των υπολογισμών που πραγματοποιήθηκαν στην παράγραφο 3. Τα δεδομένα που ελήφθησαν παρουσιάζονται στους ακόλουθους πίνακες:

Δεδομένα για το X1:

Πίνακας 1.3α

Πίνακας 1.4β

Α) Ο συντελεστής προσδιορισμού καθορίζει ποια αναλογία της παραλλαγής του χαρακτηριστικού Υ λαμβάνεται υπόψη στο μοντέλο και οφείλεται στην επίδραση του παράγοντα Χ σε αυτό. Όσο μεγαλύτερη είναι η τιμή του συντελεστή προσδιορισμού, τόσο πιο στενή είναι η σχέση μεταξύ των χαρακτηριστικών στο κατασκευασμένο μαθηματικό μοντέλο.

Στο Excel, το τετράγωνο R συμβολίζεται.

Με βάση αυτό το κριτήριο, το μοντέλο της εξίσωσης παλινδρόμησης για την εξάρτηση της τιμής του ακαθάριστου περιφερειακού προϊόντος από τις επενδύσεις σε πάγια στοιχεία ενεργητικού (Χ1) είναι το πλέον κατάλληλο.

Β) Υπολογίστε το μέσο σφάλμα προσέγγισης χρησιμοποιώντας τον τύπο:

όπου ο αριθμητής είναι το άθροισμα των τετραγωνικών αποκλίσεων των υπολογισμένων τιμών από τις πραγματικές. Στους πίνακες, βρίσκεται στη στήλη SS, σειρά Residuals.

Υπολογίζουμε τη μέση τιμή της τιμής ενός διαμερίσματος στο Excel χρησιμοποιώντας τη συνάρτηση AVERAGE. = 24,18182 δισεκατομμύρια ρούβλια

Κατά τη διεξαγωγή οικονομικών υπολογισμών, το μοντέλο θεωρείται επαρκώς ακριβές εάν το μέσο σφάλμα προσέγγισης είναι μικρότερο από 5%, το μοντέλο θεωρείται αποδεκτό εάν το μέσο σφάλμα προσέγγισης είναι μικρότερο από 15%.

Σύμφωνα με αυτό το κριτήριο, το πιο κατάλληλο είναι το μαθηματικό μοντέλο για την εξίσωση παλινδρόμησης της εξάρτησης της τιμής του ακαθάριστου περιφερειακού προϊόντος από τις επενδύσεις σε πάγια στοιχεία ενεργητικού (Χ1).

Γ) Ένα F-test χρησιμοποιείται για να ελεγχθεί η σημασία του μοντέλου παλινδρόμησης. Για αυτό, γίνεται επίσης σύγκριση των κρίσιμων (πίνακα) τιμών του Fisher's F-test.

Οι υπολογισμένες τιμές δίνονται στους πίνακες 1.4b (που υποδεικνύονται με το γράμμα F).

Η τιμή του πίνακα του Fisher's F-test υπολογίζεται στο Excel χρησιμοποιώντας τη συνάρτηση FDISP. Παίρνουμε την πιθανότητα ίση με 0,05. Έλαβε: = 4,75

Οι υπολογισμένες τιμές του Fisher's F-test για κάθε παράγοντα είναι συγκρίσιμες με την τιμή του πίνακα:

71,02 > = 4,75 το μοντέλο είναι επαρκές σύμφωνα με αυτό το κριτήριο.

Αφού αναλύσουμε τα δεδομένα και για τα τρία κριτήρια, μπορούμε να συμπεράνουμε ότι το καλύτερο είναι το μαθηματικό μοντέλο που έχει κατασκευαστεί για τον παράγοντα ακαθάριστου περιφερειακού προϊόντος, ο οποίος περιγράφεται από τη γραμμική εξίσωση

5. Για το επιλεγμένο μοντέλο της εξάρτησης της τιμής του ακαθάριστου περιφερειακού προϊόντος

θα προβλέψουμε τη μέση τιμή του δείκτη στο επίπεδο σημαντικότητας εάν η προβλεπόμενη τιμή του παράγοντα είναι το 80% της μέγιστης τιμής του. Ας αναπαραστήσουμε γραφικά: πραγματικές τιμές και τιμές μοντέλου, σημεία πρόβλεψης.

Υπολογίστε την προβλεπόμενη τιμή του X, σύμφωνα με τη συνθήκη, θα είναι το 80% της μέγιστης τιμής.

Υπολογίστε το X max στο Excel χρησιμοποιώντας τη συνάρτηση MAX.

0,8 *52,8 = 42,24

Για να λάβουμε προγνωστικές εκτιμήσεις της εξαρτημένης μεταβλητής, αντικαθιστούμε τη λαμβανόμενη τιμή της ανεξάρτητης μεταβλητής στη γραμμική εξίσωση:

5,07 + 2,14 * 42,24 \u003d 304,55 δισεκατομμύρια ρούβλια.

Ας προσδιορίσουμε το διάστημα εμπιστοσύνης της πρόβλεψης, το οποίο θα έχει τα ακόλουθα όρια:

Για να υπολογίσουμε το διάστημα εμπιστοσύνης για την προβλεπόμενη τιμή, υπολογίζουμε την απόκλιση από τη γραμμή παλινδρόμησης.

Για ένα μοντέλο ζευγαρωμένης παλινδρόμησης, η τιμή απόκλισης υπολογίζεται:

εκείνοι. την τυπική τιμή σφάλματος από τον Πίνακα 1.5α.

(Δεδομένου ότι ο αριθμός των βαθμών ελευθερίας είναι ίσος με έναν, ο παρονομαστής θα είναι ίσος με n-2). πρόβλεψη παλινδρόμησης κατά ζεύγη συσχέτισης

Για να υπολογίσουμε τον συντελεστή, θα χρησιμοποιήσουμε τη συνάρτηση Excel STUDRASP, η πιθανότητα θα ληφθεί ίση με 0,1, ο αριθμός των βαθμών ελευθερίας είναι 38.

Υπολογίζουμε την τιμή χρησιμοποιώντας το Excel, παίρνουμε 12294.


Ας ορίσουμε τα άνω και κάτω όρια του διαστήματος.

  • 304,55+27,472= 332,022
  • 304,55-27,472= 277,078

Έτσι, η προβλεπόμενη τιμή = 304,55 χιλιάδες δολάρια θα είναι μεταξύ του κατώτερου ορίου, ίση με 277,078 χιλιάδες δολάρια. και ανώτατο όριο ίσο με 332,022 δισεκατομμύρια ρούβλια. Τρίψιμο.

Οι πραγματικές τιμές και οι τιμές του μοντέλου, τα σημεία πρόβλεψης παρουσιάζονται γραφικά στο Σχήμα 1.2.


Εικόνα 1.2

6. Χρησιμοποιώντας σταδιακή πολλαπλή παλινδρόμηση (μέθοδος αποκλεισμού), θα δημιουργήσουμε ένα μοντέλο για τη διαμόρφωση της τιμής του ακαθάριστου περιφερειακού προϊόντος λόγω σημαντικών παραγόντων

Για να δημιουργήσουμε μια πολλαπλή παλινδρόμηση, θα χρησιμοποιήσουμε τη συνάρτηση Excel Regression, συμπεριλαμβανομένων όλων των παραγόντων σε αυτήν. Ως αποτέλεσμα, λαμβάνουμε πίνακες αποτελεσμάτων, από τους οποίους χρειαζόμαστε το Student's t-test.

Πίνακας 1.8α

Πίνακας 1.8β

Πίνακας 1.8γ.

Παίρνουμε το μοντέλο προβολής:

Επειδή η< (4,75 < 71,024), уравнение регрессии следует признать адекватным.

Ας επιλέξουμε τη μικρότερη τιμή modulo του Student's t-test, είναι ίση με 8,427, τη συγκρίνουμε με την τιμή του πίνακα που υπολογίζουμε στο Excel, πάρουμε το επίπεδο σημαντικότητας ίσο με 0,10, τον αριθμό των βαθμών ελευθερίας n-m-1=12- 4=8: =1,8595

Δεδομένου ότι 8,427>1,8595 το μοντέλο θα πρέπει να αναγνωριστεί ως επαρκές.

7. Για να αξιολογήσουμε τον σημαντικό παράγοντα του μαθηματικού μοντέλου που προκύπτει, υπολογίζουμε τους συντελεστές ελαστικότητας και - τους συντελεστές

Ο συντελεστής ελαστικότητας δείχνει πόσο τοις εκατό θα αλλάξει το προκύπτον πρόσημο όταν το πρόσημο του παράγοντα αλλάξει κατά 1%:

E X4 \u003d 2,137 * (10,69 / 24,182) \u003d 0,94%

Δηλαδή, με αύξηση της επένδυσης σε πάγιο κεφάλαιο κατά 1%, το κόστος αυξάνεται κατά μέσο όρο 0,94%.

Ο συντελεστής δείχνει με ποιο μέρος της τιμής της τυπικής απόκλισης αλλάζει η μέση τιμή της εξαρτημένης μεταβλητής με μια αλλαγή στην ανεξάρτητη μεταβλητή κατά μία τυπική απόκλιση.

2,137* (14.736/33,632) = 0,936.

Τα δεδομένα τυπικής απόκλισης λαμβάνονται από πίνακες που λαμβάνονται χρησιμοποιώντας το εργαλείο Περιγραφικής Στατιστικής.

Πίνακας 1.11 Περιγραφικές στατιστικές (Υ)

Πίνακας 1.12 Περιγραφικά στατιστικά στοιχεία (Χ4)

Ο συντελεστής καθορίζει το μερίδιο της επιρροής του παράγοντα στη συνολική επιρροή όλων των παραγόντων:

Για να υπολογίσουμε τους συντελεστές συσχέτισης ζεύγους, υπολογίζουμε τη μήτρα των συντελεστών συσχέτισης ζεύγους στο Excel χρησιμοποιώντας το εργαλείο συσχέτισης των ρυθμίσεων ανάλυσης δεδομένων.

Πίνακας 1.14

(0,93633*0,93626) / 0,87 = 1,00.

Συμπέρασμα: Με βάση τους υπολογισμούς που προέκυψαν, μπορούμε να συμπεράνουμε ότι το αποτελεσματικό χαρακτηριστικό Υ (ακαθάριστο περιφερειακό προϊόν) εξαρτάται σε μεγάλο βαθμό από τον παράγοντα X1 (επένδυση σε πάγιο κεφάλαιο) (κατά 100%).

Βιβλιογραφία

  • 1. Magnus Ya.R., Katyshev P.K., Peresetsky A.A. Οικονομετρία. Αρχική πορεία. Φροντιστήριο. 2η έκδ. - Μ.: Delo, 1998. - Σελ. 69 - 74.
  • 2. Εργαστήριο οικονομετρίας: Σχολικό βιβλίο / Ι.Ι. Eliseeva, S.V. Kurysheva, N.M. Gordeenko και άλλοι 2002. - Σελ. 49 - 105.
  • 3. Dougerty K. Εισαγωγή στην οικονομετρία: Per. από τα Αγγλικά. - Μ.: INFRA-M, 1999. - XIV, σελ. 262 - 285.
  • 4. Aivyzyan S.A., Mikhtiryan V.S. Εφαρμοσμένα μαθηματικά και θεμέλια οικονομετρίας. -1998., σσ. 115-147.
  • 5. Kremer N.Sh., Putko B.A. Οικονομετρία. -2007. από 175-251.
y Χ (1) Χ (2) Χ (3) Χ (4) Χ (5)
y 1.00 0.43 0.37 0.40 0.58 0.33
Χ (1) 0.43 1.00 0.85 0.98 0.11 0.34
Χ (2) 0.37 0.85 1.00 0.88 0.03 0.46
Χ (3) 0.40 0.98 0.88 1.00 0.03 0.28
Χ (4) 0.58 0.11 0.03 0.03 1.00 0.57
Χ (5) 0.33 0.34 0.46 0.28 0.57 1.00

Μια ανάλυση του πίνακα των ζευγαρωμένων συντελεστών συσχέτισης δείχνει ότι ο δείκτης απόδοσης σχετίζεται στενότερα με τον δείκτη Χ(4) - η ποσότητα των λιπασμάτων που χρησιμοποιούνται ανά 1 εκτάριο ().

Ταυτόχρονα, η σχέση μεταξύ των χαρακτηριστικών-επιχειρημάτων είναι αρκετά στενή. Έτσι, υπάρχει πρακτικά μια λειτουργική σχέση μεταξύ του αριθμού των τροχοφόρων τρακτέρ ( Χ(1)) και τον αριθμό των εργαλείων επιφανειακής άροσης .

Η παρουσία πολυσυγγραμμικότητας αποδεικνύεται επίσης από τους συντελεστές συσχέτισης και . Δεδομένης της στενής σχέσης των δεικτών Χ (1) , Χ(2) και Χ(3) , μόνο ένα από αυτά μπορεί να εισέλθει στο μοντέλο παλινδρόμησης απόδοσης.

Για να δείξετε τον αρνητικό αντίκτυπο της πολυσυγγραμμικότητας, εξετάστε ένα μοντέλο παλινδρόμησης απόδοσης που περιλαμβάνει όλες τις εισροές:

Φόμπες = 121.

Σε παρένθεση είναι οι τιμές των διορθωμένων εκτιμήσεων των τυπικών αποκλίσεων των εκτιμήσεων των συντελεστών της εξίσωσης .

Κάτω από την εξίσωση παλινδρόμησης, παρουσιάζονται οι ακόλουθες παράμετροι επάρκειας: πολλαπλός συντελεστής προσδιορισμού ; διορθώθηκε η εκτίμηση της υπολειπόμενης διακύμανσης , του μέσου σχετικού σφάλματος προσέγγισης και της υπολογισμένης τιμής του κριτηρίου Fobs = 121.

Η εξίσωση παλινδρόμησης είναι σημαντική γιατί F obl = 121 > F kp = 2,85 που βρέθηκαν από τον πίνακα φά- κατανομές σε a=0,05; n 1 =6 και n 2 =14.

Από αυτό προκύπτει ότι το Q10, δηλ. και τουλάχιστον έναν από τους συντελεστές της εξίσωσης q ι (ι= 0, 1, 2, ..., 5) δεν ισούται με μηδέν.

Για να ελεγχθεί η υπόθεση σχετικά με τη σημασία των επιμέρους συντελεστών παλινδρόμησης H0: q j =0, όπου ι=1,2,3,4,5, συγκρίνετε κρίσιμη τιμή t kp = 2,14, βρέθηκε από τον πίνακα t-κατανομές σε επίπεδο σημαντικότητας α=2 Q=0,05 και ο αριθμός των βαθμών ελευθερίας n=14, με την υπολογιζόμενη τιμή . Από την εξίσωση προκύπτει ότι ο συντελεστής παλινδρόμησης είναι στατιστικά σημαντικός μόνο όταν Χ(4) από το ½ t 4½=2,90 > t kp=2,14.



Τα αρνητικά πρόσημα των συντελεστών παλινδρόμησης στο Χ(1) και Χ(5) . Από τις αρνητικές τιμές των συντελεστών, προκύπτει ότι μια αύξηση στον κορεσμό της γεωργίας με τροχοφόρα τρακτέρ ( Χ(1)) και φυτοϋγειονομικά προϊόντα ( Χ(5)) επηρεάζει αρνητικά την απόδοση. Επομένως, η προκύπτουσα εξίσωση παλινδρόμησης είναι απαράδεκτη.

Για να λάβουμε μια εξίσωση παλινδρόμησης με σημαντικούς συντελεστές, χρησιμοποιούμε έναν αλγόριθμο ανάλυσης παλινδρόμησης βήμα προς βήμα. Αρχικά, χρησιμοποιούμε έναν αλγόριθμο βήμα προς βήμα με την εξάλειψη των μεταβλητών.

Εξαιρέστε μια μεταβλητή από το μοντέλο Χ(1) , που αντιστοιχεί στην ελάχιστη απόλυτη τιμή του ½ t 1½=0,01. Για τις υπόλοιπες μεταβλητές, θα κατασκευάσουμε ξανά την εξίσωση παλινδρόμησης:

Η εξίσωση που προκύπτει είναι σημαντική, γιατί F obs = 155 > F kp = 2,90, βρέθηκε σε επίπεδο σημαντικότητας a=0,05 και αριθμοί βαθμών ελευθερίας n 1 =5 και n 2 =15 σύμφωνα με τον πίνακα φά-διανομές, δηλ. διάνυσμα q10. Ωστόσο, μόνο ο συντελεστής παλινδρόμησης είναι σημαντικός στην εξίσωση στο Χ(τέσσερα) . Υπολογιζόμενες τιμές ½ t j ½ για άλλους συντελεστές μικρότερους από t kr = 2,131 που βρέθηκαν στον πίνακα t-διανομές για a=2 Q=0,05 και n=15.

Εξαίρεση μεταβλητής από το μοντέλο Χ(3) , που αντιστοιχεί στην ελάχιστη τιμή t 3 = 0,35 και λάβετε την εξίσωση παλινδρόμησης:

(2.9)

Στην εξίσωση που προκύπτει, δεν είναι στατιστικά σημαντικό και δεν μπορούμε να ερμηνεύσουμε οικονομικά τον συντελεστή στο Χ(5) . Εξαιρώντας Χ(5) παίρνουμε την εξίσωση παλινδρόμησης:

(2.10)

Λάβαμε μια σημαντική εξίσωση παλινδρόμησης με σημαντικούς και ερμηνεύσιμους συντελεστές.

Ωστόσο, η εξίσωση που προκύπτει δεν είναι το μόνο «καλό» ή «καλύτερο» μοντέλο απόδοσης στο παράδειγμά μας.

Ας το δείξουμε Στην συνθήκη της πολυσυγγραμμικότητας, ο αλγόριθμος βήμα προς βήμα με τη συμπερίληψη μεταβλητών είναι πιο αποτελεσματικός.Το πρώτο βήμα στο μοντέλο απόδοσης yπεριλαμβάνει μια μεταβλητή Χ(4) , που έχει τον υψηλότερο συντελεστή συσχέτισης με y, εξηγείται από τη μεταβλητή - r(y,Χ(4))=0,58. Στο δεύτερο βήμα, συμπεριλαμβανομένης της εξίσωσης μαζί με Χ(4) μεταβλητές Χ(1) ή Χ(3) , θα λάβουμε μοντέλα που είναι ανώτερα από το (2.10) για οικονομικούς λόγους και στατιστικά χαρακτηριστικά:

(2.11)

(2.12)

Η συμπερίληψη οποιασδήποτε από τις τρεις υπόλοιπες μεταβλητές στην εξίσωση επιδεινώνει τις ιδιότητές της. Βλέπε, για παράδειγμα, την εξίσωση (2.9).

Έτσι, έχουμε τρία «καλά» μοντέλα απόδοσης, από τα οποία πρέπει να επιλεγεί ένα για οικονομικούς και στατιστικούς λόγους.

Σύμφωνα με στατιστικά κριτήρια, το μοντέλο (2.11) είναι το πλέον κατάλληλο. Αντιστοιχεί στις ελάχιστες τιμές της υπολειπόμενης διακύμανσης = 2,26 και στο μέσο σχετικό σφάλμα προσέγγισης και στις μεγαλύτερες τιμές και Fobs = 273.

Το μοντέλο (2.12) έχει κάπως χειρότερους δείκτες επάρκειας και μετά το μοντέλο (2.10).

Τώρα θα επιλέξουμε το καλύτερο από τα μοντέλα (2.11) και (2.12). Αυτά τα μοντέλα διαφέρουν μεταξύ τους σε μεταβλητές Χ(1) και Χ(3) . Ωστόσο, στα μοντέλα απόδοσης, η μεταβλητή Χ(1) (αριθμός τροχοφόρων τρακτέρ ανά 100 εκτάρια) προτιμάται από μεταβλητό Χ(3) (αριθμός εργαλείων επιφανειακής άροσης ανά 100 εκτάρια), η οποία είναι κάπως δευτερεύουσα (ή προέρχεται από Χ (1)).

Στο πλαίσιο αυτό, για οικονομικούς λόγους, θα πρέπει να προτιμάται το μοντέλο (2.12). Έτσι, μετά την εφαρμογή του αλγόριθμου της σταδιακής ανάλυσης παλινδρόμησης με συμπερίληψη μεταβλητών και λαμβάνοντας υπόψη το γεγονός ότι μόνο μία από τις τρεις σχετικές μεταβλητές θα πρέπει να εισέλθει στην εξίσωση ( Χ (1) , Χ(2) ή Χ(3)) επιλέξτε την τελική εξίσωση παλινδρόμησης:

Η εξίσωση είναι σημαντική στο a=0,05, γιατί F obl = 266 > F kp = 3,20 που βρέθηκε από τον πίνακα φά-διανομές για α= Q=0,05; n 1 =3 και n 2 =17. Όλοι οι συντελεστές παλινδρόμησης είναι επίσης σημαντικοί στην εξίσωση ½ t j½> t kp (a=2 Q=0,05; n=17)=2,11. Ο συντελεστής παλινδρόμησης q 1 θα πρέπει να αναγνωριστεί ως σημαντικός (q 1 ¹0) για οικονομικούς λόγους, ενώ t 1 =2,09 μόνο ελαφρώς λιγότερο t kp = 2,11.

Από την εξίσωση παλινδρόμησης προκύπτει ότι μια αύξηση ανά μονάδα στον αριθμό των τρακτέρ ανά 100 εκτάρια καλλιεργήσιμης γης (με σταθερή αξία Χ(4)) οδηγεί σε αύξηση των αποδόσεων των σιτηρών κατά μέσο όρο 0,345 c/ha.

Ένας κατά προσέγγιση υπολογισμός των συντελεστών ελαστικότητας e 1 "0,068 και e 2" 0,161 δείχνει ότι με αύξηση των δεικτών Χ(1) και Χ(4) κατά 1%, η απόδοση σε κόκκους αυξάνεται κατά μέσο όρο κατά 0,068% και 0,161%, αντίστοιχα.

Ο πολλαπλός συντελεστής προσδιορισμού δείχνει ότι μόνο το 46,9% της διακύμανσης της απόδοσης εξηγείται από τους δείκτες που περιλαμβάνονται στο μοντέλο ( Χ(1) και Χ(4)), δηλαδή τον κορεσμό της φυτικής παραγωγής με τρακτέρ και λιπάσματα. Η υπόλοιπη διακύμανση οφείλεται στη δράση μη λογιστικών παραγόντων ( Χ (2) , Χ (3) , Χ(5) , καιρικές συνθήκες κ.λπ.). Το μέσο σχετικό σφάλμα προσέγγισης χαρακτηρίζει την επάρκεια του μοντέλου, καθώς και την τιμή της υπολειπόμενης διακύμανσης. Κατά την ερμηνεία της εξίσωσης παλινδρόμησης, ενδιαφέρουν οι τιμές των σχετικών σφαλμάτων προσέγγισης . Θυμηθείτε ότι - η τιμή μοντέλου του αποτελεσματικού δείκτη χαρακτηρίζει τη μέση τιμή παραγωγικότητας για το σύνολο των εξεταζόμενων περιοχών, υπό την προϋπόθεση ότι οι τιμές των επεξηγηματικών μεταβλητών Χ(1) και Χ(4) σταθερό στο ίδιο επίπεδο, συγκεκριμένα Χ (1) = x i(1) και Χ (4) = x i(τέσσερα) . Στη συνέχεια για τις τιμές του d Εγώοι αποδόσεις μπορούν να συγκριθούν. Περιοχές που αντιστοιχούν σε τιμές d Εγώ>0, έχουν απόδοση άνω του μέσου όρου και δ Εγώ<0 - ниже среднего.

Στο παράδειγμά μας, η φυτική παραγωγή είναι πιο αποδοτική στην περιοχή που αντιστοιχεί στο d 7 \u003d 28%, όπου η απόδοση είναι 28% υψηλότερη από τον μέσο όρο της περιοχής και η λιγότερο αποτελεσματική - στην περιοχή με d 20 =-27,3%.


Εργασίες και ασκήσεις

2.1. Από το γενικό πληθυσμό ( y, Χ (1) , ..., Χ(p)), όπου yέχει νόμο κανονικής κατανομής με μαθηματική προσδοκία υπό όρους και διακύμανση s 2, ένα τυχαίο δείγμα όγκου n, άστο να πάει ( y i, x i (1) , ..., x i(p)) - αποτέλεσμα Εγώη παρατήρηση ( Εγώ=1, 2, ..., n). Να προσδιορίσετε: α) τη μαθηματική προσδοκία της εκτίμησης των ελαχίστων τετραγώνων του διανύσματος q; β) τον πίνακα συνδιακύμανσης της εκτίμησης των ελαχίστων τετραγώνων του διανύσματος q; γ) τη μαθηματική προσδοκία της εκτίμησης.

2.2. Σύμφωνα με την συνθήκη του προβλήματος 2.1, να βρείτε τη μαθηματική προσδοκία του αθροίσματος των τετραγώνων των αποκλίσεων λόγω παλινδρόμησης, δηλ. EQ R, όπου

.

2.3. Σύμφωνα με την συνθήκη του προβλήματος 2.1, προσδιορίστε τη μαθηματική προσδοκία του αθροίσματος των τετραγωνικών αποκλίσεων λόγω της υπολειπόμενης διακύμανσης σε σχέση με τις γραμμές παλινδρόμησης, δηλ. EQ ost όπου

2.4. Να αποδείξετε ότι με την υπόθεση Н 0: q=0 η στατιστική

έχει κατανομή F με βαθμούς ελευθερίας n 1 =p+1 και n 2 =n-p-1.

2.5. Να αποδείξετε ότι όταν εκπληρώνεται η υπόθεση H 0: q j =0, η στατιστική έχει t-κατανομή με τον αριθμό των βαθμών ελευθερίας n=n-p-1.

2.6. Με βάση τα δεδομένα (Πίνακας 2.3) για την εξάρτηση της συρρίκνωσης του κτηνοτροφικού ψωμιού ( y) κατά τη διάρκεια αποθήκευσης ( Χ) βρείτε μια σημειακή εκτίμηση της υπό όρους μαθηματικής προσδοκίας με την υπόθεση ότι η γενική εξίσωση παλινδρόμησης είναι γραμμική.

Πίνακας 2.3.

Απαιτείται: α) να βρεθούν εκτιμήσεις και υπολειπόμενη διακύμανση s 2 με την υπόθεση ότι η γενική εξίσωση παλινδρόμησης έχει τη μορφή ; β) ελέγξτε για a=0,05 τη σημασία της εξίσωσης παλινδρόμησης, δηλ. υπόθεση Η 0: q=0; γ) με αξιοπιστία g=0,9 προσδιορίστε τις εκτιμήσεις διαστήματος των παραμέτρων q 0 , q 1 ; δ) με αξιοπιστία g=0,95 προσδιορίστε την εκτίμηση διαστήματος της υπό όρους προσδοκίας για Χ 0=6; ε) προσδιορίστε στο g=0,95 το διάστημα εμπιστοσύνης της πρόβλεψης στο σημείο Χ=12.

2.7. Με βάση τα στοιχεία για τη δυναμική του ρυθμού αύξησης της τιμής της μετοχής για 5 μήνες, που δίνονται στον Πίνακα. 2.4.

Πίνακας 2.4.

μήνες ( Χ)
y (%)

και με την παραδοχή ότι η γενική εξίσωση παλινδρόμησης έχει τη μορφή , απαιτείται: α) να προσδιοριστούν οι εκτιμήσεις και οι παράμετροι της εξίσωσης παλινδρόμησης και η υπολειπόμενη διακύμανση s 2 . β) ελέγξτε στο a=0,01 τη σημασία του συντελεστή παλινδρόμησης, δηλ. υποθέσεις H 0: q 1 =0;

γ) με αξιοπιστία g=0,95 βρείτε εκτιμήσεις διαστήματος των παραμέτρων q 0 και q 1 ; δ) με αξιοπιστία g = 0,9, ορίστε μια εκτίμηση διαστήματος της υπό όρους μαθηματικής προσδοκίας για Χ 0=4; ε) προσδιορίστε στο g=0,9 το διάστημα εμπιστοσύνης της πρόβλεψης στο σημείο Χ=5.

2.8. Τα αποτελέσματα της μελέτης της δυναμικής της αύξησης βάρους σε νεαρά ζώα δίνονται στον Πίνακα 2.5.

Πίνακας 2.5.

Υποθέτοντας ότι η γενική εξίσωση παλινδρόμησης είναι γραμμική, απαιτείται: α) να προσδιοριστούν οι εκτιμήσεις και οι παράμετροι της εξίσωσης παλινδρόμησης και η υπολειπόμενη διακύμανση s 2 . β) ελέγξτε για a=0,05 τη σημασία της εξίσωσης παλινδρόμησης, δηλ. υποθέσεις H 0: q=0;

γ) με αξιοπιστία g=0,8 να βρεθούν εκτιμήσεις διαστήματος των παραμέτρων q 0 και q 1 ; δ) με αξιοπιστία g=0,98 προσδιορίστε και συγκρίνετε τις εκτιμήσεις διαστήματος της υπό όρους μαθηματικής προσδοκίας για Χ 0 = 3 και Χ 1 =6;

ε) προσδιορίστε στο g=0,98 το διάστημα εμπιστοσύνης της πρόβλεψης στο σημείο Χ=8.

2.9. ΚΟΣΤΟΣ ( y) ένα αντίτυπο του βιβλίου, ανάλογα με την κυκλοφορία ( Χ) (χιλιάδες αντίτυπα) χαρακτηρίζεται από δεδομένα που συλλέγονται από τον εκδοτικό οίκο (Πίνακας 2.6). Προσδιορίστε τις εκτιμήσεις ελαχίστων τετραγώνων και τις παραμέτρους της εξίσωσης υπερβολικής παλινδρόμησης, με την αξιοπιστία g=0,9 δόμηση διαστημάτων εμπιστοσύνης για τις παραμέτρους q 0 και q 1 , καθώς και την υπό όρους μαθηματική προσδοκία στο Χ=10.

Πίνακας 2.6.

Προσδιορίστε εκτιμήσεις και παραμέτρους της εξίσωσης παλινδρόμησης του τύπου Χ=20.

2.11. Στον πίνακα. 2,8 ανέφεραν ρυθμούς ανάπτυξης (%) των παρακάτω μακροοικονομικών δεικτών n\u003d 10 ανεπτυγμένες χώρες του κόσμου για το 1992: ΑΕΠ - Χ(1) , βιομηχανική παραγωγή - Χ(2) , δείκτης τιμών - Χ (3) .

Πίνακας 2.8.

Χώρες x και παραμέτρους της εξίσωσης παλινδρόμησης, εκτίμηση της υπολειπόμενης διακύμανσης. β) ελέγξτε στο a=0,05 τη σημασία του συντελεστή παλινδρόμησης, δηλ. Η 0: q 1 = 0; γ) με αξιοπιστία g=0,9 βρείτε εκτιμήσεις διαστήματος q 0 και q 1 ; δ) βρείτε στο g=0,95 το διάστημα εμπιστοσύνης για στο σημείο Χ 0 =x i, όπου Εγώ=5; ε) συγκρίνετε τα στατιστικά χαρακτηριστικά των εξισώσεων παλινδρόμησης: 1, 2 και 3.

2.12. Λύστε το πρόβλημα 2.11, λαμβάνοντας υπόψη την τιμή που πρέπει να εξηγηθεί ( στο) ευρετήριο Χ(1) , και για την επεξηγηματική ( Χ) μεταβλητή Χ (3) .

1. Ayvazyan S.A., Mkhitaryan V.S. Εφαρμοσμένη Στατιστική και Βασικές Αρχές Οικονομετρίας: Σχολικό βιβλίο. Μ., UNITI, 1998 (2η έκδοση 2001);

2. Ayvazyan S.A., Mkhitaryan V.S. Εφαρμοσμένη Στατιστική σε Προβλήματα και Ασκήσεις: Σχολικό βιβλίο. M. UNITY - DANA, 2001;

3. Aivazyan S.A., Enyukov I.S., Meshalkin L.D. Εφαρμοσμένα στατιστικά στοιχεία. Έρευνα εξάρτησης. Μ., Οικονομικά και στατιστική, 1985, 487σ.;

4. Aivazyan S.A., Buchstaber V.M., Enyukov I.S., Meshalkin L.D. Εφαρμοσμένα στατιστικά στοιχεία. Ταξινόμηση και μείωση διαστάσεων. Μ., Οικονομικά και στατιστική, 1989, 607σ.

5. Johnston J. Econometric Methods, Moscow: Statistics, 1980, 446 pp.;

6. Dubrov A.V., Mkhitaryan V.S., Troshin L.I. Πολυμεταβλητές στατιστικές μέθοδοι. Μ., Οικονομικά και στατιστική, 2000;

7. Mkhitaryan V.S., Troshin L.I. Έρευνα εξαρτήσεων με μεθόδους συσχέτισης και παλινδρόμησης. Μ., MESI, 1995, 120 σελ.;

8. Mkhitaryan V.S., Dubrov A.M., Troshin L.I. Πολυδιάστατες στατιστικές μέθοδοι στα οικονομικά. Μ., MESI, 1995, 149σ.;

9. Dubrov A.M., Mkhitaryan V.S., Troshin L.I. Μαθηματικές στατιστικές για επιχειρηματίες και μάνατζερ. M., MESI, 2000, 140s.;

10. Lukashin Yu.I. Παλινδρόμηση και προσαρμοστικές μέθοδοι πρόβλεψης: Textbook, M., MESI, 1997.

11. Lukashin Yu.I. Προσαρμοστικές μέθοδοι βραχυπρόθεσμης πρόβλεψης. - Μ., Στατιστική, 1979.


ΕΦΑΡΜΟΓΕΣ


Συνημμένο 1. Επιλογές για εργασίες για ανεξάρτητη έρευνα υπολογιστή.

ΚΑΤΗΓΟΡΙΕΣ

Δημοφιλή ΑΡΘΡΑ

2022 "kingad.ru" - υπερηχογραφική εξέταση ανθρώπινων οργάνων