Μέθοδος προσδιορισμού των ελαχίστων τετραγώνων των συντελεστών. Προσέγγιση πειραματικών δεδομένων

3. Προσέγγιση συναρτήσεων με τη χρήση της μεθόδου

ελάχιστα τετράγωνα

Η μέθοδος των ελαχίστων τετραγώνων χρησιμοποιείται κατά την επεξεργασία των αποτελεσμάτων του πειράματος για προσεγγίσεις (προσεγγίσεις) πειραματικά δεδομένα αναλυτικός τύπος. Η συγκεκριμένη μορφή του τύπου επιλέγεται, κατά κανόνα, από φυσικούς λόγους. Αυτοί οι τύποι μπορεί να είναι:

και άλλοι.

Η ουσία της μεθόδου των ελαχίστων τετραγώνων είναι η εξής. Αφήστε τα αποτελέσματα των μετρήσεων να παρουσιαστούν στον πίνακα:

Τραπέζι 4

x n

y n

(3.1)

όπου στ είναι μια γνωστή συνάρτηση, a 0 , a 1 , …, a m - άγνωστες σταθερές παράμετροι, οι τιμές των οποίων πρέπει να βρεθούν. Στη μέθοδο των ελαχίστων τετραγώνων, η προσέγγιση της συνάρτησης (3.1) στην πειραματική εξάρτηση θεωρείται ότι είναι η καλύτερη εάν η συνθήκη

(3.2)

αυτό είναι ποσά ένα Οι τετράγωνες αποκλίσεις της επιθυμητής αναλυτικής συνάρτησης από την πειραματική εξάρτηση θα πρέπει να είναι ελάχιστες .

Σημειώστε ότι η συνάρτηση Q που ονομάζεται αόρατος.


Από την ασυμφωνία

τότε έχει ένα ελάχιστο. Απαραίτητη προϋπόθεση για το ελάχιστο μιας συνάρτησης πολλών μεταβλητών είναι η ισότητα προς το μηδέν όλων των μερικών παραγώγων αυτής της συνάρτησης ως προς τις παραμέτρους. Έτσι, βρίσκοντας τις καλύτερες τιμές των παραμέτρων της συνάρτησης προσέγγισης (3.1), δηλαδή εκείνων των τιμών για τις οποίες Q = Q (a 0 , a 1 , ..., a m ) είναι ελάχιστο, ανάγεται στην επίλυση του συστήματος των εξισώσεων:

(3.3)

Στη μέθοδο των ελαχίστων τετραγώνων μπορεί να δοθεί η ακόλουθη γεωμετρική ερμηνεία: ανάμεσα σε μια άπειρη οικογένεια γραμμών ενός δεδομένου τύπου, βρίσκεται μια ευθεία για την οποία το άθροισμα των τετραγώνων διαφορών στις τεταγμένες των πειραματικών σημείων και των αντίστοιχων τεταγμένων των σημείων που θα βρεθεί από την εξίσωση αυτής της γραμμής θα είναι η μικρότερη.

Εύρεση των παραμέτρων μιας γραμμικής συνάρτησης

Έστω ότι τα πειραματικά δεδομένα αντιπροσωπεύονται από μια γραμμική συνάρτηση:

Απαιτείται η επιλογή τέτοιων τιμώνα και β , για την οποία η συνάρτηση

(3.4)

θα είναι ελάχιστη. Οι απαραίτητες προϋποθέσεις για το ελάχιστο της συνάρτησης (3.4) ανάγεται στο σύστημα των εξισώσεων:

Μετά από μετασχηματισμούς, παίρνουμε ένα σύστημα δύο γραμμικών εξισώσεων με δύο άγνωστα:

(3.5)

λύνοντας το οποίο, βρίσκουμε τις επιθυμητές τιμές των παραμέτρωνα και β .

Εύρεση των παραμέτρων μιας τετραγωνικής συνάρτησης

Αν η προσεγγιστική συνάρτηση είναι τετραγωνική εξάρτηση

τότε οι παράμετροί του a , b , c βρείτε από την ελάχιστη συνθήκη της συνάρτησης:

(3.6)

Οι ελάχιστες συνθήκες για τη συνάρτηση (3.6) ανάγεται στο σύστημα των εξισώσεων:


Μετά από μετασχηματισμούς, παίρνουμε ένα σύστημα τριών γραμμικών εξισώσεων με τρεις άγνωστους:

(3.7)

στο λύνοντας την οποία βρίσκουμε τις επιθυμητές τιμές των παραμέτρωνα , β και γ .

Παράδειγμα . Ας ληφθεί ο παρακάτω πίνακας τιμών ως αποτέλεσμα του πειράματος x και y:

Τραπέζι 5

y i

0,705

0,495

0,426

0,357

0,368

0,406

0,549

0,768

Απαιτείται η προσέγγιση των πειραματικών δεδομένων με γραμμικές και τετραγωνικές συναρτήσεις.

Λύση. Η εύρεση των παραμέτρων των συναρτήσεων προσέγγισης ανάγεται στην επίλυση συστημάτων γραμμικών εξισώσεων (3.5) και (3.7). Για να λύσουμε το πρόβλημα, χρησιμοποιούμε έναν επεξεργαστή υπολογιστικών φύλλωνπροέχω.

1. Πρώτα συνδέουμε τα φύλλα 1 και 2. Εισαγάγετε τις πειραματικές τιμές x i και y iσε στήλες Α και Β, ξεκινώντας από τη δεύτερη γραμμή (στην πρώτη γραμμή βάζουμε τις επικεφαλίδες των στηλών). Στη συνέχεια υπολογίζουμε τα αθροίσματα για αυτές τις στήλες και τα βάζουμε στη δέκατη σειρά.

Στις στήλες Γ–Γ τοποθετήστε τον υπολογισμό και την άθροιση αντίστοιχα

2. Αποσυνδέστε τα φύλλα. Περαιτέρω υπολογισμοί θα γίνουν με παρόμοιο τρόπο για τη γραμμική εξάρτηση στο Φύλλο 1 και για τη δευτεροβάθμια εξάρτηση από το Φύλλο 2.

3. Κάτω από τον πίνακα που προκύπτει, σχηματίζουμε έναν πίνακα συντελεστών και ένα διάνυσμα στήλης ελεύθερων μελών. Ας λύσουμε το σύστημα γραμμικών εξισώσεων σύμφωνα με τον ακόλουθο αλγόριθμο:

Για να υπολογίσουμε τον αντίστροφο πίνακα και να πολλαπλασιάσουμε πίνακες, χρησιμοποιούμε Κύριος λειτουργίεςκαι λειτουργίες MOBRκαι MUMNOZH.

4. Στο μπλοκ κυττάρων H2: H 9 με βάση τους ληφθέντες συντελεστές, υπολογίζουμε τιμές της κατά προσέγγισηπολυώνυμοςy i υπολογ., στο μπλοκ I 2: I 9 - αποκλίσεις D y i = y i exp. - y i υπολογ., στη στήλη J - η απόκλιση:

Πίνακες που λαμβάνονται και κατασκευάζονται με τη χρήση Μάγοι γραφημάτωνΤα γραφήματα φαίνονται στα σχήματα 6, 7, 8.


Ρύζι. 6. Πίνακας για τον υπολογισμό των συντελεστών μιας γραμμικής συνάρτησης,

προσεγγίζονταςπειραματικά δεδομένα.


Ρύζι. 7. Πίνακας για τον υπολογισμό των συντελεστών μιας τετραγωνικής συνάρτησης,

προσεγγίζονταςπειραματικά δεδομένα.


Ρύζι. 8. Γραφική αναπαράσταση των αποτελεσμάτων της προσέγγισης

πειραματικά δεδομένα γραμμικές και τετραγωνικές συναρτήσεις.

Απάντηση. Τα πειραματικά δεδομένα προσεγγίστηκαν με τη γραμμική εξάρτηση y = 0,07881 Χ + 0,442262 με υπολειμματικά Q = 0,165167 και τετραγωνική εξάρτηση y = 3,115476 Χ 2 – 5,2175 Χ + 2,529631 με υπολειμματικά Q = 0,002103 .

Καθήκοντα. Να προσεγγίσετε τη συνάρτηση που δίνεται από πινακικές, γραμμικές και τετραγωνικές συναρτήσεις.

Πίνακας 6

№0

Χ

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

y

3,030

3,142

3,358

3,463

3,772

3,251

3,170

3,665

1

3,314

3,278

3,262

3,292

3,332

3,397

3,487

3,563

2

1,045

1,162

1,264

1,172

1,070

0,898

0,656

0,344

3

6,715

6,735

6,750

6,741

6,645

6,639

6,647

6,612

4

2,325

2,515

2,638

2,700

2,696

2,626

2,491

2,291

5

1.752

1,762

1,777

1,797

1,821

1,850

1,884

1,944

6

1,924

1,710

1,525

1,370

1,264

1,190

1,148

1,127

7

1,025

1,144

1,336

1,419

1,479

1,530

1,568

1,248

8

5,785

5,685

5,605

5,545

5,505

5,480

5,495

5,510

9

4,052

4,092

4,152

4,234

4,338

4,468

4,599

Παράδειγμα.

Πειραματικά δεδομένα για τις τιμές των μεταβλητών Χκαι στοδίνονται στον πίνακα.

Ως αποτέλεσμα της ευθυγράμμισής τους, η συνάρτηση

Χρησιμοποιώντας μέθοδος ελάχιστου τετραγώνου, προσεγγίστε αυτά τα δεδομένα με μια γραμμική εξάρτηση y=ax+b(βρείτε επιλογές ένακαι σι). Μάθετε ποια από τις δύο γραμμές είναι καλύτερη (με την έννοια της μεθόδου των ελαχίστων τετραγώνων) ευθυγραμμίζει τα πειραματικά δεδομένα. Κάντε ένα σχέδιο.

Η ουσία της μεθόδου των ελαχίστων τετραγώνων (LSM).

Το πρόβλημα είναι να βρούμε τους γραμμικούς συντελεστές εξάρτησης για τους οποίους η συνάρτηση δύο μεταβλητών ένακαι σι παίρνει τη μικρότερη τιμή. Με δεδομένα δηλαδή ένακαι σιτο άθροισμα των τετραγωνικών αποκλίσεων των πειραματικών δεδομένων από την ευθεία που βρέθηκε θα είναι το μικρότερο. Αυτό είναι το όλο νόημα της μεθόδου των ελαχίστων τετραγώνων.

Έτσι, η λύση του παραδείγματος ανάγεται στην εύρεση του άκρου μιας συνάρτησης δύο μεταβλητών.

Παραγωγή τύπων εύρεσης συντελεστών.

Καταρτίζεται και λύνεται ένα σύστημα δύο εξισώσεων με δύο αγνώστους. Εύρεση μερικών παραγώγων συναρτήσεων κατά μεταβλητές ένακαι σι, εξισώνουμε αυτές τις παραγώγους με μηδέν.

Λύνουμε το προκύπτον σύστημα εξισώσεων με οποιαδήποτε μέθοδο (π.χ μέθοδος αντικατάστασηςή Η μέθοδος του Cramer) και λάβετε τύπους για την εύρεση των συντελεστών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων (LSM).

Με δεδομένα ένακαι σιλειτουργία παίρνει τη μικρότερη τιμή. Η απόδειξη αυτού του γεγονότος δίνεται κάτω από το κείμενο στο τέλος της σελίδας.

Αυτή είναι η όλη μέθοδος των ελαχίστων τετραγώνων. Τύπος για την εύρεση της παραμέτρου έναπεριέχει τα αθροίσματα ,, και την παράμετρο n- ποσότητα πειραματικών δεδομένων. Οι τιμές αυτών των ποσών συνιστάται να υπολογίζονται χωριστά. Συντελεστής σιβρέθηκε μετά τον υπολογισμό ένα.

Ήρθε η ώρα να θυμηθούμε το αρχικό παράδειγμα.

Λύση.

Στο παράδειγμά μας n=5. Συμπληρώνουμε τον πίνακα για τη διευκόλυνση του υπολογισμού των ποσών που περιλαμβάνονται στους τύπους των απαιτούμενων συντελεστών.

Οι τιμές στην τέταρτη σειρά του πίνακα λαμβάνονται πολλαπλασιάζοντας τις τιμές της 2ης σειράς με τις τιμές της 3ης σειράς για κάθε αριθμό Εγώ.

Οι τιμές στην πέμπτη σειρά του πίνακα λαμβάνονται με τον τετραγωνισμό των τιμών της 2ης σειράς για κάθε αριθμό Εγώ.

Οι τιμές της τελευταίας στήλης του πίνακα είναι τα αθροίσματα των τιμών στις σειρές.

Χρησιμοποιούμε τους τύπους της μεθόδου των ελαχίστων τετραγώνων για να βρούμε τους συντελεστές ένακαι σι. Αντικαθιστούμε σε αυτά τις αντίστοιχες τιμές από την τελευταία στήλη του πίνακα:

Συνεπώς, y=0,165x+2,184είναι η επιθυμητή προσεγγιστική ευθεία.

Μένει να μάθουμε ποια από τις γραμμές y=0,165x+2,184ή προσεγγίζει καλύτερα τα αρχικά δεδομένα, δηλαδή να κάνει μια εκτίμηση χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Εκτίμηση του σφάλματος της μεθόδου των ελαχίστων τετραγώνων.

Για να γίνει αυτό, πρέπει να υπολογίσετε τα αθροίσματα των τετραγωνικών αποκλίσεων των αρχικών δεδομένων από αυτές τις γραμμές και , μια μικρότερη τιμή αντιστοιχεί σε μια γραμμή που προσεγγίζει καλύτερα τα αρχικά δεδομένα όσον αφορά τη μέθοδο των ελαχίστων τετραγώνων.

Από τότε η γραμμή y=0,165x+2,184προσεγγίζει καλύτερα τα αρχικά δεδομένα.

Γραφική απεικόνιση της μεθόδου των ελαχίστων τετραγώνων (LSM).

Όλα φαίνονται υπέροχα στα charts. Η κόκκινη γραμμή είναι η γραμμή που βρέθηκε y=0,165x+2,184, η μπλε γραμμή είναι , οι ροζ κουκκίδες είναι τα αρχικά δεδομένα.

Στην πράξη, κατά τη μοντελοποίηση διαφόρων διαδικασιών - ειδικότερα, οικονομικές, φυσικές, τεχνικές, κοινωνικές - χρησιμοποιείται ευρέως μία ή άλλη μέθοδος υπολογισμού των κατά προσέγγιση τιμών των συναρτήσεων από τις γνωστές τους τιμές σε ορισμένα σταθερά σημεία.

Συχνά προκύπτουν προβλήματα προσέγγισης συναρτήσεων αυτού του είδους:

    κατά την κατασκευή κατά προσέγγιση τύπων για τον υπολογισμό των τιμών των χαρακτηριστικών ποσοτήτων της υπό μελέτη διεργασίας σύμφωνα με τα δεδομένα πίνακα που ελήφθησαν ως αποτέλεσμα του πειράματος.

    στην αριθμητική ολοκλήρωση, διαφοροποίηση, επίλυση διαφορικών εξισώσεων κ.λπ.

    εάν είναι απαραίτητο να υπολογιστούν οι τιμές των συναρτήσεων σε ενδιάμεσα σημεία του εξεταζόμενου διαστήματος.

    κατά τον προσδιορισμό των τιμών των χαρακτηριστικών ποσοτήτων της διαδικασίας εκτός του υπό εξέταση διαστήματος, ιδίως κατά την πρόβλεψη.

Εάν, για να μοντελοποιηθεί μια συγκεκριμένη διαδικασία που καθορίζεται από έναν πίνακα, κατασκευάζεται μια συνάρτηση που περιγράφει κατά προσέγγιση αυτή τη διαδικασία με βάση τη μέθοδο των ελαχίστων τετραγώνων, θα ονομάζεται συνάρτηση προσέγγισης (παλίνδρομος) και η ίδια η εργασία κατασκευής συναρτήσεων προσέγγισης θα είναι πρόβλημα προσέγγισης.

Αυτό το άρθρο εξετάζει τις δυνατότητες του πακέτου MS Excel για την επίλυση τέτοιων προβλημάτων, επιπλέον, δίνονται μέθοδοι και τεχνικές για την κατασκευή (δημιουργία) παλινδρόμησης για συναρτήσεις που δίνονται σε πίνακα (που είναι η βάση της ανάλυσης παλινδρόμησης).

Υπάρχουν δύο επιλογές για τη δημιουργία παλινδρόμησης στο Excel.

    Προσθήκη επιλεγμένων παλινδρομήσεων (γραμμές τάσης) σε ένα γράφημα που έχει δημιουργηθεί με βάση έναν πίνακα δεδομένων για το χαρακτηριστικό της διαδικασίας που μελετήθηκε (διατίθεται μόνο εάν έχει κατασκευαστεί γράφημα).

    Χρησιμοποιώντας τις ενσωματωμένες στατιστικές συναρτήσεις του φύλλου εργασίας του Excel, το οποίο σας επιτρέπει να λαμβάνετε παλινδρομήσεις (γραμμές τάσης) απευθείας από τον πίνακα δεδομένων προέλευσης.

Προσθήκη γραμμών τάσης σε γράφημα

Για έναν πίνακα δεδομένων που περιγράφει μια συγκεκριμένη διαδικασία και αντιπροσωπεύεται από ένα διάγραμμα, το Excel διαθέτει ένα αποτελεσματικό εργαλείο ανάλυσης παλινδρόμησης που σας επιτρέπει:

    χτίστε με βάση τη μέθοδο των ελαχίστων τετραγώνων και προσθέστε στο διάγραμμα πέντε τύπους παλινδρόμησης που μοντελοποιούν την υπό μελέτη διαδικασία με διάφορους βαθμούς ακρίβειας.

    προσθέστε μια εξίσωση της κατασκευασμένης παλινδρόμησης στο διάγραμμα.

    προσδιορίστε τον βαθμό συμμόρφωσης της επιλεγμένης παλινδρόμησης με τα δεδομένα που εμφανίζονται στο γράφημα.

Με βάση τα δεδομένα του γραφήματος, το Excel σάς επιτρέπει να λαμβάνετε γραμμικούς, πολυωνυμικούς, λογαριθμικούς, εκθετικούς, εκθετικούς τύπους παλινδρόμησης, οι οποίοι δίνονται από την εξίσωση:

y = y(x)

όπου x είναι μια ανεξάρτητη μεταβλητή, η οποία συχνά παίρνει τις τιμές μιας ακολουθίας φυσικών αριθμών (1; 2; 3; ...) και παράγει, για παράδειγμα, μια αντίστροφη μέτρηση του χρόνου της υπό μελέτη διεργασίας (χαρακτηριστικά) .

1 . Η γραμμική παλινδρόμηση είναι καλή στη μοντελοποίηση χαρακτηριστικών που αυξάνονται ή μειώνονται με σταθερό ρυθμό. Αυτό είναι το απλούστερο μοντέλο της υπό μελέτη διαδικασίας. Κατασκευάζεται σύμφωνα με την εξίσωση:

y=mx+b

όπου m είναι η εφαπτομένη της κλίσης της γραμμικής παλινδρόμησης στον άξονα x. β - συντεταγμένη του σημείου τομής της γραμμικής παλινδρόμησης με τον άξονα y.

2 . Μια πολυωνυμική γραμμή τάσης είναι χρήσιμη για την περιγραφή χαρακτηριστικών που έχουν πολλά διακριτά άκρα (υψηλά και χαμηλά). Η επιλογή του βαθμού του πολυωνύμου καθορίζεται από τον αριθμό των ακροτήτων του υπό μελέτη χαρακτηριστικού. Έτσι, ένα πολυώνυμο δεύτερου βαθμού μπορεί κάλλιστα να περιγράψει μια διαδικασία που έχει μόνο ένα μέγιστο ή ελάχιστο. πολυώνυμο του τρίτου βαθμού - όχι περισσότερα από δύο άκρα. πολυώνυμο τέταρτου βαθμού - όχι περισσότερα από τρία άκρα κ.λπ.

Σε αυτήν την περίπτωση, η γραμμή τάσης χτίζεται σύμφωνα με την εξίσωση:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

όπου οι συντελεστές c0, c1, c2,... c6 είναι σταθερές των οποίων οι τιμές καθορίζονται κατά την κατασκευή.

3 . Η λογαριθμική γραμμή τάσης χρησιμοποιείται με επιτυχία στα χαρακτηριστικά μοντελοποίησης, οι τιμές των οποίων αλλάζουν γρήγορα στην αρχή και στη συνέχεια σταθεροποιούνται σταδιακά.

y = c ln(x) + b

4 . Η γραμμή τάσης ισχύος δίνει καλά αποτελέσματα εάν οι τιμές της μελετημένης εξάρτησης χαρακτηρίζονται από μια σταθερή αλλαγή στον ρυθμό ανάπτυξης. Ένα παράδειγμα τέτοιας εξάρτησης μπορεί να χρησιμεύσει ως γραφική παράσταση ομοιόμορφα επιταχυνόμενης κίνησης του αυτοκινήτου. Εάν υπάρχουν μηδενικές ή αρνητικές τιμές στα δεδομένα, δεν μπορείτε να χρησιμοποιήσετε γραμμή τάσης ισχύος.

Είναι κατασκευασμένο σύμφωνα με την εξίσωση:

y = cxb

όπου οι συντελεστές b, c είναι σταθερές.

5 . Θα πρέπει να χρησιμοποιείται μια εκθετική γραμμή τάσης εάν ο ρυθμός μεταβολής των δεδομένων αυξάνεται συνεχώς. Για δεδομένα που περιέχουν μηδενικές ή αρνητικές τιμές, αυτό το είδος προσέγγισης δεν ισχύει επίσης.

Είναι κατασκευασμένο σύμφωνα με την εξίσωση:

y=cebx

όπου οι συντελεστές b, c είναι σταθερές.

Κατά την επιλογή μιας γραμμής τάσης, το Excel υπολογίζει αυτόματα την τιμή του R2, η οποία χαρακτηρίζει την ακρίβεια της προσέγγισης: όσο πιο κοντά είναι η τιμή R2 στο ένα, τόσο πιο αξιόπιστα η γραμμή τάσης προσεγγίζει τη διαδικασία που μελετάται. Εάν είναι απαραίτητο, η τιμή του R2 μπορεί πάντα να εμφανίζεται στο διάγραμμα.

Καθορίζεται από τον τύπο:

Για να προσθέσετε μια γραμμή τάσης σε μια σειρά δεδομένων:

    ενεργοποιήστε το γράφημα που δημιουργήθηκε με βάση τη σειρά δεδομένων, δηλαδή κάντε κλικ στην περιοχή του γραφήματος. Το στοιχείο Γράφημα θα εμφανιστεί στο κύριο μενού.

    αφού κάνετε κλικ σε αυτό το στοιχείο, θα εμφανιστεί ένα μενού στην οθόνη, στο οποίο θα πρέπει να επιλέξετε την εντολή Προσθήκη γραμμής τάσης.

Οι ίδιες ενέργειες υλοποιούνται εύκολα εάν τοποθετήσετε το δείκτη του ποντικιού πάνω από το γράφημα που αντιστοιχεί σε μία από τις σειρές δεδομένων και κάνετε δεξί κλικ. στο μενού περιβάλλοντος που εμφανίζεται, επιλέξτε την εντολή Προσθήκη γραμμής τάσης. Το παράθυρο διαλόγου Trendline θα εμφανιστεί στην οθόνη με ανοιχτή την καρτέλα Type (Εικ. 1).

Μετά από αυτό χρειάζεστε:

Στην καρτέλα Τύπος, επιλέξτε τον απαιτούμενο τύπο γραμμής τάσης (Το Γραμμικό επιλέγεται από προεπιλογή). Για τον τύπο Polynomial, στο πεδίο Degree, καθορίστε τον βαθμό του επιλεγμένου πολυωνύμου.

1 . Το πεδίο Built on Series παραθέτει όλες τις σειρές δεδομένων στο εν λόγω γράφημα. Για να προσθέσετε μια γραμμή τάσης σε μια συγκεκριμένη σειρά δεδομένων, επιλέξτε το όνομά της στο πεδίο Ενσωματωμένη σειρά.

Εάν είναι απαραίτητο, μεταβαίνοντας στην καρτέλα Παράμετροι (Εικ. 2), μπορείτε να ορίσετε τις ακόλουθες παραμέτρους για τη γραμμή τάσης:

    αλλάξτε το όνομα της γραμμής τάσης στο Όνομα του πεδίου προσεγγιστικής (εξομαλυνόμενης) καμπύλης.

    ορίστε τον αριθμό των περιόδων (προς τα εμπρός ή προς τα πίσω) για την πρόβλεψη στο πεδίο Πρόβλεψη.

    εμφανίστε την εξίσωση της γραμμής τάσης στην περιοχή του γραφήματος, για την οποία θα πρέπει να ενεργοποιήσετε το πλαίσιο ελέγχου εμφάνιση της εξίσωσης στο γράφημα.

    Εμφάνιση της τιμής της αξιοπιστίας προσέγγισης R2 στην περιοχή του διαγράμματος, για την οποία θα πρέπει να ενεργοποιήσετε το πλαίσιο ελέγχου, τοποθετήστε την τιμή της αξιοπιστίας προσέγγισης (R^2) στο διάγραμμα.

    ορίστε το σημείο τομής της γραμμής τάσης με τον άξονα Υ, για το οποίο θα πρέπει να ενεργοποιήσετε το πλαίσιο ελέγχου Τομή της καμπύλης με τον άξονα Υ σε ένα σημείο.

    κάντε κλικ στο κουμπί OK για να κλείσετε το παράθυρο διαλόγου.

Υπάρχουν τρεις τρόποι για να ξεκινήσετε την επεξεργασία μιας ήδη χτισμένης γραμμής τάσεων:

    χρησιμοποιήστε την εντολή Selected trend line από το μενού Format, αφού επιλέξετε τη γραμμή τάσης.

    επιλέξτε την εντολή Format Trendline από το μενού περιβάλλοντος, η οποία καλείται κάνοντας δεξί κλικ στη γραμμή τάσης.

    κάνοντας διπλό κλικ στη γραμμή τάσης.

Το πλαίσιο διαλόγου Format Trendline θα εμφανιστεί στην οθόνη (Εικ. 3), που περιέχει τρεις καρτέλες: Προβολή, Τύπος, Παράμετροι και τα περιεχόμενα των δύο τελευταίων συμπίπτουν πλήρως με τις παρόμοιες καρτέλες του πλαισίου διαλόγου Trendline (Εικ. 1-2 ). Στην καρτέλα Προβολή, μπορείτε να ορίσετε τον τύπο γραμμής, το χρώμα και το πάχος της.

Για να διαγράψετε μια ήδη κατασκευασμένη γραμμή τάσης, επιλέξτε τη γραμμή τάσης που θέλετε να διαγράψετε και πατήστε το πλήκτρο Διαγραφή.

Τα πλεονεκτήματα του εξεταζόμενου εργαλείου ανάλυσης παλινδρόμησης είναι:

    τη σχετική ευκολία σχεδίασης μιας γραμμής τάσης σε γραφήματα χωρίς τη δημιουργία πίνακα δεδομένων για αυτήν·

    μια αρκετά μεγάλη λίστα τύπων προτεινόμενων γραμμών τάσης και αυτή η λίστα περιλαμβάνει τους πιο συχνά χρησιμοποιούμενους τύπους παλινδρόμησης.

    τη δυνατότητα πρόβλεψης της συμπεριφοράς της υπό μελέτη διαδικασίας για έναν αυθαίρετο (κατά την κοινή λογική) αριθμό βημάτων προς τα εμπρός, καθώς και προς τα πίσω.

    τη δυνατότητα λήψης της εξίσωσης της γραμμής τάσης σε αναλυτική μορφή.

    τη δυνατότητα, εάν είναι απαραίτητο, να ληφθεί αξιολόγηση της αξιοπιστίας της προσέγγισης.

Τα μειονεκτήματα περιλαμβάνουν τα ακόλουθα σημεία:

    η κατασκευή μιας γραμμής τάσης πραγματοποιείται μόνο εάν υπάρχει ένα γράφημα που βασίζεται σε μια σειρά δεδομένων.

    η διαδικασία δημιουργίας σειρών δεδομένων για το χαρακτηριστικό υπό μελέτη με βάση τις εξισώσεις γραμμής τάσης που λαμβάνονται για αυτό είναι κάπως ακατάστατη: οι επιθυμητές εξισώσεις παλινδρόμησης ενημερώνονται με κάθε αλλαγή στις τιμές της αρχικής σειράς δεδομένων, αλλά μόνο εντός της περιοχής του γραφήματος , ενώ η σειρά δεδομένων που σχηματίστηκε με βάση την τάση της παλιάς εξίσωσης γραμμής, παραμένει αμετάβλητη.

    Στις αναφορές Συγκεντρωτικού Γραφήματος, όταν αλλάζετε την προβολή γραφήματος ή τη συσχετισμένη αναφορά Συγκεντρωτικού Πίνακα, δεν διατηρούνται οι υπάρχουσες γραμμές τάσεων, επομένως πρέπει να βεβαιωθείτε ότι η διάταξη της αναφοράς πληροί τις απαιτήσεις σας προτού σχεδιάσετε γραμμές τάσης ή μορφοποιήσετε με άλλο τρόπο την αναφορά Συγκεντρωτικού γραφήματος.

Οι γραμμές τάσης μπορούν να προστεθούν σε σειρές δεδομένων που παρουσιάζονται σε γραφήματα όπως γράφημα, ιστόγραμμα, γραφήματα επίπεδων μη κανονικοποιημένων περιοχών, ράβδων, διασποράς, φυσαλίδων και γραφημάτων μετοχών.

Δεν μπορείτε να προσθέσετε γραμμές τάσης σε σειρές δεδομένων σε γραφήματα 3-D, Standard, Radar, Pie και Donut.

Χρήση ενσωματωμένων λειτουργιών του Excel

Το Excel παρέχει επίσης ένα εργαλείο ανάλυσης παλινδρόμησης για τη χάραξη γραμμών τάσης εκτός της περιοχής του γραφήματος. Για το σκοπό αυτό μπορούν να χρησιμοποιηθούν διάφορες συναρτήσεις στατιστικών φύλλων εργασίας, αλλά όλες σας επιτρέπουν να δημιουργήσετε μόνο γραμμικές ή εκθετικές παλινδρομήσεις.

Το Excel έχει πολλές λειτουργίες για τη δημιουργία γραμμικής παλινδρόμησης, ιδίως:

    ΤΑΣΗ;

  • ΚΛΙΣΗ και ΚΟΨΗ.

Καθώς και πολλές λειτουργίες για την κατασκευή μιας εκθετικής γραμμής τάσης, ειδικότερα:

    LGRFPπερ.

Θα πρέπει να σημειωθεί ότι οι τεχνικές για την κατασκευή παλινδρομήσεων χρησιμοποιώντας τις συναρτήσεις TREND και GROWTH είναι πρακτικά οι ίδιες. Το ίδιο μπορεί να ειπωθεί για το ζεύγος των συναρτήσεων LINEST και LGRFPRIBL. Για αυτές τις τέσσερις συναρτήσεις, κατά τη δημιουργία ενός πίνακα τιμών, χρησιμοποιούνται χαρακτηριστικά του Excel, όπως τύποι πίνακα, γεγονός που δυσχεραίνει κάπως τη διαδικασία δημιουργίας παλινδρομήσεων. Σημειώνουμε επίσης ότι η κατασκευή μιας γραμμικής παλινδρόμησης, κατά τη γνώμη μας, είναι πιο εύκολο να εφαρμοστεί χρησιμοποιώντας τις συναρτήσεις SLOPE και INTERCEPT, όπου η πρώτη από αυτές καθορίζει την κλίση της γραμμικής παλινδρόμησης και η δεύτερη καθορίζει το τμήμα που αποκόπτεται από την παλινδρόμηση στον άξονα y.

Τα πλεονεκτήματα του ενσωματωμένου εργαλείου συναρτήσεων για ανάλυση παλινδρόμησης είναι:

    μια αρκετά απλή διαδικασία του ίδιου τύπου σχηματισμού σειρών δεδομένων του υπό μελέτη χαρακτηριστικού για όλες τις ενσωματωμένες στατιστικές συναρτήσεις που θέτουν γραμμές τάσης.

    μια τυπική τεχνική για την κατασκευή γραμμών τάσης με βάση τις παραγόμενες σειρές δεδομένων.

    την ικανότητα πρόβλεψης της συμπεριφοράς της υπό μελέτη διαδικασίας για τον απαιτούμενο αριθμό βημάτων προς τα εμπρός ή προς τα πίσω.

Και τα μειονεκτήματα περιλαμβάνουν το γεγονός ότι το Excel δεν διαθέτει ενσωματωμένες λειτουργίες για τη δημιουργία άλλων (εκτός από γραμμικούς και εκθετικούς) τύπους γραμμών τάσης. Αυτή η περίσταση συχνά δεν επιτρέπει την επιλογή ενός επαρκώς ακριβούς μοντέλου της υπό μελέτη διαδικασίας, καθώς και τη λήψη προβλέψεων κοντά στην πραγματικότητα. Επιπλέον, όταν χρησιμοποιούνται οι συναρτήσεις TREND και GROW, οι εξισώσεις των γραμμών τάσης δεν είναι γνωστές.

Θα πρέπει να σημειωθεί ότι οι συγγραφείς δεν έθεσαν ως στόχο του άρθρου να παρουσιάσει την πορεία της ανάλυσης παλινδρόμησης με διάφορους βαθμούς πληρότητας. Το κύριο καθήκον του είναι να δείξει τις δυνατότητες του πακέτου Excel στην επίλυση προβλημάτων προσέγγισης χρησιμοποιώντας συγκεκριμένα παραδείγματα. Δείξτε ποια αποτελεσματικά εργαλεία διαθέτει το Excel για τη δημιουργία παλινδρόμησης και την πρόβλεψη. δείχνουν πόσο σχετικά εύκολα μπορούν να λυθούν τέτοια προβλήματα ακόμη και από έναν χρήστη που δεν έχει βαθιά γνώση της ανάλυσης παλινδρόμησης.

Παραδείγματα επίλυσης συγκεκριμένων προβλημάτων

Εξετάστε τη λύση συγκεκριμένων προβλημάτων χρησιμοποιώντας τα αναφερόμενα εργαλεία του πακέτου Excel.

Εργασία 1

Με πίνακα στοιχείων για τα κέρδη μιας αυτοκινητοβιομηχανίας για την περίοδο 1995-2002. πρέπει να κάνετε τα εξής.

    Κατασκευάστε ένα γράφημα.

    Προσθέστε γραμμικές και πολυωνυμικές (τετραγωνικές και κυβικές) γραμμές τάσης στο γράφημα.

    Χρησιμοποιώντας τις εξισώσεις γραμμής τάσης, λάβετε πίνακες για τα κέρδη της επιχείρησης για κάθε γραμμή τάσης για την περίοδο 1995-2004.

    Κάντε μια πρόβλεψη κερδών για την επιχείρηση για το 2003 και το 2004.

Η λύση του προβλήματος

    Στην περιοχή των κελιών A4:C11 του φύλλου εργασίας του Excel, εισάγουμε το φύλλο εργασίας που φαίνεται στην Εικ. τέσσερα.

    Έχοντας επιλέξει το εύρος των κελιών B4:C11, κατασκευάζουμε ένα γράφημα.

    Ενεργοποιούμε το κατασκευασμένο γράφημα και, χρησιμοποιώντας τη μέθοδο που περιγράφεται παραπάνω, αφού επιλέξουμε τον τύπο γραμμής τάσης στο πλαίσιο διαλόγου Γραμμή τάσης (βλ. Εικ. 1), προσθέτουμε εναλλάξ γραμμικές, τετραγωνικές και κυβικές γραμμές τάσης στο γράφημα. Στο ίδιο παράθυρο διαλόγου, ανοίξτε την καρτέλα Παράμετροι (βλ. Εικ. 2), στο Όνομα του πεδίου προσεγγιστικής (εξομαλυνόμενης) καμπύλης, εισαγάγετε το όνομα της τάσης που θα προστεθεί και στο πεδίο Πρόβλεψη προς τα εμπρός για: περιόδους, ορίστε την τιμή 2, αφού σχεδιάζεται να γίνει πρόβλεψη κερδών για τα επόμενα δύο χρόνια. Για να εμφανίσετε την εξίσωση παλινδρόμησης και την τιμή της αξιοπιστίας προσέγγισης R2 στην περιοχή του διαγράμματος, ενεργοποιήστε τα πλαίσια ελέγχου Εμφάνιση της εξίσωσης στην οθόνη και τοποθετήστε την τιμή της αξιοπιστίας προσέγγισης (R^2) στο διάγραμμα. Για καλύτερη οπτική αντίληψη, αλλάζουμε τον τύπο, το χρώμα και το πάχος των γραμμών τάσης, για τις οποίες χρησιμοποιούμε την καρτέλα Προβολή του πλαισίου διαλόγου Μορφή γραμμής τάσης (βλ. Εικ. 3). Το διάγραμμα που προκύπτει με τις προστιθέμενες γραμμές τάσης φαίνεται στο σχ. 5.

    Για να λάβετε πίνακες για τα κέρδη της επιχείρησης για κάθε γραμμή τάσης για την περίοδο 1995-2004. Ας χρησιμοποιήσουμε τις εξισώσεις των γραμμών τάσης που παρουσιάζονται στο σχ. 5. Για να το κάνετε αυτό, στα κελιά της περιοχής D3:F3, εισαγάγετε πληροφορίες κειμένου σχετικά με τον τύπο της επιλεγμένης γραμμής τάσης: Γραμμική τάση, Τετραγωνική τάση, Κυβική τάση. Στη συνέχεια, εισαγάγετε τον τύπο γραμμικής παλινδρόμησης στο κελί D4 και, χρησιμοποιώντας τον δείκτη πλήρωσης, αντιγράψτε αυτόν τον τύπο με σχετικές αναφορές στην περιοχή των κελιών D5:D13. Πρέπει να σημειωθεί ότι κάθε κελί με τύπο γραμμικής παλινδρόμησης από την περιοχή των κελιών D4:D13 έχει ως όρισμα ένα αντίστοιχο κελί από την περιοχή A4:A13. Ομοίως, για την τετραγωνική παλινδρόμηση, η περιοχή κελιών E4:E13 συμπληρώνεται και για την κυβική παλινδρόμηση, η περιοχή κελιών F4:F13 συμπληρώνεται. Έτσι, έγινε πρόβλεψη για τα κέρδη της επιχείρησης για το 2003 και το 2004. με τρεις τάσεις. Ο πίνακας τιμών που προκύπτει φαίνεται στο σχ. 6.

Εργασία 2

    Κατασκευάστε ένα γράφημα.

    Προσθέστε λογαριθμικές, εκθετικές και εκθετικές γραμμές τάσης στο γράφημα.

    Εξάγετε τις εξισώσεις των ληφθέντων γραμμών τάσης, καθώς και τις τιμές της αξιοπιστίας προσέγγισης R2 για καθεμία από αυτές.

    Χρησιμοποιώντας τις εξισώσεις της γραμμής τάσης, λάβετε δεδομένα σε πίνακα για τα κέρδη της επιχείρησης για κάθε γραμμή τάσης για την περίοδο 1995-2002.

    Κάντε μια πρόβλεψη κερδών για την επιχείρηση για το 2003 και το 2004 χρησιμοποιώντας αυτές τις γραμμές τάσης.

Η λύση του προβλήματος

Ακολουθώντας τη μεθοδολογία που δίνεται στην επίλυση του προβλήματος 1, λαμβάνουμε ένα διάγραμμα με πρόσθετες λογαριθμικές, εκθετικές και εκθετικές γραμμές τάσης (Εικ. 7). Περαιτέρω, χρησιμοποιώντας τις ληφθείσες εξισώσεις γραμμής τάσης, συμπληρώνουμε τον πίνακα τιμών για το κέρδος της επιχείρησης, συμπεριλαμβανομένων των προβλεπόμενων τιμών για το 2003 και το 2004. (Εικ. 8).

Στο σχ. 5 και εικ. φαίνεται ότι το μοντέλο με λογαριθμική τάση αντιστοιχεί στη χαμηλότερη τιμή της αξιοπιστίας προσέγγισης

R2 = 0,8659

Οι υψηλότερες τιμές του R2 αντιστοιχούν σε μοντέλα με πολυωνυμική τάση: τετραγωνικό (R2 = 0,9263) και κυβικό (R2 = 0,933).

Εργασία 3

Με έναν πίνακα δεδομένων για τα κέρδη μιας επιχείρησης μηχανοκίνητων μεταφορών για την περίοδο 1995-2002, που δίνεται στην εργασία 1, πρέπει να εκτελέσετε τα ακόλουθα βήματα.

    Λάβετε σειρές δεδομένων για γραμμικές και εκθετικές γραμμές τάσης χρησιμοποιώντας τις συναρτήσεις TREND και GROW.

    Χρησιμοποιώντας τις συναρτήσεις TREND και GROWTH, κάντε μια πρόβλεψη κερδών για την επιχείρηση για το 2003 και το 2004.

    Για τα αρχικά δεδομένα και τις λαμβανόμενες σειρές δεδομένων, κατασκευάστε ένα διάγραμμα.

Η λύση του προβλήματος

Ας χρησιμοποιήσουμε το φύλλο εργασίας της εργασίας 1 (βλ. Εικ. 4). Ας ξεκινήσουμε με τη συνάρτηση TREND:

    επιλέξτε το εύρος των κελιών D4:D11, το οποίο θα πρέπει να συμπληρωθεί με τις τιμές της συνάρτησης TREND που αντιστοιχούν στα γνωστά δεδομένα για το κέρδος της επιχείρησης.

    καλέστε την εντολή Function από το μενού Insert. Στο παράθυρο διαλόγου Function Wizard που εμφανίζεται, επιλέξτε τη συνάρτηση TREND από την κατηγορία Statistical και, στη συνέχεια, κάντε κλικ στο κουμπί OK. Η ίδια λειτουργία μπορεί να πραγματοποιηθεί πατώντας το κουμπί (Λειτουργία Εισαγωγής) της τυπικής γραμμής εργαλείων.

    Στο παράθυρο διαλόγου Επιχειρήματα συνάρτησης που εμφανίζεται, εισαγάγετε την περιοχή των κελιών C4:C11 στο πεδίο Known_values_y. στο πεδίο Known_values_x - το εύρος των κελιών B4:B11;

    για να κάνετε τον τύπο που εισάγατε σε τύπο πίνακα, χρησιμοποιήστε τον συνδυασμό πλήκτρων + + .

Ο τύπος που πληκτρολογήσαμε στη γραμμή τύπων θα μοιάζει με: =(TREND(C4:C11;B4:B11)).

Ως αποτέλεσμα, η περιοχή των κελιών D4:D11 γεμίζει με τις αντίστοιχες τιμές της συνάρτησης TREND (Εικ. 9).

Να γίνει πρόβλεψη των κερδών της εταιρείας για το 2003 και το 2004. απαραίτητη:

    επιλέξτε την περιοχή των κελιών D12:D13, όπου θα εισαχθούν οι τιμές που προβλέπονται από τη συνάρτηση TREND.

    καλέστε τη συνάρτηση TREND και στο πλαίσιο διαλόγου Function Arguments που εμφανίζεται, εισαγάγετε στο πεδίο Known_values_y - το εύρος των κελιών C4:C11; στο πεδίο Known_values_x - το εύρος των κελιών B4:B11; και στο πεδίο New_values_x - το εύρος των κελιών B12:B13.

    μετατρέψτε αυτόν τον τύπο σε τύπο πίνακα χρησιμοποιώντας τη συντόμευση πληκτρολογίου Ctrl + Shift + Enter.

    Ο τύπος που εισαγάγατε θα μοιάζει με: =(TREND(C4:C11;B4:B11;B12:B13)), και η περιοχή των κελιών D12:D13 θα γεμίσει με τις προβλεπόμενες τιμές της συνάρτησης TREND (βλ. 9).

Ομοίως, μια σειρά δεδομένων συμπληρώνεται χρησιμοποιώντας τη συνάρτηση GROWTH, η οποία χρησιμοποιείται στην ανάλυση μη γραμμικών εξαρτήσεων και λειτουργεί ακριβώς όπως η γραμμική αντίστοιχη TREND.

Το Σχήμα 10 δείχνει τον πίνακα σε λειτουργία εμφάνισης τύπου.

Για τα αρχικά δεδομένα και τις λαμβανόμενες σειρές δεδομένων, το διάγραμμα που φαίνεται στην εικ. έντεκα.

Εργασία 4

Με πίνακα στοιχείων παραλαβής αιτήσεων για υπηρεσίες από την υπηρεσία αποστολής αυτοκινητοβιομηχανίας για την περίοδο από την 1η έως την 11η ημέρα του τρέχοντος μήνα, πρέπει να γίνουν οι ακόλουθες ενέργειες.

    Λήψη σειρών δεδομένων για γραμμική παλινδρόμηση: χρησιμοποιώντας τις συναρτήσεις SLOPE και INTERCEPT. χρησιμοποιώντας τη συνάρτηση LINEST.

    Ανακτήστε μια σειρά δεδομένων για εκθετική παλινδρόμηση χρησιμοποιώντας τη συνάρτηση LYFFPRIB.

    Χρησιμοποιώντας τις παραπάνω λειτουργίες, κάντε μια πρόβλεψη σχετικά με την παραλαβή των αιτήσεων στην υπηρεσία αποστολής για την περίοδο από 12 έως 14 του τρέχοντος μήνα.

    Για την αρχική και τη ληφθείσα σειρά δεδομένων, κατασκευάστε ένα διάγραμμα.

Η λύση του προβλήματος

Σημειώστε ότι, σε αντίθεση με τις συναρτήσεις TREND και GROW, καμία από τις συναρτήσεις που αναφέρονται παραπάνω (SLOPE, INTERCEPTION, LINEST, LGRFPRIB) δεν είναι παλινδρόμηση. Αυτές οι συναρτήσεις παίζουν μόνο βοηθητικό ρόλο, καθορίζοντας τις απαραίτητες παραμέτρους παλινδρόμησης.

Για γραμμικές και εκθετικές παλινδρομήσεις που κατασκευάζονται με τις συναρτήσεις SLOPE, INTERCEPT, LINEST, LGRFPRIB, η εμφάνιση των εξισώσεών τους είναι πάντα γνωστή, σε αντίθεση με τις γραμμικές και εκθετικές παλινδρομήσεις που αντιστοιχούν στις συναρτήσεις TREND και GROWTH.

1 . Ας οικοδομήσουμε μια γραμμική παλινδρόμηση που έχει την εξίσωση:

y=mx+b

χρησιμοποιώντας τις συναρτήσεις SLOPE και INTERCEPT, με την κλίση της παλινδρόμησης m να καθορίζεται από τη συνάρτηση SLOPE και τον σταθερό όρο b - από τη συνάρτηση INTERCEPT.

Για να γίνει αυτό, εκτελούμε τις ακόλουθες ενέργειες:

    εισαγάγετε τον πίνακα προέλευσης στην περιοχή των κελιών A4:B14.

    η τιμή της παραμέτρου m θα καθοριστεί στο κελί C19. Επιλέξτε από την κατηγορία Στατιστική τη συνάρτηση Slope. Εισαγάγετε την περιοχή των κελιών B4:B14 στο πεδίο γνωστές_τιμές_y και την περιοχή των κελιών A4:A14 στο πεδίο γνωστές_τιμές_x. Ο τύπος θα εισαχθεί στο κελί C19: =SLOPE(B4:B14;A4:A14);

    χρησιμοποιώντας παρόμοια μέθοδο, προσδιορίζεται η τιμή της παραμέτρου b στο κελί D19. Και το περιεχόμενό του θα μοιάζει με αυτό: = INTERCEPT(B4:B14;A4:A14). Έτσι, οι τιμές των παραμέτρων m και b, που είναι απαραίτητες για την κατασκευή μιας γραμμικής παλινδρόμησης, θα αποθηκευτούν, αντίστοιχα, στα κελιά C19, D19.

    τότε εισάγουμε τον τύπο γραμμικής παλινδρόμησης στο κελί C4 με τη μορφή: = $ C * A4 + $ D. Σε αυτόν τον τύπο, τα κελιά C19 και D19 γράφονται με απόλυτες αναφορές (η διεύθυνση κελιού δεν πρέπει να αλλάζει με πιθανή αντιγραφή). Το απόλυτο σύμβολο αναφοράς $ μπορεί να πληκτρολογηθεί είτε από το πληκτρολόγιο είτε χρησιμοποιώντας το πλήκτρο F4, αφού τοποθετήσετε τον κέρσορα στη διεύθυνση του κελιού. Χρησιμοποιώντας τη λαβή πλήρωσης, αντιγράψτε αυτόν τον τύπο στην περιοχή των κελιών C4:C17. Λαμβάνουμε την επιθυμητή σειρά δεδομένων (Εικ. 12). Λόγω του γεγονότος ότι ο αριθμός των αιτημάτων είναι ακέραιος, θα πρέπει να ορίσετε τη μορφή αριθμού στην καρτέλα Αριθμός του παραθύρου Μορφή κελιού με τον αριθμό των δεκαδικών ψηφίων στο 0.

2 . Τώρα ας οικοδομήσουμε μια γραμμική παλινδρόμηση που δίνεται από την εξίσωση:

y=mx+b

χρησιμοποιώντας τη συνάρτηση LINEST.

Για αυτό:

    εισαγάγετε τη συνάρτηση LINEST ως τύπο πίνακα στην περιοχή των κελιών C20:D20: =(LINEST(B4:B14;A4:A14)). Ως αποτέλεσμα, παίρνουμε την τιμή της παραμέτρου m στο κελί C20 και την τιμή της παραμέτρου b στο κελί D20.

    Εισαγάγετε τον τύπο στο κελί D4: =$C*A4+$D;

    αντιγράψτε αυτόν τον τύπο χρησιμοποιώντας τον δείκτη πλήρωσης στην περιοχή των κελιών D4:D17 και λάβετε την επιθυμητή σειρά δεδομένων.

3 . Κατασκευάζουμε μια εκθετική παλινδρόμηση που έχει την εξίσωση:

με τη βοήθεια της συνάρτησης LGRFPRIBL, εκτελείται παρόμοια:

    στην περιοχή των κελιών C21:D21, εισαγάγετε τη συνάρτηση LGRFPRIBL ως τύπο πίνακα: =( LGRFPRIBL (B4:B14;A4:A14)). Σε αυτήν την περίπτωση, η τιμή της παραμέτρου m θα προσδιοριστεί στο κελί C21 και η τιμή της παραμέτρου b θα καθοριστεί στο κελί D21.

    ο τύπος εισάγεται στο κελί E4: =$D*$C^A4;

    χρησιμοποιώντας τον δείκτη πλήρωσης, αυτός ο τύπος αντιγράφεται στην περιοχή των κελιών E4:E17, όπου θα βρίσκεται η σειρά δεδομένων για την εκθετική παλινδρόμηση (βλ. Εικ. 12).

Στο σχ. Το 13 δείχνει έναν πίνακα όπου μπορούμε να δούμε τις συναρτήσεις που χρησιμοποιούμε με τις απαραίτητες περιοχές κελιών, καθώς και τύπους.

αξία R 2 που ονομάζεται συντελεστή προσδιορισμού.

Το καθήκον της κατασκευής μιας εξάρτησης παλινδρόμησης είναι να βρεθεί το διάνυσμα των συντελεστών m του μοντέλου (1) στο οποίο ο συντελεστής R παίρνει τη μέγιστη τιμή.

Για να εκτιμηθεί η σημασία του R, χρησιμοποιείται το Fisher's F-test, που υπολογίζεται με τον τύπο

όπου n- μέγεθος δείγματος (αριθμός πειραμάτων).

k είναι ο αριθμός των συντελεστών του μοντέλου.

Εάν το F υπερβαίνει κάποια κρίσιμη τιμή για τα δεδομένα nκαι κκαι το αποδεκτό επίπεδο εμπιστοσύνης, τότε η τιμή του R θεωρείται σημαντική. Οι πίνακες των κρίσιμων τιμών του F δίνονται σε βιβλία αναφοράς για μαθηματικές στατιστικές.

Έτσι, η σημασία του R καθορίζεται όχι μόνο από την τιμή του, αλλά και από την αναλογία μεταξύ του αριθμού των πειραμάτων και του αριθμού των συντελεστών (παραμέτρων) του μοντέλου. Πράγματι, ο λόγος συσχέτισης για n=2 για ένα απλό γραμμικό μοντέλο είναι 1 (μέσω 2 σημείων στο επίπεδο, μπορείτε πάντα να σχεδιάσετε μια ευθεία γραμμή). Ωστόσο, εάν τα πειραματικά δεδομένα είναι τυχαίες μεταβλητές, μια τέτοια τιμή του R θα πρέπει να είναι αξιόπιστη με μεγάλη προσοχή. Συνήθως, για να ληφθεί μια σημαντική R και αξιόπιστη παλινδρόμηση, στοχεύει να διασφαλιστεί ότι ο αριθμός των πειραμάτων υπερβαίνει σημαντικά τον αριθμό των συντελεστών του μοντέλου (n>k).

Για να δημιουργήσετε ένα μοντέλο γραμμικής παλινδρόμησης, πρέπει:

1) ετοιμάστε μια λίστα n σειρών και m στηλών που περιέχουν τα πειραματικά δεδομένα (στήλη που περιέχει την τιμή εξόδου Υπρέπει να είναι είτε πρώτος είτε τελευταίος στη λίστα). για παράδειγμα, ας πάρουμε τα δεδομένα της προηγούμενης εργασίας, προσθέτοντας μια στήλη που ονομάζεται "αριθμός περιόδου", αριθμώντας τους αριθμούς των περιόδων από το 1 έως το 12. (αυτές θα είναι οι τιμές Χ)

2) μεταβείτε στο μενού Δεδομένα/Ανάλυση δεδομένων/Ανάλυση

Εάν λείπει το στοιχείο "Ανάλυση δεδομένων" στο μενού "Εργαλεία", τότε θα πρέπει να μεταβείτε στο στοιχείο "Πρόσθετα" του ίδιου μενού και να επιλέξετε το πλαίσιο "Πακέτο ανάλυσης".

3) στο πλαίσιο διαλόγου "Προσφορά", ορίστε:

διάστημα εισόδου Y;

διάστημα εισόδου X;

διάστημα εξόδου - το επάνω αριστερό κελί του διαστήματος στο οποίο θα τοποθετηθούν τα αποτελέσματα υπολογισμού (συνιστάται να το τοποθετήσετε σε νέο φύλλο εργασίας).

4) Κάντε κλικ στο "Ok" και αναλύστε τα αποτελέσματα.

Η ουσία της μεθόδου έγκειται στο γεγονός ότι το κριτήριο για την ποιότητα της εξεταζόμενης λύσης είναι το άθροισμα των τετραγωνικών σφαλμάτων, το οποίο επιδιώκεται να ελαχιστοποιηθεί. Για να εφαρμοστεί αυτό, απαιτείται να πραγματοποιηθούν όσο το δυνατόν περισσότερες μετρήσεις μιας άγνωστης τυχαίας μεταβλητής (όσο περισσότερες - τόσο μεγαλύτερη είναι η ακρίβεια της λύσης) και ένα συγκεκριμένο σύνολο αναμενόμενων λύσεων, από τις οποίες απαιτείται η επιλογή της καλύτερης . Εάν το σύνολο των λύσεων είναι παραμετροποιημένο, τότε πρέπει να βρεθεί η βέλτιστη τιμή των παραμέτρων.

Γιατί ελαχιστοποιούνται τα τετράγωνα σφαλμάτων και όχι τα ίδια τα σφάλματα; Το γεγονός είναι ότι στις περισσότερες περιπτώσεις συμβαίνουν σφάλματα και προς τις δύο κατευθύνσεις: η εκτίμηση μπορεί να είναι μεγαλύτερη από τη μέτρηση ή μικρότερη από αυτήν. Εάν προσθέσουμε σφάλματα με διαφορετικά πρόσημα, τότε θα ακυρωθούν μεταξύ τους και ως αποτέλεσμα, το άθροισμα θα μας δώσει μια εσφαλμένη ιδέα για την ποιότητα της εκτίμησης. Συχνά, για να έχει η τελική εκτίμηση την ίδια διάσταση με τις μετρούμενες τιμές, η τετραγωνική ρίζα λαμβάνεται από το άθροισμα των τετραγωνικών σφαλμάτων.


Μια φωτογραφία:

Το LSM χρησιμοποιείται στα μαθηματικά, ιδίως - στη θεωρία πιθανοτήτων και στη μαθηματική στατιστική. Αυτή η μέθοδος έχει τη μεγαλύτερη εφαρμογή σε προβλήματα φιλτραρίσματος, όταν είναι απαραίτητο να διαχωριστεί το χρήσιμο σήμα από τον θόρυβο που υπερτίθεται σε αυτό.

Χρησιμοποιείται επίσης στη μαθηματική ανάλυση για μια κατά προσέγγιση αναπαράσταση μιας δεδομένης συνάρτησης με απλούστερες συναρτήσεις. Ένας άλλος τομέας εφαρμογής του LSM είναι η επίλυση συστημάτων εξισώσεων με λιγότερα άγνωστα από τον αριθμό των εξισώσεων.

Κατέληξα σε μερικές ακόμη πολύ απροσδόκητες εφαρμογές του LSM, για τις οποίες θα ήθελα να μιλήσω σε αυτό το άρθρο.

MNC και τυπογραφικά λάθη

Τα τυπογραφικά και τα ορθογραφικά λάθη είναι η μάστιγα των αυτόματων μεταφραστών και των μηχανών αναζήτησης. Πράγματι, εάν η λέξη διαφέρει μόνο κατά 1 γράμμα, το πρόγραμμα τη θεωρεί ως άλλη λέξη και τη μεταφράζει/αναζητά λάθος ή δεν τη μεταφράζει/δεν τη βρίσκει καθόλου.

Είχα ένα παρόμοιο πρόβλημα: υπήρχαν δύο βάσεις δεδομένων με διευθύνσεις σπιτιών της Μόσχας και έπρεπε να συνδυαστούν σε μία. Αλλά οι διευθύνσεις ήταν γραμμένες με διαφορετικό ύφος. Σε μια βάση δεδομένων υπήρχε το πρότυπο KLADR (All-Russian address classifier), για παράδειγμα: "BABUSHKINA PILOT UL., D10K3". Και σε μια άλλη βάση δεδομένων υπήρχε ένα ταχυδρομικό στυλ, για παράδειγμα: «St. Pilot Babushkin, σπίτι 10, κτίριο 3. Φαίνεται ότι δεν υπάρχουν σφάλματα και στις δύο περιπτώσεις και η αυτοματοποίηση της διαδικασίας είναι απίστευτα δύσκολη (κάθε βάση δεδομένων έχει 40.000 εγγραφές!). Αν και υπήρχαν αρκετά τυπογραφικά λάθη... Πώς να καταλάβω ο υπολογιστής ότι οι 2 παραπάνω διευθύνσεις ανήκουν στο ίδιο σπίτι; Αυτό είναι όπου το MNC ήταν χρήσιμο για μένα.

Τι έκανα? Έχοντας βρει το επόμενο γράμμα στην πρώτη διεύθυνση, αναζήτησα το ίδιο γράμμα στη δεύτερη διεύθυνση. Αν ήταν και οι δύο στο ίδιο σημείο, τότε υπέθεσα ότι το σφάλμα για αυτό το γράμμα ήταν 0. Εάν ήταν σε γειτονικές θέσεις, τότε το σφάλμα ήταν 1. Εάν υπήρχε μετατόπιση κατά 2 θέσεις, το σφάλμα ήταν 2, και ούτω καθεξής Εάν δεν υπήρχε καθόλου τέτοιο γράμμα στην άλλη διεύθυνση, τότε το σφάλμα θεωρήθηκε ότι είναι n+1, όπου n είναι ο αριθμός των γραμμάτων στην 1η διεύθυνση. Έτσι, υπολόγισα το άθροισμα των τετραγωνικών σφαλμάτων και συνέδεσα εκείνες τις εγγραφές στις οποίες αυτό το άθροισμα ήταν ελάχιστο.

Φυσικά, οι αριθμοί των σπιτιών και των κτιρίων επεξεργάστηκαν ξεχωριστά. Δεν ξέρω αν έφτιαξα ένα άλλο «ποδήλατο» ή όντως ήταν, αλλά το πρόβλημα λύθηκε γρήγορα και αποτελεσματικά. Αναρωτιέμαι αν αυτή η μέθοδος χρησιμοποιείται στις μηχανές αναζήτησης; Ίσως χρησιμοποιείται, αφού κάθε μηχανή αναζήτησης που σέβεται τον εαυτό του, όταν συναντά μια άγνωστη λέξη, προσφέρει μια αντικατάσταση από γνωστές λέξεις ("ίσως εννοούσες ..."). Ωστόσο, μπορούν να κάνουν αυτήν την ανάλυση κάπως διαφορετικά.

OLS και αναζήτηση με εικόνες, πρόσωπα και χάρτες

Αυτή η μέθοδος μπορεί επίσης να εφαρμοστεί για αναζήτηση με εικόνες, σχέδια, χάρτες, ακόμα και με πρόσωπα ανθρώπων.

Μια φωτογραφία:

Τώρα όλες οι μηχανές αναζήτησης, αντί να κάνουν αναζήτηση με εικόνες, στην πραγματικότητα, χρησιμοποιούν την αναζήτηση με λεζάντες εικόνων. Αυτή είναι αναμφίβολα μια χρήσιμη και βολική υπηρεσία, αλλά προτείνω να τη συμπληρώσετε με μια πραγματική αναζήτηση εικόνων.

Εισάγεται ένα δείγμα εικόνας και γίνεται μια βαθμολογία για όλες τις εικόνες με το άθροισμα των τετραγωνικών αποκλίσεων των χαρακτηριστικών σημείων. Ο προσδιορισμός αυτών των πολύ χαρακτηριστικών σημείων είναι από μόνος του ένα μη τετριμμένο έργο. Ωστόσο, είναι αρκετά επιλύσιμο: για παράδειγμα, για τα πρόσωπα, αυτές είναι οι γωνίες των ματιών, τα χείλη, η άκρη της μύτης, τα ρουθούνια, οι άκρες και τα κέντρα των φρυδιών, οι κόρες των ματιών κ.λπ.

Συγκρίνοντας αυτές τις παραμέτρους, μπορείτε να βρείτε ένα πρόσωπο που μοιάζει περισσότερο με το δείγμα. Έχω ήδη δει ιστότοπους όπου λειτουργεί μια τέτοια υπηρεσία και μπορείτε να βρείτε μια διασημότητα που μοιάζει περισσότερο με τη φωτογραφία που προτείνατε, ακόμη και να συνθέσετε ένα animation που σας μετατρέπει σε διασημότητα και πίσω. Σίγουρα η ίδια μέθοδος λειτουργεί και στις βάσεις του Υπουργείου Εσωτερικών, με ταυτόσημες εικόνες εγκληματιών.

Φωτογραφία: pixabay.com

Ναι, και τα δακτυλικά αποτυπώματα μπορούν να αναζητηθούν με τον ίδιο τρόπο. Η αναζήτηση χάρτη επικεντρώνεται στις φυσικές ανωμαλίες των γεωγραφικών αντικειμένων - τις στροφές των ποταμών, τις οροσειρές, τα περιγράμματα των ακτών, τα δάση και τα χωράφια.

Εδώ είναι μια τόσο υπέροχη και ευέλικτη μέθοδος OLS. Είμαι βέβαιος ότι εσείς, αγαπητοί αναγνώστες, θα μπορείτε να βρείτε πολλές ασυνήθιστες και απροσδόκητες εφαρμογές αυτής της μεθόδου για τον εαυτό σας.

Έχει πολλές εφαρμογές, καθώς επιτρέπει μια κατά προσέγγιση αναπαράσταση μιας δεδομένης συνάρτησης από άλλες απλούστερες. Το LSM μπορεί να είναι εξαιρετικά χρήσιμο στην επεξεργασία των παρατηρήσεων και χρησιμοποιείται ενεργά για την εκτίμηση ορισμένων ποσοτήτων από τα αποτελέσματα μετρήσεων άλλων που περιέχουν τυχαία σφάλματα. Σε αυτό το άρθρο, θα μάθετε πώς να εφαρμόζετε υπολογισμούς ελαχίστων τετραγώνων στο Excel.

Δήλωση του προβλήματος σε συγκεκριμένο παράδειγμα

Ας υποθέσουμε ότι υπάρχουν δύο δείκτες X και Y. Επιπλέον, το Y εξαρτάται από το X. Επειδή το OLS μας ενδιαφέρει από την άποψη της ανάλυσης παλινδρόμησης (στο Excel, οι μέθοδοι του υλοποιούνται χρησιμοποιώντας ενσωματωμένες συναρτήσεις), θα πρέπει να προχωρήσουμε αμέσως να εξετάσει ένα συγκεκριμένο πρόβλημα.

Έτσι, έστω X η περιοχή πώλησης ενός παντοπωλείου, μετρημένη σε τετραγωνικά μέτρα, και Y είναι ο ετήσιος κύκλος εργασιών, που ορίζεται σε εκατομμύρια ρούβλια.

Απαιτείται να γίνει πρόβλεψη για το τι τζίρο (Υ) θα έχει το κατάστημα αν έχει τον έναν ή τον άλλο χώρο λιανικής. Προφανώς, η συνάρτηση Y = f (X) αυξάνεται, αφού η υπεραγορά πουλάει περισσότερα αγαθά από το περίπτερο.

Λίγα λόγια για την ορθότητα των αρχικών δεδομένων που χρησιμοποιούνται για την πρόβλεψη

Ας υποθέσουμε ότι έχουμε έναν πίνακα κατασκευασμένο με δεδομένα για n καταστήματα.

Σύμφωνα με τις μαθηματικές στατιστικές, τα αποτελέσματα θα είναι λίγο πολύ σωστά εάν εξεταστούν τα δεδομένα για τουλάχιστον 5-6 αντικείμενα. Επίσης, δεν μπορούν να χρησιμοποιηθούν «ανώμαλα» αποτελέσματα. Συγκεκριμένα, μια ελίτ μικρή μπουτίκ μπορεί να έχει τζίρο πολλαπλάσιο από τον τζίρο μεγάλων καταστημάτων της κατηγορίας «masmarket».

Η ουσία της μεθόδου

Τα δεδομένα του πίνακα μπορούν να εμφανιστούν στο καρτεσιανό επίπεδο ως σημεία M 1 (x 1, y 1), ... M n (x n, y n). Τώρα η λύση του προβλήματος θα περιοριστεί στην επιλογή μιας προσεγγιστικής συνάρτησης y = f (x), η οποία έχει μια γραφική παράσταση που περνά όσο το δυνατόν πιο κοντά στα σημεία M 1, M 2, .. M n .

Φυσικά, μπορείτε να χρησιμοποιήσετε ένα πολυώνυμο υψηλού βαθμού, αλλά αυτή η επιλογή δεν είναι μόνο δύσκολη στην εφαρμογή, αλλά απλά λανθασμένη, καθώς δεν θα αντικατοπτρίζει την κύρια τάση που πρέπει να εντοπιστεί. Η πιο λογική λύση είναι να αναζητήσετε μια ευθεία γραμμή y = ax + b, η οποία προσεγγίζει καλύτερα τα πειραματικά δεδομένα, και πιο συγκεκριμένα, τους συντελεστές - a και b.

Βαθμολογία ακρίβειας

Για κάθε προσέγγιση, ιδιαίτερη σημασία έχει η εκτίμηση της ακρίβειάς της. Σημειώστε με e i τη διαφορά (απόκλιση) μεταξύ των λειτουργικών και πειραματικών τιμών για το σημείο x i, δηλ. e i = y i - f (x i).

Προφανώς, για να αξιολογήσετε την ακρίβεια της προσέγγισης, μπορείτε να χρησιμοποιήσετε το άθροισμα των αποκλίσεων, δηλ., όταν επιλέγετε μια ευθεία γραμμή για μια κατά προσέγγιση αναπαράσταση της εξάρτησης του X από το Y, θα πρέπει να προτιμάτε αυτή που έχει τη μικρότερη τιμή το άθροισμα e i σε όλα τα υπό εξέταση σημεία. Ωστόσο, δεν είναι όλα τόσο απλά, αφού μαζί με τις θετικές αποκλίσεις, πρακτικά θα υπάρχουν και αρνητικές.

Μπορείτε να λύσετε το πρόβλημα χρησιμοποιώντας τις μονάδες απόκλισης ή τα τετράγωνά τους. Η τελευταία μέθοδος είναι η πιο ευρέως χρησιμοποιούμενη. Χρησιμοποιείται σε πολλούς τομείς, συμπεριλαμβανομένης της ανάλυσης παλινδρόμησης (στο Excel, η εφαρμογή του πραγματοποιείται χρησιμοποιώντας δύο ενσωματωμένες συναρτήσεις) και έχει αποδειχθεί από καιρό ότι είναι αποτελεσματική.

Μέθοδος ελάχιστου τετραγώνου

Στο Excel, όπως γνωρίζετε, υπάρχει μια ενσωματωμένη λειτουργία αυτόματης άθροισης που σας επιτρέπει να υπολογίσετε τις τιμές όλων των τιμών που βρίσκονται στην επιλεγμένη περιοχή. Έτσι, τίποτα δεν θα μας εμποδίσει να υπολογίσουμε την τιμή της παράστασης (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Στη μαθηματική σημειογραφία, αυτό μοιάζει με:

Δεδομένου ότι αρχικά ελήφθη η απόφαση να γίνει προσέγγιση χρησιμοποιώντας μια ευθεία γραμμή, έχουμε:

Έτσι, το έργο της εύρεσης μιας ευθείας γραμμής που περιγράφει καλύτερα μια συγκεκριμένη σχέση μεταξύ X και Y ισοδυναμεί με τον υπολογισμό του ελάχιστου συνάρτησης δύο μεταβλητών:

Αυτό απαιτεί την εξίσωση με μηδέν μερικών παραγώγων σε σχέση με τις νέες μεταβλητές a και b και την επίλυση ενός αρχέγονου συστήματος που αποτελείται από δύο εξισώσεις με 2 άγνωστα της μορφής:

Μετά από απλούς μετασχηματισμούς, συμπεριλαμβανομένης της διαίρεσης με το 2 και του χειρισμού των αθροισμάτων, παίρνουμε:

Λύνοντάς το, για παράδειγμα, με τη μέθοδο του Cramer, λαμβάνουμε ένα ακίνητο σημείο με ορισμένους συντελεστές a * και b * . Αυτό είναι το ελάχιστο, δηλαδή για να προβλέψουμε τι τζίρο θα έχει το κατάστημα για μια συγκεκριμένη περιοχή, είναι κατάλληλη η ευθεία γραμμή y = a * x + b *, η οποία είναι ένα μοντέλο παλινδρόμησης για το εν λόγω παράδειγμα. Φυσικά, δεν θα σας επιτρέψει να βρείτε το ακριβές αποτέλεσμα, αλλά θα σας βοηθήσει να πάρετε μια ιδέα για το αν η αγορά ενός καταστήματος με πίστωση για μια συγκεκριμένη περιοχή θα αποδώσει.

Πώς να εφαρμόσετε τη μέθοδο των ελαχίστων τετραγώνων στο Excel

Το Excel έχει μια συνάρτηση για τον υπολογισμό της τιμής των ελαχίστων τετραγώνων. Έχει την εξής μορφή: TREND (γνωστές τιμές Y, γνωστές τιμές X, νέες τιμές X, σταθερά). Ας εφαρμόσουμε τον τύπο για τον υπολογισμό του OLS στο Excel στον πίνακά μας.

Για να το κάνετε αυτό, στο κελί στο οποίο θα πρέπει να εμφανίζεται το αποτέλεσμα του υπολογισμού με τη μέθοδο των ελαχίστων τετραγώνων στο Excel, εισαγάγετε το σύμβολο "=" και επιλέξτε τη συνάρτηση "TREND". Στο παράθυρο που ανοίγει, συμπληρώστε τα κατάλληλα πεδία, επισημαίνοντας:

  • εύρος γνωστών τιμών για το Y (σε αυτήν την περίπτωση δεδομένα για τον κύκλο εργασιών).
  • εύρος x 1 , …x n , δηλαδή το μέγεθος του χώρου λιανικής.
  • και γνωστές και άγνωστες τιμές του x, για τις οποίες πρέπει να μάθετε το μέγεθος του κύκλου εργασιών (για πληροφορίες σχετικά με τη θέση τους στο φύλλο εργασίας, δείτε παρακάτω).

Επιπλέον, υπάρχει μια λογική μεταβλητή "Const" στον τύπο. Εάν εισαγάγετε 1 στο πεδίο που αντιστοιχεί σε αυτό, τότε αυτό θα σημαίνει ότι πρέπει να πραγματοποιηθούν υπολογισμοί, με την προϋπόθεση ότι b \u003d 0.

Εάν πρέπει να γνωρίζετε την πρόβλεψη για περισσότερες από μία τιμές x, τότε μετά την εισαγωγή του τύπου, δεν πρέπει να πατήσετε "Enter", αλλά πρέπει να πληκτρολογήσετε τον συνδυασμό "Shift" + "Control" + "Enter" ("Enter" ) στο πληκτρολόγιο.

Μερικά Χαρακτηριστικά

Η ανάλυση παλινδρόμησης μπορεί να είναι προσβάσιμη ακόμη και σε ομοιώματα. Ο τύπος του Excel για την πρόβλεψη της τιμής ενός πίνακα άγνωστων μεταβλητών - "TREND" - μπορεί να χρησιμοποιηθεί ακόμα και από όσους δεν έχουν ακούσει ποτέ για τη μέθοδο των ελαχίστων τετραγώνων. Αρκεί μόνο να γνωρίζουμε κάποια χαρακτηριστικά της δουλειάς του. Συγκεκριμένα:

  • Εάν τοποθετήσετε το εύρος των γνωστών τιμών της μεταβλητής y σε μία γραμμή ή στήλη, τότε κάθε γραμμή (στήλη) με γνωστές τιμές x θα γίνει αντιληπτή από το πρόγραμμα ως ξεχωριστή μεταβλητή.
  • Εάν η περιοχή με γνωστό x δεν καθορίζεται στο παράθυρο TREND, τότε σε περίπτωση χρήσης της συνάρτησης στο Excel, το πρόγραμμα θα τη θεωρήσει ως πίνακα που αποτελείται από ακέραιους αριθμούς, ο αριθμός των οποίων αντιστοιχεί στο εύρος με τις δεδομένες τιμές της μεταβλητής y.
  • Για να εξάγετε έναν πίνακα "προβλεπόμενων" τιμών, η έκφραση τάσης πρέπει να εισαχθεί ως τύπος πίνακα.
  • Εάν δεν καθορίζονται νέες τιμές x, τότε η συνάρτηση TREND τις θεωρεί ίσες με τις γνωστές. Εάν δεν καθορίζονται, τότε ο πίνακας 1 λαμβάνεται ως όρισμα. 2; 3; 4;…, το οποίο είναι ανάλογο με το εύρος με τις ήδη δεδομένες παραμέτρους y.
  • Το εύρος που περιέχει τις νέες τιμές x πρέπει να έχει τις ίδιες ή περισσότερες σειρές ή στήλες με το εύρος με τις δεδομένες τιμές y. Με άλλα λόγια, πρέπει να είναι ανάλογη με τις ανεξάρτητες μεταβλητές.
  • Ένας πίνακας με γνωστές τιμές x μπορεί να περιέχει πολλές μεταβλητές. Ωστόσο, εάν μιλάμε μόνο για ένα, τότε απαιτείται οι περιοχές με τις δεδομένες τιμές των x και y να είναι ανάλογες. Στην περίπτωση πολλών μεταβλητών, είναι απαραίτητο το εύρος με τις δεδομένες τιμές y να χωράει σε μία στήλη ή μία γραμμή.

Λειτουργία FORECAST

Υλοποιείται χρησιμοποιώντας διάφορες λειτουργίες. Ένα από αυτά ονομάζεται «ΠΡΟΒΛΕΨΗ». Είναι παρόμοιο με το TREND, δηλαδή δίνει το αποτέλεσμα των υπολογισμών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Ωστόσο, μόνο για ένα Χ, για το οποίο η τιμή του Υ είναι άγνωστη.

Τώρα γνωρίζετε τους τύπους του Excel για ανδρείκελα που σας επιτρέπουν να προβλέψετε την τιμή της μελλοντικής τιμής ενός δείκτη σύμφωνα με μια γραμμική τάση.

Τα ελάχιστα τετράγωνα είναι μια μαθηματική διαδικασία για την κατασκευή μιας γραμμικής εξίσωσης που ταιριάζει καλύτερα σε ένα σύνολο διατεταγμένων ζευγών βρίσκοντας τιμές για τα a και b, τους συντελεστές στην ευθεία εξίσωση. Ο στόχος της μεθόδου των ελαχίστων τετραγώνων είναι να ελαχιστοποιήσει το συνολικό τετράγωνο σφάλμα μεταξύ των τιμών y και ŷ. Αν για κάθε σημείο προσδιορίσουμε το σφάλμα ŷ, η μέθοδος των ελαχίστων τετραγώνων ελαχιστοποιεί:

όπου n = αριθμός διατεταγμένων ζευγών γύρω από τη γραμμή. πιο σχετικό με τα δεδομένα.

Αυτή η έννοια απεικονίζεται στο Σχήμα

Κρίνοντας από το σχήμα, η γραμμή που ταιριάζει καλύτερα στα δεδομένα, η γραμμή παλινδρόμησης, ελαχιστοποιεί το συνολικό τετράγωνο σφάλμα των τεσσάρων σημείων του γραφήματος. Θα σας δείξω πώς να το προσδιορίσετε χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων στο ακόλουθο παράδειγμα.

Φανταστείτε ένα νεαρό ζευγάρι που ζει πρόσφατα μαζί και μοιράζεται ένα τραπέζι μπάνιου. Ο νεαρός άρχισε να παρατηρεί ότι το μισό τραπέζι του συρρικνώθηκε απαρέγκλιτα, χάνοντας έδαφος από τις μους μαλλιών και τα συμπλέγματα σόγιας. Τους τελευταίους μήνες, ο τύπος παρακολουθούσε στενά τον ρυθμό με τον οποίο αυξάνεται ο αριθμός των αντικειμένων στο τραπέζι της. Ο παρακάτω πίνακας δείχνει τον αριθμό των αντικειμένων που έχει το κορίτσι στο τραπέζι του μπάνιου που έχουν συσσωρευτεί τους τελευταίους μήνες.

Δεδομένου ότι ο στόχος μας είναι να μάθουμε εάν ο αριθμός των στοιχείων αυξάνεται με την πάροδο του χρόνου, ο "Μήνας" θα είναι η ανεξάρτητη μεταβλητή και ο "Αριθμός στοιχείων" θα είναι η εξαρτημένη μεταβλητή.

Χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, προσδιορίζουμε την εξίσωση που ταιριάζει καλύτερα στα δεδομένα υπολογίζοντας τις τιμές του a, του τμήματος στον άξονα y και του b, της κλίσης της γραμμής:

a = y cf - bx βλ

όπου x cf είναι η μέση τιμή του x, η ανεξάρτητη μεταβλητή, y cf είναι η μέση τιμή του y, η ανεξάρτητη μεταβλητή.

Ο παρακάτω πίνακας συνοψίζει τους υπολογισμούς που απαιτούνται για αυτές τις εξισώσεις.

Η καμπύλη εφέ για το παράδειγμα της μπανιέρας μας θα δοθεί από την ακόλουθη εξίσωση:

Δεδομένου ότι η εξίσωσή μας έχει θετική κλίση 0,976, ο τύπος έχει απόδειξη ότι ο αριθμός των αντικειμένων στο τραπέζι αυξάνεται με την πάροδο του χρόνου με μέσο ρυθμό 1 στοιχείο το μήνα. Το γράφημα δείχνει την καμπύλη εφέ με διατεταγμένα ζεύγη.

Ο αναμενόμενος αριθμός ειδών για το επόμενο εξάμηνο (μήνας 16) θα υπολογιστεί ως εξής:

ŷ = 5,13 + 0,976x = 5,13 + 0,976(16) ~ 20,7 = 21 στοιχεία

Ήρθε λοιπόν η ώρα για τον ήρωά μας να αναλάβει κάποια δράση.

Λειτουργία TREND στο Excel

Όπως ίσως έχετε μαντέψει, το Excel έχει μια συνάρτηση για τον υπολογισμό μιας τιμής μέθοδος ελαχίστων τετραγώνων.Αυτό το χαρακτηριστικό ονομάζεται TREND. Η σύνταξή του είναι η εξής:

TREND (γνωστές τιμές Y, γνωστές τιμές X, νέες τιμές X, const)

γνωστές τιμές του Y - ένας πίνακας εξαρτημένων μεταβλητών, στην περίπτωσή μας, ο αριθμός των στοιχείων στον πίνακα

γνωστές τιμές του X - ένας πίνακας ανεξάρτητων μεταβλητών, στην περίπτωσή μας είναι ένας μήνας

νέες τιμές Χ – νέες τιμές Χ (μήνας) για τις οποίες Λειτουργία TRENDεπιστρέφει την αναμενόμενη τιμή των εξαρτημένων μεταβλητών (αριθμός στοιχείων)

const - προαιρετικό. Μια Boolean τιμή που καθορίζει εάν η σταθερά b απαιτείται να είναι 0.

Για παράδειγμα, το σχήμα δείχνει τη συνάρτηση TREND που χρησιμοποιείται για τον προσδιορισμό του αναμενόμενου αριθμού αντικειμένων στο τραπέζι του μπάνιου για τον 16ο μήνα.

ΚΑΤΗΓΟΡΙΕΣ

Δημοφιλή ΑΡΘΡΑ

2022 "kingad.ru" - υπερηχογραφική εξέταση ανθρώπινων οργάνων