Λύση ελαχίστων τετραγώνων. Προσέγγιση πειραματικών δεδομένων. Μέθοδος ελαχίστων τετραγώνων. OLS στην περίπτωση γραμμικού μοντέλου

Παράδειγμα.

Πειραματικά δεδομένα για τις τιμές των μεταβλητών ΧΚαι στοδίνονται στον πίνακα.

Ως αποτέλεσμα της ευθυγράμμισής τους, προκύπτει η συνάρτηση

Χρησιμοποιώντας μέθοδος ελαχίστων τετραγώνων, προσεγγίστε αυτά τα δεδομένα με μια γραμμική εξάρτηση y=ax+b(βρες παραμέτρους ΕΝΑΚαι σι). Μάθετε ποια από τις δύο γραμμές (με την έννοια της μεθόδου των ελαχίστων τετραγώνων) ευθυγραμμίζει καλύτερα τα πειραματικά δεδομένα. Κάντε ένα σχέδιο.

Η ουσία της μεθόδου των ελαχίστων τετραγώνων (LSM).

Το καθήκον είναι να βρεθούν οι γραμμικοί συντελεστές εξάρτησης στους οποίους η συνάρτηση δύο μεταβλητών ΕΝΑΚαι σι παίρνει τη μικρότερη τιμή. Δοσμένο δηλαδή ΕΝΑΚαι σιτο άθροισμα των τετραγωνικών αποκλίσεων των πειραματικών δεδομένων από την ευθεία που βρέθηκε θα είναι το μικρότερο. Αυτό είναι το όλο νόημα της μεθόδου των ελαχίστων τετραγώνων.

Έτσι, η επίλυση του παραδείγματος καταλήγει στην εύρεση του άκρου μιας συνάρτησης δύο μεταβλητών.

Εξαγωγή τύπων εύρεσης συντελεστών.

Καταρτίζεται και λύνεται ένα σύστημα δύο εξισώσεων με δύο αγνώστους. Εύρεση μερικών παραγώγων μιας συνάρτησης σε σχέση με μεταβλητές ΕΝΑΚαι σι, εξισώνουμε αυτές τις παραγώγους με μηδέν.

Επιλύουμε το προκύπτον σύστημα εξισώσεων χρησιμοποιώντας οποιαδήποτε μέθοδο (για παράδειγμα με μέθοδο αντικατάστασηςή ) και λάβετε τύπους για την εύρεση συντελεστών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων (LSM).

Δεδομένος ΕΝΑΚαι σιλειτουργία παίρνει τη μικρότερη τιμή. Η απόδειξη αυτού του γεγονότος δίνεται.

Αυτή είναι η όλη μέθοδος των ελαχίστων τετραγώνων. Τύπος για την εύρεση της παραμέτρου έναπεριέχει τα αθροίσματα , , και την παράμετρο n- ποσότητα πειραματικών δεδομένων. Συνιστούμε τον υπολογισμό των τιμών αυτών των ποσών χωριστά. Συντελεστής σιβρέθηκε μετά τον υπολογισμό ένα.

Ήρθε η ώρα να θυμηθούμε το αρχικό παράδειγμα.

Διάλυμα.

Στο παράδειγμά μας n=5. Συμπληρώνουμε τον πίνακα για ευκολία στον υπολογισμό των ποσών που περιλαμβάνονται στους τύπους των απαιτούμενων συντελεστών.

Οι τιμές στην τέταρτη σειρά του πίνακα λαμβάνονται πολλαπλασιάζοντας τις τιμές της 2ης σειράς με τις τιμές της 3ης σειράς για κάθε αριθμό εγώ.

Οι τιμές στην πέμπτη σειρά του πίνακα λαμβάνονται με τον τετραγωνισμό των τιμών στη 2η σειρά για κάθε αριθμό εγώ.

Οι τιμές στην τελευταία στήλη του πίνακα είναι τα αθροίσματα των τιμών στις σειρές.

Χρησιμοποιούμε τους τύπους της μεθόδου των ελαχίστων τετραγώνων για να βρούμε τους συντελεστές ΕΝΑΚαι σι. Αντικαθιστούμε τις αντίστοιχες τιμές από την τελευταία στήλη του πίνακα σε αυτές:

Οθεν, y = 0,165x+2,184- την επιθυμητή προσεγγιστική ευθεία.

Μένει να μάθουμε ποια από τις γραμμές y = 0,165x+2,184ή προσεγγίζει καλύτερα τα αρχικά δεδομένα, δηλαδή εκτιμήσεις με τη μέθοδο των ελαχίστων τετραγώνων.

Εκτίμηση σφάλματος της μεθόδου των ελαχίστων τετραγώνων.

Για να γίνει αυτό, πρέπει να υπολογίσετε το άθροισμα των τετραγωνικών αποκλίσεων των αρχικών δεδομένων από αυτές τις γραμμές Και , μια μικρότερη τιμή αντιστοιχεί σε μια γραμμή που προσεγγίζει καλύτερα τα αρχικά δεδομένα με την έννοια της μεθόδου των ελαχίστων τετραγώνων.

Από τότε κατευθείαν y = 0,165x+2,184προσεγγίζει καλύτερα τα αρχικά δεδομένα.

Γραφική απεικόνιση της μεθόδου των ελαχίστων τετραγώνων (LS).

Τα πάντα είναι ορατά στα γραφήματα. Η κόκκινη γραμμή είναι η ευθεία που βρέθηκε y = 0,165x+2,184, η μπλε γραμμή είναι , οι ροζ κουκκίδες είναι τα αρχικά δεδομένα.

Γιατί χρειάζεται αυτό, γιατί όλες αυτές οι προσεγγίσεις;

Προσωπικά το χρησιμοποιώ για την επίλυση προβλημάτων εξομάλυνσης δεδομένων, παρεμβολής και προβλημάτων παρέκτασης (στο αρχικό παράδειγμα μπορεί να τους ζητηθεί να βρουν την τιμή μιας παρατηρούμενης τιμής yστο x=3ή πότε x=6χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων). Αλλά θα μιλήσουμε περισσότερα για αυτό αργότερα σε άλλη ενότητα του ιστότοπου.

Απόδειξη.

Έτσι όταν βρεθεί ΕΝΑΚαι σιη συνάρτηση παίρνει τη μικρότερη τιμή, είναι απαραίτητο σε αυτό το σημείο ο πίνακας της τετραγωνικής μορφής του διαφορικού δεύτερης τάξης για τη συνάρτηση ήταν θετική οριστική. Ας το δείξουμε.

Εάν μια ορισμένη φυσική ποσότητα εξαρτάται από μια άλλη ποσότητα, τότε αυτή η εξάρτηση μπορεί να μελετηθεί μετρώντας το y σε διαφορετικές τιμές του x. Ως αποτέλεσμα των μετρήσεων, λαμβάνονται ορισμένες τιμές:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Με βάση τα δεδομένα ενός τέτοιου πειράματος, είναι δυνατό να κατασκευαστεί ένα γράφημα της εξάρτησης y = ƒ(x). Η καμπύλη που προκύπτει καθιστά δυνατή την κρίση της μορφής της συνάρτησης ƒ(x). Ωστόσο, οι σταθεροί συντελεστές που εισέρχονται σε αυτή τη συνάρτηση παραμένουν άγνωστοι. Μπορούν να προσδιοριστούν χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Τα πειραματικά σημεία, κατά κανόνα, δεν βρίσκονται ακριβώς στην καμπύλη. Η μέθοδος των ελαχίστων τετραγώνων απαιτεί το άθροισμα των τετραγώνων των αποκλίσεων των πειραματικών σημείων από την καμπύλη, δηλ.

Το 2 ήταν το μικρότερο.

Στην πράξη, αυτή η μέθοδος χρησιμοποιείται πιο συχνά (και πιο απλά) στην περίπτωση μιας γραμμικής σχέσης, δηλ. Οταν y = kx ή

y = a + bx.Γραμμική εξάρτηση

πολύ διαδεδομένο στη φυσική. Και ακόμη και όταν η σχέση είναι μη γραμμική, συνήθως προσπαθούν να κατασκευάσουν ένα γράφημα έτσι ώστε να πάρουν μια ευθεία γραμμή. Για παράδειγμα, αν υποτεθεί ότι ο δείκτης διάθλασης του γυαλιού n σχετίζεται με το μήκος κύματος φωτός λ με τη σχέση n = a + b/λ 2, τότε η εξάρτηση του n από το λ -2 απεικονίζεται στο γράφημα. Στην πράξη, αυτή η μέθοδος χρησιμοποιείται πιο συχνά (και πιο απλά) στην περίπτωση μιας γραμμικής σχέσης, δηλ. ΟτανΣκεφτείτε την εξάρτηση

Η τιμή του φ είναι πάντα θετική και αποδεικνύεται μικρότερη όσο πιο κοντά είναι τα σημεία μας στην ευθεία. Η μέθοδος των ελαχίστων τετραγώνων δηλώνει ότι η τιμή για το k πρέπει να επιλεγεί έτσι ώστε το φ να έχει ένα ελάχιστο


ή
(19)

Ο υπολογισμός δείχνει ότι το σφάλμα ρίζας μέσου τετραγώνου στον προσδιορισμό της τιμής του k είναι ίσο με

, (20)
όπου n είναι ο αριθμός των μετρήσεων.

Ας εξετάσουμε τώρα μια λίγο πιο δύσκολη περίπτωση, όταν τα σημεία πρέπει να ικανοποιούν τον τύπο y = a + bx(ευθεία που δεν διέρχεται από την αρχή).

Το καθήκον είναι να βρείτε τις καλύτερες τιμές των a και b από το διαθέσιμο σύνολο τιμών x i, y i.

Ας συνθέσουμε πάλι τον τετραγωνικό τύπο φ, ίσο με το άθροισμα των τετραγωνικών αποκλίσεων των σημείων x i, y i από την ευθεία

και βρείτε τις τιμές των a και b για τις οποίες το φ έχει ελάχιστο

;

.

.

Η κοινή λύση αυτών των εξισώσεων δίνει

(21)

Τα ριζικά μέσα τετραγωνικά σφάλματα προσδιορισμού των a και b είναι ίσα

(23)

.  (24)

Κατά την επεξεργασία των αποτελεσμάτων των μετρήσεων χρησιμοποιώντας αυτή τη μέθοδο, είναι βολικό να συνοψίζονται όλα τα δεδομένα σε έναν πίνακα στον οποίο έχουν υπολογιστεί προκαταρκτικά όλα τα ποσά που περιλαμβάνονται στους τύπους (19)(24). Οι μορφές αυτών των πινάκων δίνονται στα παρακάτω παραδείγματα.

Παράδειγμα 1.Μελετήθηκε η βασική εξίσωση της δυναμικής περιστροφική κίνησηε = M/J (γραμμή που διέρχεται από την αρχή). Σε διαφορετικές τιμές της στιγμής M, μετρήθηκε η γωνιακή επιτάχυνση ε ενός συγκεκριμένου σώματος. Απαιτείται ο προσδιορισμός της ροπής αδράνειας αυτού του σώματος. Τα αποτελέσματα των μετρήσεων της ροπής δύναμης και της γωνιακής επιτάχυνσης παρατίθενται στη δεύτερη και τρίτη στήλη πίνακας 5.

Πίνακας 5
n Μ, Ν μ ε, s -1 Μ 2 Μ ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Χρησιμοποιώντας τον τύπο (19) προσδιορίζουμε:

.

Για να προσδιορίσουμε το ριζικό μέσο τετραγωνικό σφάλμα, χρησιμοποιούμε τον τύπο (20)

0.005775κιλά-1 · m -2 .

Σύμφωνα με τον τύπο (18) έχουμε

; .

S J = (2,996 0,005775)/0,3337 = 0,05185 kg m2.

Έχοντας ορίσει την αξιοπιστία P = 0,95, χρησιμοποιώντας τον πίνακα των συντελεστών Student για n = 5, βρίσκουμε t = 2,78 και προσδιορίζουμε το απόλυτο σφάλμα ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m2.

Ας γράψουμε τα αποτελέσματα στη μορφή:

J = (3,0 ± 0,2) kg m2;


Παράδειγμα 2.Ας υπολογίσουμε τον συντελεστή θερμοκρασίας της μεταλλικής αντίστασης χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Η αντίσταση εξαρτάται γραμμικά από τη θερμοκρασία

Rt = R0 (1 + α t°) = R0 + R0 α t°.

Ο ελεύθερος όρος καθορίζει την αντίσταση R 0 σε θερμοκρασία 0 ° C και η κλίση είναι το γινόμενο συντελεστής θερμοκρασίαςα στην αντίσταση R 0 .

Τα αποτελέσματα των μετρήσεων και των υπολογισμών δίνονται στον πίνακα ( βλέπε πίνακα 6).

Πίνακας 6
n t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 ,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Χρησιμοποιώντας τους τύπους (21), (22) προσδιορίζουμε

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ωμ.

Ας βρούμε ένα σφάλμα στον ορισμό του α. Αφού , τότε σύμφωνα με τον τύπο (18) έχουμε:

.

Χρησιμοποιώντας τους τύπους (23), (24) έχουμε

;

0.014126 Ωμ.

Έχοντας ορίσει την αξιοπιστία σε P = 0,95, χρησιμοποιώντας τον πίνακα των συντελεστών Student για n = 6, βρίσκουμε t = 2,57 και προσδιορίζουμε το απόλυτο σφάλμα Δα = 2,57 0,000132 = 0,000338 μοίρα -1.

α = (23 ± 4) 10 -4 χαλάζι-1 στο P = 0,95.


Παράδειγμα 3.Απαιτείται ο προσδιορισμός της ακτίνας καμπυλότητας του φακού χρησιμοποιώντας τους δακτυλίους του Νεύτωνα. Μετρήθηκαν οι ακτίνες των δακτυλίων του Νεύτωνα r m και προσδιορίστηκαν οι αριθμοί αυτών των δακτυλίων m. Οι ακτίνες των δακτυλίων του Νεύτωνα σχετίζονται με την ακτίνα καμπυλότητας του φακού R και τον αριθμό του δακτυλίου από την εξίσωση

r 2 m = mλR - 2d 0 R,

όπου d 0 το πάχος του διακένου μεταξύ του φακού και της επίπεδης παράλληλης πλάκας (ή η παραμόρφωση του φακού),

λ μήκος κύματος προσπίπτοντος φωτός.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

τότε η εξίσωση θα πάρει τη μορφή y = a + bx.

.

Εισάγονται τα αποτελέσματα των μετρήσεων και των υπολογισμών πίνακας 7.

Πίνακας 7
n x = m y = r 2, 10 -2 mm 2 m -¯ m (m -¯m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

Έχει πολλές εφαρμογές, καθώς επιτρέπει μια κατά προσέγγιση αναπαράσταση μιας δεδομένης συνάρτησης από άλλες απλούστερες. Το LSM μπορεί να είναι εξαιρετικά χρήσιμο στην επεξεργασία των παρατηρήσεων και χρησιμοποιείται ενεργά για την εκτίμηση ορισμένων ποσοτήτων με βάση τα αποτελέσματα μετρήσεων άλλων που περιέχουν τυχαία σφάλματα. Σε αυτό το άρθρο, θα μάθετε πώς να εφαρμόζετε υπολογισμούς ελαχίστων τετραγώνων στο Excel.

Δήλωση του προβλήματος χρησιμοποιώντας ένα συγκεκριμένο παράδειγμα

Ας υποθέσουμε ότι υπάρχουν δύο δείκτες X και Y. Επιπλέον, το Y εξαρτάται από το X. Επειδή το OLS μας ενδιαφέρει από την άποψη της ανάλυσης παλινδρόμησης (στο Excel οι μέθοδοί του υλοποιούνται χρησιμοποιώντας ενσωματωμένες συναρτήσεις), θα πρέπει να προχωρήσουμε αμέσως στην εξέταση ενός συγκεκριμένο πρόβλημα.

Έτσι, έστω Χ είναι ο χώρος λιανικής ενός παντοπωλείου, μετρημένος σε τετραγωνικά μέτρα, και το Y είναι ο ετήσιος κύκλος εργασιών, που προσδιορίζεται σε εκατομμύρια ρούβλια.

Απαιτείται να γίνει πρόβλεψη για το τι τζίρο (Υ) θα έχει το κατάστημα αν έχει αυτόν ή τον άλλο χώρο λιανικής. Προφανώς, η συνάρτηση Y = f (X) αυξάνεται, αφού η υπεραγορά πουλάει περισσότερα αγαθά από το περίπτερο.

Λίγα λόγια για την ορθότητα των αρχικών δεδομένων που χρησιμοποιούνται για την πρόβλεψη

Ας υποθέσουμε ότι έχουμε έναν πίνακα που έχει κατασκευαστεί χρησιμοποιώντας δεδομένα για n καταστήματα.

Σύμφωνα με τις μαθηματικές στατιστικές, τα αποτελέσματα θα είναι λίγο πολύ σωστά εάν εξεταστούν δεδομένα για τουλάχιστον 5-6 αντικείμενα. Επιπλέον, δεν μπορούν να χρησιμοποιηθούν «ανώμαλα» αποτελέσματα. Συγκεκριμένα, μια ελίτ μικρή μπουτίκ μπορεί να έχει τζίρο πολλαπλάσιο από τον τζίρο μεγάλων καταστήματα λιανικήςΤάξη «Masmarket».

Η ουσία της μεθόδου

Τα δεδομένα του πίνακα μπορούν να απεικονιστούν στο καρτεσιανό επίπεδο ως σημεία M 1 (x 1, y 1), ... M n (x n, y n). Τώρα η λύση του προβλήματος θα περιοριστεί στην επιλογή μιας προσεγγιστικής συνάρτησης y = f (x), η οποία έχει μια γραφική παράσταση που περνά όσο το δυνατόν πιο κοντά στα σημεία M 1, M 2, .. M n.

Φυσικά μπορείτε να χρησιμοποιήσετε ένα πολυώνυμο υψηλού βαθμού, αλλά αυτή η επιλογή δεν είναι μόνο δύσκολη στην εφαρμογή, αλλά και απλά λανθασμένη, καθώς δεν θα αντικατοπτρίζει την κύρια τάση που πρέπει να εντοπιστεί. Η πιο λογική λύση είναι να αναζητήσετε την ευθεία y = ax + b, η οποία προσεγγίζει καλύτερα τα πειραματικά δεδομένα, ή ακριβέστερα, τους συντελεστές a και b.

Αξιολόγηση ακρίβειας

Με οποιαδήποτε προσέγγιση, η αξιολόγηση της ακρίβειάς του έχει ιδιαίτερη σημασία. Ας συμβολίσουμε με e i τη διαφορά (απόκλιση) μεταξύ των λειτουργικών και πειραματικών τιμών για το σημείο x i, δηλαδή e i = y i - f (x i).

Προφανώς, για να εκτιμήσετε την ακρίβεια της προσέγγισης, μπορείτε να χρησιμοποιήσετε το άθροισμα των αποκλίσεων, δηλ., όταν επιλέγετε μια ευθεία γραμμή για μια κατά προσέγγιση αναπαράσταση της εξάρτησης του X από το Y, θα πρέπει να προτιμάτε αυτή με τη μικρότερη τιμή του άθροισμα e i σε όλα τα υπό εξέταση σημεία. Ωστόσο, δεν είναι όλα τόσο απλά, αφού μαζί με τις θετικές αποκλίσεις θα υπάρχουν και αρνητικές.

Το πρόβλημα μπορεί να λυθεί χρησιμοποιώντας μονάδες απόκλισης ή τα τετράγωνά τους. Η τελευταία μέθοδος είναι η πιο ευρέως χρησιμοποιούμενη. Χρησιμοποιείται σε πολλούς τομείς, συμπεριλαμβανομένης της ανάλυσης παλινδρόμησης (που εφαρμόζεται στο Excel χρησιμοποιώντας δύο ενσωματωμένες συναρτήσεις) και έχει αποδείξει εδώ και καιρό την αποτελεσματικότητά του.

Μέθοδος ελαχίστων τετραγώνων

Το Excel, όπως γνωρίζετε, έχει μια ενσωματωμένη λειτουργία AutoSum που σας επιτρέπει να υπολογίζετε τις τιμές όλων των τιμών που βρίσκονται στην επιλεγμένη περιοχή. Έτσι, τίποτα δεν θα μας εμποδίσει να υπολογίσουμε την τιμή της παράστασης (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Σε μαθηματική σημειογραφία, αυτό μοιάζει με:

Δεδομένου ότι αρχικά ελήφθη η απόφαση να γίνει προσέγγιση χρησιμοποιώντας μια ευθεία γραμμή, έχουμε:

Έτσι, το έργο της εύρεσης της ευθείας γραμμής που περιγράφει καλύτερα τη συγκεκριμένη εξάρτηση των μεγεθών X και Y καταλήγει στον υπολογισμό του ελάχιστου συνάρτησης δύο μεταβλητών:

Για να γίνει αυτό, πρέπει να εξισώσετε τις μερικές παραγώγους σε σχέση με τις νέες μεταβλητές a και b με μηδέν και να λύσετε ένα πρωτόγονο σύστημα που αποτελείται από δύο εξισώσεις με 2 άγνωστα της μορφής:

Μετά από μερικούς απλούς μετασχηματισμούς, συμπεριλαμβανομένης της διαίρεσης με το 2 και του χειρισμού των αθροισμάτων, έχουμε:

Λύνοντάς το, για παράδειγμα, χρησιμοποιώντας τη μέθοδο του Cramer, παίρνουμε ένα ακίνητο σημείο με ορισμένους συντελεστές a * και b *. Αυτό είναι το ελάχιστο, δηλαδή για να προβλέψουμε τι τζίρο θα έχει ένα κατάστημα για μια συγκεκριμένη περιοχή, είναι κατάλληλη η ευθεία γραμμή y = a * x + b *, η οποία είναι ένα μοντέλο παλινδρόμησης για το εν λόγω παράδειγμα. Φυσικά δεν θα σε αφήσει να βρεις ακριβές αποτέλεσμα, αλλά θα σας βοηθήσει να πάρετε μια ιδέα για το εάν η αγορά μιας συγκεκριμένης περιοχής με πίστωση καταστήματος θα αποδώσει.

Πώς να εφαρμόσετε τα ελάχιστα τετράγωνα στο Excel

Το Excel έχει μια συνάρτηση για τον υπολογισμό τιμών με χρήση ελαχίστων τετραγώνων. Έχει την ακόλουθη μορφή: «TREND» (γνωστές τιμές Y, γνωστές τιμές X, νέες τιμές X, σταθερά). Ας εφαρμόσουμε τον τύπο για τον υπολογισμό του OLS στο Excel στον πίνακά μας.

Για να το κάνετε αυτό, εισαγάγετε το σύμβολο "=" στο κελί στο οποίο θα πρέπει να εμφανίζεται το αποτέλεσμα του υπολογισμού με τη μέθοδο των ελαχίστων τετραγώνων στο Excel και επιλέξτε τη συνάρτηση "TREND". Στο παράθυρο που ανοίγει, συμπληρώστε τα κατάλληλα πεδία, επισημαίνοντας:

  • εύρος γνωστών τιμών για το Y (σε αυτήν την περίπτωση, δεδομένα για τον εμπορικό κύκλο εργασιών).
  • εύρος x 1 , …x n , δηλαδή το μέγεθος του χώρου λιανικής.
  • Τόσο γνωστές όσο και άγνωστες τιμές του x, για τις οποίες πρέπει να μάθετε το μέγεθος του κύκλου εργασιών (για πληροφορίες σχετικά με τη θέση τους στο φύλλο εργασίας, δείτε παρακάτω).

Επιπλέον, ο τύπος περιέχει τη λογική μεταβλητή "Const". Εάν εισαγάγετε 1 στο αντίστοιχο πεδίο, αυτό θα σημαίνει ότι πρέπει να κάνετε τους υπολογισμούς, υποθέτοντας ότι b = 0.

Εάν πρέπει να μάθετε την πρόβλεψη για περισσότερες από μία τιμές x, τότε αφού εισαγάγετε τον τύπο δεν πρέπει να πατήσετε "Enter", αλλά πρέπει να πληκτρολογήσετε τον συνδυασμό "Shift" + "Control" + "Enter" στο πληκτρολόγιο.

Κάποια χαρακτηριστικά

Η ανάλυση παλινδρόμησης μπορεί να είναι προσβάσιμη ακόμη και σε ανδρείκελα. Ο τύπος του Excel για την πρόβλεψη της τιμής μιας σειράς άγνωστων μεταβλητών—TREND—μπορεί να χρησιμοποιηθεί ακόμη και από εκείνους που δεν έχουν ακούσει ποτέ για ελάχιστα τετράγωνα. Αρκεί μόνο να γνωρίζουμε μερικά από τα χαρακτηριστικά της δουλειάς του. Προπαντός:

  • Εάν τακτοποιήσετε το εύρος των γνωστών τιμών της μεταβλητής y σε μία γραμμή ή στήλη, τότε κάθε σειρά (στήλη) με γνωστές τιμές x θα γίνει αντιληπτή από το πρόγραμμα ως ξεχωριστή μεταβλητή.
  • Εάν το παράθυρο TREND δεν υποδεικνύει εύρος με γνωστό x, τότε εάν η συνάρτηση χρησιμοποιείται σε Πρόγραμμα Excelθα τον αντιμετωπίσει ως έναν πίνακα που αποτελείται από ακέραιους, ο αριθμός των οποίων αντιστοιχεί στο εύρος με τις δεδομένες τιμές της μεταβλητής y.
  • Για να εξάγετε έναν πίνακα "προβλεπόμενων" τιμών, η έκφραση για τον υπολογισμό της τάσης πρέπει να εισαχθεί ως τύπος πίνακα.
  • Εάν δεν καθορίζονται νέες τιμές x, τότε η συνάρτηση TREND τις θεωρεί ίσες με τις γνωστές. Εάν δεν καθορίζονται, τότε ο πίνακας 1 λαμβάνεται ως όρισμα. 2; 3; 4;…, το οποίο είναι ανάλογο με το εύρος με τις ήδη καθορισμένες παραμέτρους y.
  • Το εύρος που περιέχει τις νέες τιμές x πρέπει να έχει τις ίδιες ή περισσότερες σειρές ή στήλες με το εύρος που περιέχει τις δεδομένες τιμές y. Με άλλα λόγια, πρέπει να είναι ανάλογη με τις ανεξάρτητες μεταβλητές.
  • Ένας πίνακας με γνωστές τιμές x μπορεί να περιέχει πολλές μεταβλητές. Ωστόσο, εάν μιλάμε μόνο για ένα, τότε απαιτείται οι περιοχές με τις δεδομένες τιμές των x και y να είναι ανάλογες. Στην περίπτωση πολλών μεταβλητών, είναι απαραίτητο το εύρος με τις δεδομένες τιμές y να χωράει σε μία στήλη ή μία γραμμή.

Λειτουργία ΠΡΟΒΛΕΨΗΣ

Υλοποιήθηκε χρησιμοποιώντας πολλές λειτουργίες. Ένα από αυτά ονομάζεται «ΠΡΟΒΛΕΨΗ». Είναι παρόμοιο με το "TREND", δηλαδή δίνει το αποτέλεσμα των υπολογισμών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Ωστόσο, μόνο για ένα Χ, για το οποίο η τιμή του Υ είναι άγνωστη.

Τώρα γνωρίζετε τύπους στο Excel για ανδρείκελα που σας επιτρέπουν να προβλέψετε τη μελλοντική τιμή ενός συγκεκριμένου δείκτη σύμφωνα με μια γραμμική τάση.

Η μέθοδος των ελαχίστων τετραγώνων είναι μια από τις πιο κοινές και πιο ανεπτυγμένες λόγω της απλότητα και αποτελεσματικότητα των μεθόδων εκτίμησης παραμέτρων της γραμμικής. Ταυτόχρονα, κατά τη χρήση του, θα πρέπει να τηρείται κάποια προσοχή, καθώς τα μοντέλα που κατασκευάζονται με αυτό ενδέχεται να μην ικανοποιούν ορισμένες απαιτήσεις για την ποιότητα των παραμέτρων τους και, ως εκ τούτου, να μην αντικατοπτρίζουν «καλά» τα πρότυπα ανάπτυξης της διαδικασίας .

Ας εξετάσουμε λεπτομερέστερα τη διαδικασία εκτίμησης των παραμέτρων ενός γραμμικού οικονομετρικού μοντέλου χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Αυτό το μοντέλο σε γενική άποψημπορεί να αναπαρασταθεί από την εξίσωση (1.2):

y t = a 0 + a 1 x 1 t +...+ a n x nt + ε t.

Τα αρχικά δεδομένα κατά την εκτίμηση των παραμέτρων a 0 , a 1 ,..., a n είναι ένα διάνυσμα τιμών της εξαρτημένης μεταβλητής y= (y 1 , y 2 , ... , y T)" και ο πίνακας τιμών των ανεξάρτητων μεταβλητών

στην οποία η πρώτη στήλη, αποτελούμενη από μία, αντιστοιχεί στον συντελεστή υποδείγματος.

Η μέθοδος ελαχίστων τετραγώνων έλαβε το όνομά της με βάση τη βασική αρχή ότι οι εκτιμήσεις παραμέτρων που λαμβάνονται βάσει αυτής πρέπει να ικανοποιούν: το άθροισμα των τετραγώνων του σφάλματος μοντέλου πρέπει να είναι ελάχιστο.

Παραδείγματα επίλυσης προβλημάτων με τη μέθοδο των ελαχίστων τετραγώνων

Παράδειγμα 2.1.Η εμπορική επιχείρηση διαθέτει ένα δίκτυο 12 καταστημάτων, πληροφορίες για τις δραστηριότητες των οποίων παρουσιάζονται στον πίνακα. 2.1.

Η διοίκηση της επιχείρησης θα ήθελε να μάθει πώς το ετήσιο ποσό εξαρτάται από τον χώρο λιανικής του καταστήματος.

Πίνακας 2.1

Αριθμός καταστήματος

Ετήσιος κύκλος εργασιών, εκατομμύρια ρούβλια.

Περιοχή λιανικής, χίλια m2

Λύση ελαχίστων τετραγώνων.Ας υποδηλώσουμε τον ετήσιο κύκλο εργασιών του ου καταστήματος, εκατομμύρια ρούβλια. — περιοχή λιανικής του καταστήματος, χίλια m2.

Εικ.2.1. Scatterplot για Παράδειγμα 2.1

Για να προσδιορίσουμε τη μορφή της συναρτησιακής σχέσης μεταξύ των μεταβλητών και θα κατασκευάσουμε ένα διάγραμμα διασποράς (Εικ. 2.1).

Με βάση το διάγραμμα διασποράς, μπορούμε να συμπεράνουμε ότι ο ετήσιος κύκλος εργασιών εξαρτάται θετικά από τον χώρο λιανικής (δηλαδή, το y θα αυξάνεται με την αύξηση του ). Η πιο κατάλληλη μορφή λειτουργικής σύνδεσης είναι γραμμικός.

Πληροφορίες για περαιτέρω υπολογισμούς παρουσιάζονται στον πίνακα. 2.2. Χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, υπολογίζουμε τις παραμέτρους ενός γραμμικού μονοπαραγοντικού οικονομετρικού μοντέλου

Πίνακας 2.2

Ετσι,

Επομένως, με αύξηση του χώρου λιανικής κατά 1.000 m2, ενώ τα άλλα πράγματα είναι ίσα, ο μέσος ετήσιος κύκλος εργασιών αυξάνεται κατά 67,8871 εκατομμύρια ρούβλια.

Παράδειγμα 2.2.Η διοίκηση της εταιρείας παρατήρησε ότι ο ετήσιος τζίρος δεν εξαρτάται μόνο από την περιοχή πωλήσεων του καταστήματος (βλ. παράδειγμα 2.1), αλλά και από τον μέσο αριθμό επισκεπτών. Οι σχετικές πληροφορίες παρουσιάζονται στον πίνακα. 2.3.

Πίνακας 2.3

Διάλυμα.Ας υποδηλώσουμε τον μέσο αριθμό επισκεπτών στο κατάστημα ανά ημέρα, χιλιάδες άτομα.

Για να προσδιορίσουμε τη μορφή της συναρτησιακής σχέσης μεταξύ των μεταβλητών και θα κατασκευάσουμε ένα διάγραμμα διασποράς (Εικ. 2.2).

Με βάση το scatterplot, μπορούμε να συμπεράνουμε ότι ο ετήσιος κύκλος εργασιών εξαρτάται θετικά από τον μέσο αριθμό επισκεπτών ανά ημέρα (δηλαδή, το y θα αυξάνεται με την αύξηση ). Η μορφή της λειτουργικής εξάρτησης είναι γραμμική.

Ρύζι. 2.2. Scatterplot για Παράδειγμα 2.2

Πίνακας 2.4

Γενικά, είναι απαραίτητος ο προσδιορισμός των παραμέτρων ενός οικονομετρικού μοντέλου δύο παραγόντων

y t = a 0 + a 1 x 1 t + a 2 x 2 t + ε t

Οι πληροφορίες που απαιτούνται για περαιτέρω υπολογισμούς παρουσιάζονται στον πίνακα. 2.4.

Ας υπολογίσουμε τις παραμέτρους ενός γραμμικού οικονομετρικού μοντέλου δύο παραγόντων χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Ετσι,

Η εκτίμηση του συντελεστή =61,6583 δείχνει ότι, αν και άλλα πράγματα είναι ίσα, με αύξηση του χώρου λιανικής κατά 1 χιλιάδες m 2, ο ετήσιος κύκλος εργασιών θα αυξηθεί κατά μέσο όρο 61,6583 εκατομμύρια ρούβλια.