Τρίτη 19 Μαρτίου 2024

Η παλινδρόμηση και πως να την αντιμετωπίσετε

Η εξέταση της σχέσης μεταξύ δυο ή περισσότερων μεταβλητών με στόχο τη πρόβλεψη μιας από αυτές μέσω των άλλων λέγεται ανάλυση παλινδρόμησης. 

Kantinski - Κίνηση 1935

Η παλινδρόμηση που έχει μόνο δυο μεταβλητές εκ των οποίων μόνο η μία είναι ανεξάρτητη λέγεται απλή (π.χ. η ανάλυση της σχέσης μεταξύ της παραγωγής ενός χωραφιού και της ποσότητας λιπάσματος που χρησιμοποιήθηκε). Όταν εξετάζουμε περισσότερες από μία ανεξάρτητες μεταβλητές τότε έχουμε την ανάλυση πολλαπλής παλινδρόμησης (π.χ. αν για το ίδιο χωράφι εξετάσουμε όχι μόνο τη ποσότητα του λιπάσματος αλλά και την ηλιοφάνεια και την βροχόπτωση στη περιοχή).

Ο πυρήνας της ανάλυσης παλινδρόμησης είναι η μέθοδος των ελάχιστων τετραγώνων. Χρησιμοποιείται για την εύρεση του τύπου που περιγράφει το φαινόμενο που εξετάζουμε, όταν γνωρίζουμε μια σειρά από πραγματικές τιμές των μεγεθών που το απεικονίζουν και αγνοούμε τον ακριβή τύπο τους. Κατά την ανάπτυξη της μεθόδου προσπαθούμε να προσδιορίσουμε τη μορφή της άγνωστης σχέσης, στην οποία ταιριάζουν καλύτερα τα πειραματικά μας δεδομένα, ελέγχοντας μια σειρά γνωστών σχέσεων. Οι  κυριότερες σχέσεις που εξετάζονται είναι οι: Γραμμική; Πολυώνυμη; Σχέση δύναμης; Εκθετική και   Λογαριθμική.

Το μοντέλο ή η εξίσωση παλινδρόμησης μπορεί να λάβει οποιαδήποτε αλγεβρική μορφή. Ανάλογα με τη μορφή του, μπορεί να χαρακτηριστεί ως γραμμικό ή μη-γραμμικό μοντέλο παλινδρόμησης. Ο χαρακτηρισμός αυτός αναφέρεται κυρίως στον τρόπο με τον οποίο μεταβάλλεται η τιμή της εξαρτημένης μεταβλητής, εάν μεταβληθεί η τιμή μιας ή όλων των ανεξαρτήτων μεταβλητών.

Το γραμμικό μοντέλο παλινδρόμησης στη γενική, αφηρημένη μορφή του εκφράζεται από την εξίσωση: 𝑌 = 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3 + 𝛽4𝑋4 + 𝛽5𝑋5 + + 𝛽0 + 𝜀 όπου 𝛽𝑖 οι συντελεστές και 𝑋𝑖 οι ανεξάρτητες μεταβλητές. Αυτό που κάνει ένα μοντέλο παλινδρόμησης «γραμμικό» είναι ο τρόπος με τον οποίο αλλάζει η τιμή της ανεξάρτητης μεταβλητής αν αλλάξουν οι τιμές των ανεξαρτήτων μεταβλητών / συντελεστών. Γενικά μεταξύ δύο μεταβλητών Υ και Χ υπάρχει γραμμική σχέση εάν ο ρυθμός μεταβολής της εξαρτημένης μεταβλητής Υ ως προς την ανεξάρτητη Χ (δηλαδή ο λόγος 𝑑𝑌 𝑑𝑋 ⁄ ) δεν εξαρτάται από την τιμή της ανεξάρτητης μεταβλητής X.

Για να χαρακτηριστεί ένα μοντέλο παλινδρόμησης ως γραμμικό, θα πρέπει η εξαρτημένη μεταβλητή να είναι γραμμική μόνο ως προς όλους τους συντελεστές β. Δεν απαιτείται να είναι γραμμική και ως προς τις ανεξάρτητες μεταβλητές. Παραδείγματα γραμμικών μοντέλων παλινδρόμησης: κατανάλωση και εισόδημα – κατανάλωση και εισόδημα, αριθμός ατόμων νοικοκυριού, αριθμός οικογενειακών αυτοκινήτων – αρτηριακή πίεση και φύλλο, ηλικία. Μοντέλα παλινδρόμησης στα οποία η εξαρτημένη μεταβλητή δεν είναι γραμμική ως προς τουλάχιστον έναν συντελεστή β καλούνται μη-γραμμικά.

Η διαφοροποίηση μεταξύ γραμμικού και μη γραμμικού μοντέλου είναι σημαντική επειδή καθορίζει τον τρόπο με τον οποίο θα γίνει η εκτίμηση των συντελεστών. Αν και υπάρχουν τρόποι με τους οποίους μη-γραμμικά μοντέλα μπορούν να μετασχηματιστούν σε γραμμικά (με μεθόδους που καλούνται γραμμικοί μετασχηματισμοί), γενικά τα γραμμικά μοντέλα παλινδρόμησης χρησιμοποιούν διαφορετικές μεθόδους για την εκτίμηση των συντελεστών τους απ’ ότι τα μη-γραμμικά μοντέλα. Ενώ υπάρχουν τύποι για την εκτίμηση συντελεστών γραμμικών μοντέλων παλινδρόμησης, τέτοιοι δεν υφίστανται στην περίπτωση μη-γραμμικών, όπου κυρίως γίνεται χρήση αριθμητικών μεθόδων για τον προσδιορισμό τους. 

Η παλινδρόμηση δεν σημαίνει απαραίτητα αιτιότητα αλλά δείχνει μόνο τη δύναμη και το εύρος της συσχέτισης μεταξύ των μεταβλητών. Γραφικά αναπαρίσταται χρησιμοποιώντας μια γραμμή που ονομάζεται γραμμή παλινδρόμησης, η οποία αντιπροσωπεύει την καλύτερη προσαρμογή για τα σημεία δεδομένων.  Είναι πολύ σημαντικό για το μοντέλο γραμμικής παλινδρόμησης ο ακριβής προσδιορισμός των συντελεστών 𝛽𝑖 με βάση τα δεδομένα που υπάρχουν.

Περισσότερα μπορείτε να διαβάσετε εδώ

Δεν υπάρχουν σχόλια: