Η ανάλυση κύριου στοιχείου (PCA) και η ανάλυση παραγόντων (FA) είναι και οι δύο ευρέως χρησιμοποιούμενες τεχνικές για τη μείωση των δεδομένων και την κατανόηση της δομής σε πολυδιάστατα σύνολα δεδομένων.
Vassily Kandinsky - Mild tension, 1923 |
Ωστόσο, η ανάλυση κύριου στοιχείου είναι γενικά πιο κατάλληλη για διερευνητική ανάλυση, συμπίεση δεδομένων και οπτικοποίηση, ενώ η ανάλυση παραγόντων ενδείκνυται για επιβεβαιωτική ανάλυση, ερμηνεία δεδομένων και δοκιμή υποθέσεων
Αν και μοιράζονται
ομοιότητες, έχουν διακριτές διαφορές:
Στις υποκείμενες υποθέσεις:
PCA: Οι παρατηρούμενες
μεταβλητές είναι γραμμικοί συνδυασμοί μη συσχετισμένων λανθανόντων μεταβλητών
(που ονομάζονται κύρια στοιχεία), οι οποίες ταξινομούνται με βάση το μέγεθος
της διακύμανσης που εξηγούν.
FA: Οι παρατηρούμενες
μεταβλητές είναι γραμμικοί συνδυασμοί μη παρατηρήσιμων λανθανόντων παραγόντων
και μοναδικών παραγόντων.
Στους στόχους ανάλυσης:
PCA: Μεγιστοποιήστε τη
διακύμανση που καταγράφεται από τα κύρια στοιχεία.
FA: Προσδιορίστε τους
υποκείμενους λανθάνοντες παράγοντες που εξηγούν τις παρατηρούμενες συσχετίσεις
μεταξύ των μεταβλητών.
Στην ερμηνεία:
PCA: Τα στοιχεία είναι
νέες μεταβλητές που είναι γραμμικοί συνδυασμοί των αρχικών.
FA: Οι παράγοντες είναι
κοινά στοιχεία που προκαλούν διακυμάνσεις στις παρατηρούμενες μεταβλητές.
Πιο αναλυτικά για τις διαφορές στις
υποθέσεις μεταξύ PCA και FA:
Για την ανάλυση του κύριου
στοιχείου (PCA):
- Ø Υπόθεση: Η PCA υποθέτει ότι οι παρατηρούμενες
μεταβλητές είναι γραμμικοί συνδυασμοί ασύνδετων λανθάνοντων μεταβλητών, γνωστών
ως κύρια στοιχεία. Αυτά ταξινομούνται με βάση το μέγεθος της διακύμανσης τους.
- Ø Σκοπός: Ο πρωταρχικός στόχος του PCA είναι να
μεγιστοποιήσει τη διακύμανση που καταγράφεται από τα κύρια στοιχεία, ώστε να
επιβεβαιώσει με σαφήνεια τον κύριο παράγοντα.
- Ø Προσέγγιση μοντελοποίησης: Η PCA δημιουργεί
μεταβλητές ευρετηρίου μέσω ενός γραμμικού συνδυασμού μετρούμενων μεταβλητών, με
στόχο τη βελτιστοποίηση του αριθμού των στοιχείων, την επιλογή των μεταβλητών
για κάθε στοιχείο και τα ειδικά βάρη τους
Για την ανάλυση
παραγόντων (FA):
- Ø Υπόθεση: Η FA υποθέτει ότι οι παρατηρούμενες
μεταβλητές είναι γραμμικοί συνδυασμοί μη παρατηρήσιμων λανθανόντων παραγόντων
και μοναδικών παραγόντων. Σε αντίθεση με το PCA, το FA επιτρέπει τη συσχέτιση
των μεταβλητών.
- Ø Σκοπός: Ο πρωταρχικός στόχος της FA είναι να
εντοπίσει τους υποκείμενους λανθάνοντες παράγοντες που εξηγούν τις
παρατηρούμενες συσχετίσεις μεταξύ των μεταβλητών.
- Ø Προσέγγιση μοντελοποίησης: Η FA μοντελοποιεί τη
μέτρηση μιας λανθάνουσας μεταβλητής, η οποία δεν μπορεί να μετρηθεί άμεσα με
μία μόνο μεταβλητή. Φαίνεται μέσα από τις σχέσεις που προκαλεί σε ένα σύνολο
παρατηρούμενων μεταβλητών, με στόχο τη βελτιστοποίηση των βαρών μεταξύ του
λανθάνοντος παράγοντα και των παρατηρούμενων μεταβλητών
Συνοπτικά, ενώ η PCA
εστιάζει στη δημιουργία μη συσχετισμένων στοιχείων για τη μεγιστοποίηση της
διακύμανσης, η FA στοχεύει στον εντοπισμό λανθάνοντων παραγόντων που εξηγούν
τις συσχετίσεις μεταξύ των παρατηρούμενων μεταβλητών, επιτρέποντας συσχετίσεις
μεταξύ μεταβλητών στην προσέγγισή της μοντελοποίησης.
Η PCA και η FA διαφέρουν
στις διαδικασίες προετοιμασίας δεδομένων λόγω των έμφυτων υποθέσεων και στόχων
τους:
Προετοιμασία PCA: Το PCA ξεκινά συνήθως με την τυποποίηση των δεδομένων
εισόδου για να διασφαλίσει ίσες συνεισφορές από κάθε μεταβλητή. Στη συνέχεια,
υπολογίζεται ο πίνακας συνδιακύμανσης ή συσχέτισης, ακολουθούμενος από την
αποσύνθεση του πίνακα σε ιδιοδιανύσματα και ιδιοτιμές. Τέλος, επιλέγονται τα
ιδιοδιανύσματα που αντιστοιχούν στις μεγαλύτερες ιδιοτιμές για την κατασκευή
των κύριων συνιστωσών
Προετοιμασία FA: Το FA ξεκινά ομοίως με την τυποποίηση των
δεδομένων εισόδου, τον υπολογισμό του πίνακα συσχέτισης και την αποσύνθεση του
πίνακα σε φορτία παραγόντων και μοναδικότητες. Ωστόσο, σε αντίθεση με την PCA,
η FA μοντελοποιεί ρητά τις σχέσεις μεταξύ παρατηρούμενων μεταβλητών και
υποθετικών λανθάνοντων παραγόντων, απαιτώντας πρόσθετες εκτιμήσεις σχετικά με
την προδιαγραφή της δομής των παραγόντων και τις μεθόδους πιθανής περιστροφής
Αυτές οι διαφορές στην
προετοιμασία δεδομένων οδηγούν σε αποκλίνουσες εκροές και ερμηνείες, με την PCA
να εστιάζει στη συμπίεση και την οπτικοποίηση δεδομένων, ενώ η FA
επικεντρώνεται στην εξήγηση της υποκείμενης δομής πίσω από τις παρατηρούμενες
μεταβλητές.
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου