(*) Του Απόστολου Ευθυμιάδη https://www.facebook.com/apostolos.efthymiadis/posts/10215718733338473
1. ΣΚΟΠΟΣ ΤΗΣ ΑΝΑΛΥΣΕΩΣ ΚΑΙ ΔΕΔΟΜΕΝΑ ΚΡΟΥΣΜΑΤΩΝ
Σε συνέχεια τῶν προηγουμένων ἀναρτήσεων ἡμῶν ἐπί τοῦ θέματος, κατασκευάζονται ἐδῶ καί δίδονται συνημμένως οι καμπύλες ἀθροιστικῶν θανατηφόρων κρουσμάτων Κορονοϊοῦ διαφόρων χωρῶν καὶ ἐξάγονται τα βασικά συμπεράσματα ὠς προς τον ρυθμό ἐξαπλώσεως τῆς ἐπιδημίας εἰς τας χώρας αὐτάς.
Δεδομένα δια την ἀνάλυση αὐτή λαμβάνονται ἀπό τον ἰστότοπο https://www.worldometers.info/coronavirus/ ὁ ὀποῖος εἶναι ἀπολύτως ἀξιόπιστος καὶ παγκοσμίως ἀποδεκτός ὡς προς την ἀκρίβεια και την πληρότητα των παρεχόμενων στοιχειων.
Παράλληλα με την ἀνάπτυξιν τῶν ἐν λόγῳ καμπυλῶν, διαμορφώνεται ἔνα πλαίσιο μαθηματικῆς προσομοιώσεως καὶ στατιστικῆς ἀναλύσεως τῶν καμπυλῶν αὐτῶν δια την διαπίστωσιν τῶν ρυθμῶν ἐξαπλώσεως τοῦ ἰοῦ αὐτοῦ η ὀποία παρουσιάζεται σε ἑπόμενη παράγραφο.
Σε συνέχεια τῶν προηγουμένων ἀναρτήσεων ἡμῶν ἐπί τοῦ θέματος, κατασκευάζονται ἐδῶ καί δίδονται συνημμένως οι καμπύλες ἀθροιστικῶν θανατηφόρων κρουσμάτων Κορονοϊοῦ διαφόρων χωρῶν καὶ ἐξάγονται τα βασικά συμπεράσματα ὠς προς τον ρυθμό ἐξαπλώσεως τῆς ἐπιδημίας εἰς τας χώρας αὐτάς.
Δεδομένα δια την ἀνάλυση αὐτή λαμβάνονται ἀπό τον ἰστότοπο https://www.worldometers.info/coronavirus/ ὁ ὀποῖος εἶναι ἀπολύτως ἀξιόπιστος καὶ παγκοσμίως ἀποδεκτός ὡς προς την ἀκρίβεια και την πληρότητα των παρεχόμενων στοιχειων.
Παράλληλα με την ἀνάπτυξιν τῶν ἐν λόγῳ καμπυλῶν, διαμορφώνεται ἔνα πλαίσιο μαθηματικῆς προσομοιώσεως καὶ στατιστικῆς ἀναλύσεως τῶν καμπυλῶν αὐτῶν δια την διαπίστωσιν τῶν ρυθμῶν ἐξαπλώσεως τοῦ ἰοῦ αὐτοῦ η ὀποία παρουσιάζεται σε ἑπόμενη παράγραφο.
2. ΤΑ ΠΡΩΤΑΡΧΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΤΗΣ ΑΝΑΛΥΣΕΩΣ
Τα ἀποτελέσματα τῆς ἀναλύσεως δίδονται εἰς τον πίνακα κάτωθεν τοῦ διαγράμματος ἔχουν συνοπτικά ὠς ἐξῆς :
α) Η παράμετρος p ὑποδεικνύει τον ρυθμό ἐξαπλώσεως.
Ἐάν p = 1 ὁ ρυθμός ἐξαπλώσεως εἶναι ἐκθετικός ἐνῶ ὁ ρυθμός ἐξαπλώσεως εἶναι σταθερός ὄταν p = 0 και πολυωνυμικός δια 0 < p < 1
Τα ἀποτελέσματα τῆς ἀναλύσεως δίδονται εἰς τον πίνακα κάτωθεν τοῦ διαγράμματος ἔχουν συνοπτικά ὠς ἐξῆς :
α) Η παράμετρος p ὑποδεικνύει τον ρυθμό ἐξαπλώσεως.
Ἐάν p = 1 ὁ ρυθμός ἐξαπλώσεως εἶναι ἐκθετικός ἐνῶ ὁ ρυθμός ἐξαπλώσεως εἶναι σταθερός ὄταν p = 0 και πολυωνυμικός δια 0 < p < 1
β) Ἡ παράμετρος m ἰσούται με 1/(1-p) καὶ ὑποδεικνύει την τάξιν τοῦ πολυωνύμου με το ὀποῖο προσομοιεώνεται ἡ καμπύλη ἐκάστης χώρας.
γ) Με αὐτάς τας παραμέτρους p και m παρατηρεῖται ὄτι τον ταχύτερο ρυθμό ἐξαπλώσεως ἔχουν ἡ Μεγάλη Βρετανία καὶ αι ἨΠΑ δια τὰς ὀποίας p = 1 ἤ μεγαλύτερος καὶ ἐπομένως ὁ ρυθμός αὐτός εἶναι ἐκθετικός. Ἀκολουθοῦνται ἀπό Γαλλία καὶ Γερμανία με p ἴσον με 0,89 καὶ 0,88 ἀντιστοίχως καὶ μετά ἀπό το Βέλγιο, την Ἰσπανία καὶ την Ἰταλία με p = 0,83.
δ) Τον χαμηλότερον ρυθμό ἐξαπλώσεως τῶν θανατηφόρων κρουσμάτων τοῦ Κορονοϊοῦ ἀπό τις ἐξετασθεῖσες χῶρες ἔχουν ἡ Κίνα (p=0,6), ἡ Σουηδία (p= 0,609) καὶ ἡ Ἐλλάς (p = 0,634)
ε) Ὄλες οἱ ἀνωτέρω καμπύλες συγκρινόμενη με ἐκείνης τῆς Κίνας, δαπιστώνεται ὅτι διάγουν εἰσέτι τὸ ἀρχικό στάδιο τῆς ἀναπτύξεως καὶ δεν ἔχουν εἰσέλθει ἀκόμα εἰς το τελικό στάδιο τῆς ὑφέσεως. Βεβαίως ἀναμένεται ὄτι αι καμπύλαι με αὐξημένη παράμετρο p θα εἰσέλθουν ἐνωρίτερον εἰς το στάδιο τῆς ὑφέσεως ἔναντι τῶν χωρῶν με χαμηλό p.
στ) Δια την περίπτωσιν τῆς Ἐλλάδος ἔχει γίνει μία γραμμική προβολή τῆς προσαρμοσμένης πολυωνυμικῆς συναρτήσεως στα δεδομένα τῆς χώρας. Η ἐπέκτασις αὐτή εἶναι ἐνδεικτική ἐνός ἄνω ὀρίου θανατηφόρων κρουσμάτων, ἀφοῦ βάσει τῆς ἐμπειρίας τῆς Κίνας η καμπύλη τῆς χώρας ἀναμένεται να ἐμφανίσει ἀντίστοιχον σημεῖο καμπῆς με τα κοίλα προς τα κάτω κατά τας ἐπομένους δύο ἐβδομάδας.
Τα ἀνωτέρω ἀποτελέσματα εἶναι δυνατόν να μεταβληθοῦν εἰς τας ἐπόμενας ἡμέρας ἀναλόγως με τα μέτρα περιορισμοῦ τῶν πολιτῶν τα ὀποία λαμβάνει ἐκάστη χώρα. Πάντως με τα μέχρι στιγμῆς ἀποτελέσματα διαπιστώνεται ὁτι ἡ διασπορά τοῦ ἰοῦ εἰς τἠν Ἐλλάδα κρατεῖται πολύ χαμηλά καὶ προς τοῦτο ἀξίζουν ἔπαινοι εἰς τον πρωθυπουργό, το πολιτικό προσωπικό καὶ το ἐπιστημονικό προσωπικό τῆς χώρας το ὀποῖο εἰσηγεῖται τα δέοντα μέτρα.
3. ΜΕΘΟΔΟΛΟΓΙΑ ΑΝΑΚΤΗΣΕΩΣ ΔΕΔΟΜΕΝΩΝ
Δια την ἀνάκτηση των ἀριθμητικῶν δεδομένων δια τα θανατηφόρα κρούσματα ἀπό τον ἐν λόγῳ ἱστότοπο ἀκολουθεῖται ἡ ἀκόλουθος μεθοδολογία :
Σε κάθε σελίδα χώρας τοῦ worldometers ὄπου ὑπάρχουν διαγράμματα, κάνουμε δεξί κλίκ, ἐπιλέγουμε "View page source" και παρατηροῦμε ἐκεῖ ὄλον τον προγραμματισμό τῆς ἰστοσελίδας. Ἐκεῖ ἀνατρέχουμε ἐντός τῆς σελίδος ταύτης και ἀναγνωρίζουμε πίνακες ἀριθμητικῶν δεδομένων (χρονοσειρές) με τα στοιχεία ἐνδιαφέροντος ἀναφορικά με τα διαγράμματα ἐνδιαφέροντος.
Τους πίνακες αὐτούς τους ἐπιλέγοὐμε με το ποντίκι καὶ κάνουμε copy. Τα δεδομένα αὐτά τα ἐπικολάμε (paste) σε ἔνα κελί τοῦ EXCEL. Μετά τὰ διαχωρίζουμε σε πολλά διαδοχικά κελιά του EXCEL χρησιμοποιώντας την ἀλληλουχία ἐντολῶν :
Δεδομένα -- Κείμενο σε στῆλες -- Ὀριοθετημένο -- "Χαρακτήρας tab" και "κόμμα" --> Τέλος
Με τον τρόπο αὐτό δημιουργοῦμε ἔνα ὀριζόντιο πίνακα Excel (χρονοσειρά) με τα δεδομένα ἐνδιαφέροντος.
Εἰς τον πίνακα τῶν ἀποτελεσμάτων δίδονται τα ἐξῆς : με Η εἶναι ἡ ἡμερομηνία ἐμφανίσεως τοῦ πρώτου θανατηφόρου κρούσματος σε κάθε χώρα, d εἶναι ο ἀριθμός ἠμερῶν μετά το πρῶτο θανατηφόρω κρούσμα, μετά τῶν ὀποίων λαμβάνονται τα ἠμερήσια στοιχεία θανατηφόρων κρουσμάτων προκειμένου να ἔχει ἐπιτευχθῇ μία ἐξομάλυνσι τῶν στοιχείων αὐτῶν, C(d) εἶναι το πλῆθος τῶν ἐν λόγῳ κρουσμάτων κατά την ἠμέραν d καὶ Ν εἶναι το συνολικό πλῆθος ἠμερησίων στοιχείρων τα ὀποία συμμετέχουν εἰς την στατιστικήν ἀνάλυσιν τῆς γραμμικῆς παλινδρομήσεως.
Δια την ἀνάκτηση των ἀριθμητικῶν δεδομένων δια τα θανατηφόρα κρούσματα ἀπό τον ἐν λόγῳ ἱστότοπο ἀκολουθεῖται ἡ ἀκόλουθος μεθοδολογία :
Σε κάθε σελίδα χώρας τοῦ worldometers ὄπου ὑπάρχουν διαγράμματα, κάνουμε δεξί κλίκ, ἐπιλέγουμε "View page source" και παρατηροῦμε ἐκεῖ ὄλον τον προγραμματισμό τῆς ἰστοσελίδας. Ἐκεῖ ἀνατρέχουμε ἐντός τῆς σελίδος ταύτης και ἀναγνωρίζουμε πίνακες ἀριθμητικῶν δεδομένων (χρονοσειρές) με τα στοιχεία ἐνδιαφέροντος ἀναφορικά με τα διαγράμματα ἐνδιαφέροντος.
Τους πίνακες αὐτούς τους ἐπιλέγοὐμε με το ποντίκι καὶ κάνουμε copy. Τα δεδομένα αὐτά τα ἐπικολάμε (paste) σε ἔνα κελί τοῦ EXCEL. Μετά τὰ διαχωρίζουμε σε πολλά διαδοχικά κελιά του EXCEL χρησιμοποιώντας την ἀλληλουχία ἐντολῶν :
Δεδομένα -- Κείμενο σε στῆλες -- Ὀριοθετημένο -- "Χαρακτήρας tab" και "κόμμα" --> Τέλος
Με τον τρόπο αὐτό δημιουργοῦμε ἔνα ὀριζόντιο πίνακα Excel (χρονοσειρά) με τα δεδομένα ἐνδιαφέροντος.
Εἰς τον πίνακα τῶν ἀποτελεσμάτων δίδονται τα ἐξῆς : με Η εἶναι ἡ ἡμερομηνία ἐμφανίσεως τοῦ πρώτου θανατηφόρου κρούσματος σε κάθε χώρα, d εἶναι ο ἀριθμός ἠμερῶν μετά το πρῶτο θανατηφόρω κρούσμα, μετά τῶν ὀποίων λαμβάνονται τα ἠμερήσια στοιχεία θανατηφόρων κρουσμάτων προκειμένου να ἔχει ἐπιτευχθῇ μία ἐξομάλυνσι τῶν στοιχείων αὐτῶν, C(d) εἶναι το πλῆθος τῶν ἐν λόγῳ κρουσμάτων κατά την ἠμέραν d καὶ Ν εἶναι το συνολικό πλῆθος ἠμερησίων στοιχείρων τα ὀποία συμμετέχουν εἰς την στατιστικήν ἀνάλυσιν τῆς γραμμικῆς παλινδρομήσεως.
4. ΜΕΘΟΔΟΛΟΓΙΑ ΠΡΟΣΟΜΟΙΩΣΕΩΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ ἈΝΑΛΥΣΕΩΣ
Ἡ ἀνάλυσις ποῦ ἀκολουθεῖ σκοπό ἔχει να διαπιστώσῃ τας ἀποκλίσεις ἐκ τῆς ἐκθετικῆς καμπύλης, τῆς καμπύλης ἐξελίξεως τῶν θανατηφόρων κρουσμάτων καὶ στηρίζεται εἰς τὸν παγκοίνως γνωστό δημογραφικό μαθηματικόν τύπον (βαρβαριστί μοντέλο) τῶν προσομοιώσεων τῶν κρουσμάτων Κορονοϊοῦ ὁ ὀποῖος καλεῖται Generalized Growth Model (GGM) το ὀποῖο ἐφαρμόζουμε ἐδῶ προκειμένου να ἐκτιμήσῳμεν την ἀπόκλισιν ἀπό τον ἐκθετικό χαρακτήρα τῆς καμπύλης ὀποία προκύπτει ἀπό την διαφορική ἐξίσωσιν (dC(t)/dt = r C(t)^p) με βάση τα δεδομένα τῆς ἀναφοράς
https://www.sciencedirect.com/…/artic…/pii/S1755436516000037
ὄπου C(t) εἶναι ο ἀθροιστικός ἀριθμός κρουσμάτων καὶ dC(t)/dt εἶναι η παράγωγος τῆς συναρτήσεως C(t) δλδ ὁ ρυθμός μεταβολῆς (αὐξήσεως) τῶν κρουσμάτων κατά την χρονική στιγμή t. Αἱ τιμαί τῶν παραμέτρων r καὶ p ἐκτιμώνται ἐδῶ με την μέθοδο τῶν ἐλαχίστων τετραγώνων δια την ἐφαρμογή τῆς ὀποίας σε ἐκθετικοῦ τύπου συναρτήσεις ὄπως εἶναι η C'(t) λαμβάνονται πρώτα οι λογάριθμοι τῆς ἐξισώσεως ὤστε να ἐπέλθει γραμμικοποίησις τοῦ προβλήματος ὠς ἐξῆς :
ln(C'(t)) = lnr +p ln(C(t)) δηλαδή ἀποκτά την μορφήν Y = α + β.Χ όπου α = lnr καὶ β = r εἶναι σταθερές καὶ ὀχι συναρτήσεις τοῦ χρόνου.
Τα ἀριθμητικά δεδομένα δια την συνάρτηση Υ = C(t) ὑπάρχουν δια κάθε χρονική στιγμή ἐνῶ τα δεδομένα δια την παράγωγο C'(t) για μία χρονική στιγμή t κατασκευάζονται ἐδῶ ὡς ἐξῆς :
C'(t) = [C(t+1) - C(t-1)]/2 . Ἐφαρμόζοντας τους ἀλγορίθμους τῆς γραμμικῆς παλινδρομήσεως εἰς το EXCEL δια την χρονοσειρά τῶν στοιχείων ln(C(t)) και ln(C'(t)) προκύπτοὐν οἱ συντελεσταὶ p καὶ lnr ἤ δηλαδή τοῦ r = exp(lnr). Ἐπίσης προκύπτουν καὶ συντελεσταὶ t στατιστικῆς ἀξιοπιστίας κατά Student οι ὀποῖοι ἐφ' ὄσον εἶναι ἀπολύτως > 2 τότε η συσχέτισις εἶναι στατιστικῶς ἀξιόπιστη. Τέλος εἰς τον πίνακα τῶν ἀποτελεσμάτων δίδεται καὶ ο συντελεστής προσδιοριμοῦ R^2 ο ὀποῖος δια την χώρα μας εἶναι μᾶλλον χαμηλός γεγονός που ἀποδίδεται εις τας μεγάλας διακυμάνσεις καὶ την ἀντίστοιχον διασπορά τῆς πρώτης παραγώγου τοῦ C(t). Αὐτό ὅμως δεν ἀναιρεῖ την στατιστική ἀξιοπιστία τῆς εκτιμήσεως δια την παράμετρον p λόγω ἀκριβῶς τῆς ἰκανοποιήσεως τοῦ κριτηρίου κατά t-Student.
Τέλος ὄπως ἐπεξηγεῖται εἰς την ἀνωτέρω ἀναφορά, ο μαθηματικός τύπος τῆς προσομοιῶσεως τῆς καμπύλης ἔχει την μορφήν (βλέπει ἄρθρο εἰς την ἀνωτέρω ἀναφοράν):
C(t) = ( t. r/m +A)^m, ὄπου m = 1/(1-p) εἶναι ο ἀντίστοιχος πολυωνυμικός βαθμός τῆς καμπύλης καὶ A εἶναι μία σταθερά που ἐξαρτάται ἀπό τις ἀρχικές συνθήκες C(0)
Ἡ ἀνάλυσις ποῦ ἀκολουθεῖ σκοπό ἔχει να διαπιστώσῃ τας ἀποκλίσεις ἐκ τῆς ἐκθετικῆς καμπύλης, τῆς καμπύλης ἐξελίξεως τῶν θανατηφόρων κρουσμάτων καὶ στηρίζεται εἰς τὸν παγκοίνως γνωστό δημογραφικό μαθηματικόν τύπον (βαρβαριστί μοντέλο) τῶν προσομοιώσεων τῶν κρουσμάτων Κορονοϊοῦ ὁ ὀποῖος καλεῖται Generalized Growth Model (GGM) το ὀποῖο ἐφαρμόζουμε ἐδῶ προκειμένου να ἐκτιμήσῳμεν την ἀπόκλισιν ἀπό τον ἐκθετικό χαρακτήρα τῆς καμπύλης ὀποία προκύπτει ἀπό την διαφορική ἐξίσωσιν (dC(t)/dt = r C(t)^p) με βάση τα δεδομένα τῆς ἀναφοράς
https://www.sciencedirect.com/…/artic…/pii/S1755436516000037
ὄπου C(t) εἶναι ο ἀθροιστικός ἀριθμός κρουσμάτων καὶ dC(t)/dt εἶναι η παράγωγος τῆς συναρτήσεως C(t) δλδ ὁ ρυθμός μεταβολῆς (αὐξήσεως) τῶν κρουσμάτων κατά την χρονική στιγμή t. Αἱ τιμαί τῶν παραμέτρων r καὶ p ἐκτιμώνται ἐδῶ με την μέθοδο τῶν ἐλαχίστων τετραγώνων δια την ἐφαρμογή τῆς ὀποίας σε ἐκθετικοῦ τύπου συναρτήσεις ὄπως εἶναι η C'(t) λαμβάνονται πρώτα οι λογάριθμοι τῆς ἐξισώσεως ὤστε να ἐπέλθει γραμμικοποίησις τοῦ προβλήματος ὠς ἐξῆς :
ln(C'(t)) = lnr +p ln(C(t)) δηλαδή ἀποκτά την μορφήν Y = α + β.Χ όπου α = lnr καὶ β = r εἶναι σταθερές καὶ ὀχι συναρτήσεις τοῦ χρόνου.
Τα ἀριθμητικά δεδομένα δια την συνάρτηση Υ = C(t) ὑπάρχουν δια κάθε χρονική στιγμή ἐνῶ τα δεδομένα δια την παράγωγο C'(t) για μία χρονική στιγμή t κατασκευάζονται ἐδῶ ὡς ἐξῆς :
C'(t) = [C(t+1) - C(t-1)]/2 . Ἐφαρμόζοντας τους ἀλγορίθμους τῆς γραμμικῆς παλινδρομήσεως εἰς το EXCEL δια την χρονοσειρά τῶν στοιχείων ln(C(t)) και ln(C'(t)) προκύπτοὐν οἱ συντελεσταὶ p καὶ lnr ἤ δηλαδή τοῦ r = exp(lnr). Ἐπίσης προκύπτουν καὶ συντελεσταὶ t στατιστικῆς ἀξιοπιστίας κατά Student οι ὀποῖοι ἐφ' ὄσον εἶναι ἀπολύτως > 2 τότε η συσχέτισις εἶναι στατιστικῶς ἀξιόπιστη. Τέλος εἰς τον πίνακα τῶν ἀποτελεσμάτων δίδεται καὶ ο συντελεστής προσδιοριμοῦ R^2 ο ὀποῖος δια την χώρα μας εἶναι μᾶλλον χαμηλός γεγονός που ἀποδίδεται εις τας μεγάλας διακυμάνσεις καὶ την ἀντίστοιχον διασπορά τῆς πρώτης παραγώγου τοῦ C(t). Αὐτό ὅμως δεν ἀναιρεῖ την στατιστική ἀξιοπιστία τῆς εκτιμήσεως δια την παράμετρον p λόγω ἀκριβῶς τῆς ἰκανοποιήσεως τοῦ κριτηρίου κατά t-Student.
Τέλος ὄπως ἐπεξηγεῖται εἰς την ἀνωτέρω ἀναφορά, ο μαθηματικός τύπος τῆς προσομοιῶσεως τῆς καμπύλης ἔχει την μορφήν (βλέπει ἄρθρο εἰς την ἀνωτέρω ἀναφοράν):
C(t) = ( t. r/m +A)^m, ὄπου m = 1/(1-p) εἶναι ο ἀντίστοιχος πολυωνυμικός βαθμός τῆς καμπύλης καὶ A εἶναι μία σταθερά που ἐξαρτάται ἀπό τις ἀρχικές συνθήκες C(0)