Ένας νέος αλγόριθμος της Δανίας εκμεταλλεύεται το γεγονός ότι τόσο η γλώσσα όσο και η ζωή είναι ακολουθίες
Η συγγραφέας είναι σχολιαστής επιστήμης
Οι ζωές μας, όπως και οι ιστορίες, ακολουθούν αφηγηματικά τόξα. Κάθε ένα ξετυλίγεται μοναδικά σε κεφάλαια που φέρουν γνωστές επικεφαλίδες: σχολείο, καριέρα, μετακόμιση στο σπίτι, τραυματισμός, ασθένεια. Κάθε ιστορία, ήζωή, έχει μια αρχή, μια μέση και ένα απρόβλεπτο τέλος.
Τώρα, σύμφωνα με τους επιστήμονες, κάθε ιστορία ζωής είναι το χρονικό ενός προαναγγελθέντος θανάτου. Χρησιμοποιώντας τα δεδομένα του μητρώου της Δανίας, τα οποία περιέχουν πληθώρα καθημερινών πληροφοριών σχετικά με την εκπαίδευση, τον μισθό, την εργασία, τις ώρες εργασίας, τη στέγαση και τις επισκέψεις γιατρούς, οι ακαδημαϊκοί ανέπτυξαν έναν αλγόριθμο που μπορεί να προβλέψει την πορεία της ζωής ενός ατόμου, συμπεριλαμβανομένου του πρόωρου θανάτου, με τον ίδιο τρόπο που τα μεγάλα γλωσσικά μοντέλα (LLM) όπως το ChatGPT μπορούν να προβλέψουν προτάσεις. Ο αλγόριθμος ξεπέρασε τα άλλα μοντέλα πρόβλεψης, συμπεριλαμβανομένων των αναλογιστικών πινάκων που χρησιμοποιούνται από τον ασφαλιστικό κλάδο.
Το ότι οι σύνθετες υπάρξεις μας μπορούν να αναλυθούν σαν αποκόμματα κειμένου είναι συναρπαστικό και ανησυχητικό. Ενώ γνωρίζουμε ότι ένα γενναιόδωρο εισόδημα συσχετίζεται με μεγαλύτερο προσδόκιμο ζωής, η σύνδεση τεράστιων ποσοτήτων διαφορετικών δεδομένων θα μπορούσε να αποκαλύψει άλλους τρόπους με τους οποίους οι κοινωνικοί παράγοντες επηρεάζουν την υγεία. Αυτό θα μπορούσε να ενημερώσει τους υπεύθυνους χάραξης πολιτικής που επιδιώκουν να βελτιώσουν τις πιθανότητες να ζήσουμε μεγαλύτερη και υγιέστερη ζωή.
Στην αρνητική πλευρά, υπάρχει κάτι σχεδόν παράλογα μειωτικό σχετικά με την ιδέα ενός DeathGPT. Κάθε χάντρα στο κολιέ της ζωής – παρακολούθηση μαθημάτων, αύξηση μισθού, απώλεια γονέα – μοιάζει πολύ προσωπική για να τροφοδοτήσει ένα προβλέψιμο σύνολο δεδομένων. Όμως, σε μια εποχή big data και τεχνητής νοημοσύνης, θα χρειαστεί να αποδεχτούμε ότι αυτές οι βαθιά αισθητές ποιοτικές εμπειρίες μπορούν να αποτυπωθούν ποσοτικά με τρόπους που, μέσα από τις ράβδους των σφαλμάτων, σκιαγραφούν την ατομική μοίρα.
Η Sune Lehmann, από το Τεχνικό Πανεπιστήμιο της Δανίας, η οποία ηγήθηκε της έρευνας που δημοσιεύτηκε τον περασμένο μήνα στο Nature Computational Science, δεν βρίσκει την ιδέα αποσυντονιστική. «Νομίζω ότι η ομοιότητα μεταξύ κειμένου και ζωής είναι βαθιά και πολύπλευρη», μου είπε μέσω email. «Είναι λογικό για μένα ότι ο αλγόριθμός μας μπορεί να προβλέψει το επόμενο βήμα στις ανθρώπινες ζωές».
Και η γλώσσα και η ζωή είναι αλληλουχίες. Οι ερευνητές, που προέρχονται από το Πανεπιστήμιο της Κοπεγχάγης και το Πανεπιστήμιο Northeastern της Βοστώνης, εκμεταλλεύτηκαν αυτή την ομοιότητα. Αρχικά, συνέταξαν ένα «λεξιλόγιο» γεγονότων ζωής, δημιουργώντας ένα είδος συνθετικής γλώσσας και το χρησιμοποίησαν για να κατασκευάσουν «προτάσεις». Ένα δείγμα πρότασης μπορεί να είναι: «Κατά τη διάρκεια του τρίτου έτους της στο οικοτροφείο δευτεροβάθμιας εκπαίδευσης, η Ερμιόνη ακολούθησε πέντε μαθήματα επιλογής».
Ακριβώς όπως τα LLM εξορύσσουν το κείμενο για να καταλάβουν τις σχέσεις μεταξύ των λέξεων, ο αλγόριθμος life2vec, που τροφοδοτείται με τις ανασυσταμένες ιστορίες ζωής των 6 εκατομμυρίων κατοίκων της Δανίας μεταξύ 2008 και 2015, εξόρυξε αυτές τις περιλήψεις για να εντοπίσει παρόμοιες σχέσεις.
Μετά ήρθε η στιγμή του υπολογισμού: πόσο καλά θα μπορούσε να εφαρμόσει αυτή την εκτεταμένη εκπαίδευση για να κάνει προβλέψεις από το 2016 έως το 2020; Μεταξύ των δοκιμών αλγορίθμων, οι ερευνητές μελέτησαν ένα δείγμα 100.000 ατόμων ηλικίας 35-65 ετών, οι μισοί από τους οποίους είναι γνωστό ότι επέζησαν και οι μισοί πέθαναν κατά τη διάρκεια αυτής της περιόδου. Όταν ζητήθηκε να μαντέψει ποιοι πέθαναν, το life2vec τα κατάφερε στο 79% των περιπτώσεων (η τυχαία εικασία δίνει ποσοστό επιτυχίας 50%). Ξεπέρασε τα επόμενα καλύτερα μοντέλα πρόβλεψης, είπε η Lehmann, κατά 11%.
Ενώ η δημοσίευση υποστηρίζει ότι «οι ακριβείς μεμονωμένες προβλέψεις είναι πράγματι δυνατές», ο αλγόριθμος παρέχει μια πιθανότητα θανάτου σε μια συγκεκριμένη περίοδο και όχι μια ακριβή ημερομηνία. Υπάρχουν προειδοποιήσεις: αυτό που ισχύει στη Δανία ενδέχεται να μην ισχύει αλλού και ο αλγόριθμος κωδικοποιεί προκαταλήψεις στα δεδομένα εκπαίδευσης. Ακόμα κι έτσι, δεδομένης της δυνατότητάς του να βελτιστοποιήσει την πρόβλεψη κινδύνου, ο αντίκτυπος στον ασφαλιστικό κλάδο θα αξίζει να παρακολουθηθεί. Από την πλευρά τους, οι ερευνητές δεν θέλουν το έργο τους να χρησιμοποιείται από ασφαλιστικές εταιρείες και κρατούν προς το παρόν τον αλγόριθμο και τα δεδομένα κρυφά.
Αλλά πιο συναρπαστικό από τα αποτελέσματα, τονίζουν οι ερευνητές, είναι ότι το life2vec είναι γενικό και όχι ειδικό για εργασία. Στα υπάρχοντα προγνωστικά μοντέλα, οι ερευνητές πρέπει να προκαθορίζουν μεταβλητές που έχουν σημασία, όπως η ηλικία, το φύλο και το εισόδημα. Αντίθετα, αυτή η προσέγγιση καταπίνει όλα τα δεδομένα και μπορεί ανεξάρτητα να επηρεάσει σχετικούς παράγοντες (διαπίστωσε ότι το εισόδημα μετράει θετικά για την επιβίωση, για παράδειγμα, και ότι μια διάγνωση ψυχικής υγείας μετράει αρνητικά). Αυτό θα μπορούσε να υποδείξει στους ερευνητές προηγούμενες ανεξερεύνητες επιπτώσεις στην υγεία – και μπορεί να αποκαλύψει νέους δεσμούς μεταξύ φαινομενικά άσχετων προτύπων συμπεριφοράς.
Μία από τις αυξανόμενες ανησυχίες της Lehmann είναι το απόρρητο: επισημαίνει ότι εταιρείες όπως η Google συναρμολογούν μηχανές μυϊκής πρόβλεψης, χρησιμοποιώντας πληθώρα προσωπικών δεδομένων που συλλέγονται από το Διαδίκτυο.
Αυτή είναι μια εποχή απαράμιλλης προβλεψιμότητας στις ανθρώπινες ζωές — και μια εποχή απαράμιλλης δύναμης για όσους μπορούν να διαβάσουν τις ιστορίες μας πριν τις ζήσουμε.
Πηγή ΟΤ, https://www.in.gr/2024/01/13/in-science/technology/tha-mporouse-enas-ypologistis-thanatou-ai-na-einai-pragmatika-kalo-pragma/