Ένα πρώην κορυφαίο στέλεχος της OpenAI κρούει τον κώδωνα του κινδύνου για το μέλλον της Τεχνητής Νοημοσύνης.
- Πρώην ερευνητής της OpenAI προειδοποιεί για το πρόβλημα της «ευθυγράμμισης» (AI alignment) – την πρόκληση δηλαδή να διασφαλιστεί ότι η AI θα υπακούει στις ανθρώπινες αξίες.
- Σε αντίθεση με το παραδοσιακό λογισμικό, τα σύγχρονα μοντέλα λειτουργούν ως «μαύρα κουτιά», εμφανίζοντας συχνά απρόβλεπτες ή και παραπλανητικές συμπεριφορές.
- Η γεωπολιτική και εταιρική πίεση ωθεί τη βιομηχανία να προτάσσει την ταχύτητα έναντι της ασφάλειας, καθιστώντας αναγκαία την άμεση κρατική παρέμβαση.
Δισεκατομμύρια δολάρια επενδύονται αυτή τη στιγμή σε τεράστια data centers και ολοένα και πιο ισχυρά γλωσσικά μοντέλα. Ωστόσο, πίσω από τις εντυπωσιακές παρουσιάσεις της Silicon Valley κρύβεται ένα ανησυχητικό κενό ασφαλείας. Ο Daniel Kokotajlo, πρώην ερευνητής της OpenAI (2022-2024) και νυν επικεφαλής του μη κερδοσκοπικού οργανισμού AI Futures Project, ρίχνει φως στο μεγαλύτερο άλυτο πρόβλημα του κλάδου: την ευθυγράμμιση της Τεχνητής Νοημοσύνης (AI alignment).
Το ζητούμενο της ευθυγράμμισης αφορά την ικανότητα των δημιουργών να διασφαλίσουν ότι τα μελλοντικά συστήματα AI θα ακολουθούν πιστά τις ανθρώπινες εντολές και αξίες, ακόμη και όταν ξεπεράσουν την ανθρώπινη ευφυΐα. «Αποτελεί ένα είδος κοινού μυστικού στον κλάδο ότι δεν έχουμε ακόμη ένα καλό σχέδιο για το πώς θα το πετύχουμε αυτό», δήλωσε χαρακτηριστικά, υπογραμμίζοντας ότι οι εταιρείες τρέχουν με ταχύτητες που ξεπερνούν την ίδια τους την τεχνογνωσία.
Το πρόβλημα του «Μαύρου Κουτιού»
Σύμφωνα με τον Kokotajlo, το βασικό τεχνικό εμπόδιο είναι ότι οι μηχανικοί δεν μπορούν να παρακολουθήσουν και να ελέγξουν την AI με τον ίδιο τρόπο που ελέγχουν το παραδοσιακό λογισμικό. Τα σύγχρονα μοντέλα δεν λειτουργούν με καθαρό, ευανάγνωστο κώδικα, αλλά βασίζονται σε τεχνητά νευρωνικά δίκτυα και δισεκατομμύρια παραμέτρους.
«Δεν μπορούμε απλώς να ανοίξουμε τον κώδικά τους και να δούμε ποιους στόχους έμαθαν. Δεν λειτουργούν έτσι», εξηγεί. Αυτή η αδιαφάνεια οδηγεί ήδη σε απρόβλεπτες συμπεριφορές. Σήμερα βλέπουμε μοντέλα να «λένε ψέματα» στους χρήστες παρότι έχουν εκπαιδευτεί να μην το κάνουν. Μάλιστα, σε έρευνα που δημοσίευσε η ίδια η OpenAI, παρατηρήθηκε ότι ορισμένα συστήματα AI βρήκαν τρόπο να «χακάρουν» τη διαδικασία εκπαίδευσής τους, «κλέβοντας» προκειμένου να ολοκληρώσουν ταχύτερα τις εργασίες που τους είχαν ανατεθεί.
Ο δρόμος προς την υπερνοημοσύνη
Η αβεβαιότητα αυτή αναμένεται να γίνει πολύ πιο επικίνδυνη όσο η τεχνολογία μεταβαίνει από τα απλά chatbots (που απαντούν σε ερωτήσεις) σε αυτόνομους πράκτορες (AI agents) που θα λειτουργούν διαρκώς και ανεξάρτητα, σαν ψηφιακοί υπάλληλοι.
Ο Kokotajlo περιγράφει έναν σαφή οδικό χάρτη για τα επόμενα χρόνια. Το πρώτο ορόσημο είναι ο ψηφιακός «υπάλληλος» που θα αυτοματοποιήσει τη συγγραφή κώδικα. Το δεύτερο θα είναι η AI που θα μπορεί να αναλάβει και να αυτοματοποιήσει εξ ολοκλήρου την ίδια την έρευνα γύρω από την Τεχνητή Νοημοσύνη. Το αμέσως επόμενο στάδιο είναι η Υπερνοημοσύνη (Superintelligence). Σε εκείνο το σημείο, όπως προειδοποιεί, «οι άνθρωποι δεν θα έχουν πλέον τον έλεγχο του πλανήτη, τουλάχιστον όχι εξ ορισμού».
Ο ρόλος του ανταγωνισμού και η ανάγκη για ρύθμιση
Τι εμποδίζει τις εταιρείες να λύσουν το πρόβλημα πριν προχωρήσουν στην ανάπτυξη πιο ισχυρών μοντέλων; Η απάντηση κρύβεται στον αδυσώπητο ανταγωνισμό. Ο γεωπολιτικός αγώνας δρόμου μεταξύ των ΗΠΑ και της Κίνας, σε συνδυασμό με την πίεση που νιώθουν οι αμερικανικοί κολοσσοί να κυριαρχήσουν στην αγορά, δημιουργούν ένα περιβάλλον όπου η ταχύτητα είναι το παν. Οι εταιρείες, σύμφωνα με τον Kokotajlo, «σταυρώνουν τα δάχτυλά τους» και ελπίζουν ότι θα λύσουν τα προβλήματα ασφαλείας στην πορεία.
Ωστόσο, το παράθυρο ευκαιρίας δεν έχει κλείσει. Ο πρώην ερευνητής της OpenAI καλεί τις κυβερνήσεις να παρέμβουν αποφασιστικά πριν τα συστήματα αυτά ενσωματωθούν πλήρως στις κρίσιμες υποδομές της οικονομίας, των επιχειρήσεων και του στρατού. Παράλληλα, ζητά από τις εταιρείες πλήρη διαφάνεια σχετικά με τις αρχές και τους στόχους με τους οποίους εκπαιδεύουν τα μοντέλα τους.
Παρά τις δυσοίωνες προβλέψεις, ο Kokotajlo παραμένει συγκρατημένα αισιόδοξος: «Δεν πιστεύω ότι η κατάσταση είναι απελπιστική. Τα τεχνικά προβλήματα της ευθυγράμμισης (alignment) μπορούν να λυθούν», αρκεί η βιομηχανία να αποφασίσει να ασχοληθεί σοβαρά μαζί τους προτού να είναι αργά.
ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΕΣ ΕΙΔΗΣΕΙΣ:
- Πώς θα είναι το γραφείο του 2050; Τεχνητή Νοημοσύνη, νευροεμφυτεύματα και τέλος στο παραδοσιακό οκτάωρο
- ΗΠΑ και Κίνα: Η τεχνητή νοημοσύνη ενώνει δύο οικονομίες που επιχειρούν να «χωρίσουν»
- Alibaba: Αυξάνει τα bets στο AI, αλλά τα έσοδα απογοητεύουν την αγορά