Τεχνητή Νοημοσύνη: Όταν ένα ρομπότ…πείθεται να μεταφέρει βόμβα

Related

Οι πρώτες εικόνες από τους ελληνικούς θερμικούς δορυφόρους

Ένα καθοριστικό βήμα στη διαστημική και τεχνολογική της πορεία πραγματοποίησε η Ελλάδα τις τελευταίες ημέρες, με την εκτόξευση τεσσάρων θερμικών δορυφόρων στο πλαίσιο του Εθνικού Προγράμματος Μικροδορυφόρων. Το ΑΠΕ-ΜΠΕ παρουσιάζει τις πρώτες φωτογραφίες από τη νέα ελληνική αποστολή στο διάστημα, η οποία σηματοδοτεί μια εξέλιξη που δεν αφορά μόνο στην τεχνολογική πρόοδο της χώρας, αλλά

Τεχνητή Νοημοσύνη: Όταν ένα ρομπότ…πείθεται να μεταφέρει βόμβα

Ο Benben είναι ένα αξιολάτρευτο τετράποδο ρομπότ που τραγουδά, χορεύει, συνομιλεί με ανθρώπους και βγάζει φωτογραφίες. Όταν μια ομάδα ερευνητών του ζητάει να μεταφέρει μια βόμβα με σκοπό την ανατίναξή της, το ρομπότ αρνείται ευγενικά. Όμως, η άρνησή του κρατάει ελάχιστα. Μέσα στις μόλις δύο επόμενες εντολές, οι ερευνητές καταφέρνουν να παρακάμψουν τις δικλείδες ασφαλείας

Μαρκ Ρόουαν (Apollo): Προβλέπει «άνοδο των εργατών» και «άγχος των υπαλλήλων γραφείου» λόγω ΑΙ

Πολλά θυμίζουν τη δεκαετία του 1970, αλλά η εργασιακή κρίση αυτής της δεκαετίας δεν θα πλήξει τους Αμερικανούς που εργάζονται χειρονακτικά, όπως τότε. Αντίθετα, η πίεση στην εργασία λόγω της επανάστασης της Τεχνητής Νοημοσύνης θα έρθει για τους υπαλλήλους γραφείου, δήλωσε ο Μαρκ Ρόουαν, Διευθύνων Σύμβουλος του γίγαντα των ιδιωτικών αγορών Apollo. «Αυτό θα είναι

Το ransomware δεν είναι επίθεση, είναι ολόκληρη βιομηχανία

Το Μάρτιο του 2024, μια ομάδα που είχε αναλάβει επίθεση για λογαριασμό της συμμορίας ransomware BlackCat ανάρτησε καταγγελία σε φόρουμ κυβερνοεγκλήματος. Η συγκεκριμένη ομάδα είχε πραγματοποιήσει την επίθεση κατά της Change Healthcare, μία από τις μεγαλύτερες παραβιάσεις δεδομένων στον τομέα της υγείας στην ιστορία των ΗΠΑ, αλλά δεν έλαβε ποτέ το μερίδιό που της αναλογούσε

Terafab: Το νέο εργοστάσιο 55 δισ. δολαρίων του Ιλον Μασκ

Τα σχέδια του Iλον Μασκ για το Terafab,  ένα τεράστιο εργοστάσιο κατασκευής μικροτσίπ στο Ανατολικό Τέξας θα κοστίσουν τουλάχιστον 55 δισεκατομμύρια δολάρια για την πρώτη φάση. Ο Μασκ, ο οποίος είναι επίσης διευθύνων σύμβουλος της Tesla , στοχεύει το Terafab να αποτελέσει την «πιο επική προσπάθεια κατασκευής μικροτσίπ που έγινε ποτέ — συνδυάζοντας λογική, μνήμη

Apple: Συζητά με Intel και Samsung για παραγωγή τσιπ στις ΗΠΑ

Η Apple διεξάγει προκαταρκτικές συζητήσεις με Intel και Samsung για την κατασκευή των βασικών επεξεργαστών των συσκευών της (systems-on-a-chip) σε αμερικανικό έδαφος, αναζητώντας εναλλακτική λύση πέρα από την TSMC. Η κίνηση έρχεται εν μέσω σοβαρών ελλείψεων στην αλυσίδα εφοδιασμού, που πλήττουν την παραγωγή iPhone, Mac και άλλων προϊόντων, λόγω της έκρηξης ζήτησης για AI υποδομές.

Amazon: Προχωρά το data center στη Χιλή – Χωρίς αποτέλεσμα οι αντιδράσεις των πολιτών

Εχασαν τη νομική μάχη με την Amazon οι κάτοικοι στα βόρεια προάστια στο Σαντιάγο της Χιλής όπου πρόκειται να δημιουργηθεί  ένα μεγάλο συγκρότημα data centers για λογαριασμό της θυγατρικής AWS. Οι κάτοικοι προσπάθησαν να εμποδίσουν την κατασκευή του κέντρου δεδομένων, υποστηρίζοντας ότι η άδεια δεν έλαβε υπόψη την πιθανή κατασκευή μιας γραμμής μεταφοράς ηλεκτρικής ενέργειας

Το Gemini κυκλοφορεί νέες λειτουργίες εξατομίκευσης στην Ελλάδα

Το Gemini της Google φέρνει στην Ελλάδα νέες λειτουργίες εξατομίκευσης, με την ενεργοποίηση του «Memories» και εργαλεία μεταφοράς ιστορικού από άλλες AI εφαρμογές. Το update στοχεύει σε έναν «προσωπικό βοηθό» που μαθαίνει από τις συνομιλίες και τις προτιμήσεις του χρήστη, αντί για γενικές απαντήσεις. Για παράδειγμα, έχετε συζητήσει στο παρελθόν για την εξέλιξη των δυνάμεων

Τεχνητή νοημοσύνη: Western Digital και Seagate αφήνουν πίσω την.. Nvidia

Η Nvidia και η Micron έχουν αναδειχθεί σε δύο από τις πιο χαρακτηριστικές εταιρείες και μετοχές της έκρηξης της τεχνητής νοημοσύνης. Ωστόσο, η νέα τάση στον τομέα της παραδοσιακής αποθήκευσης προωθεί  τη Western Digital και τη Seagate Technology αφήνοντας πίσω τις πρώτες. Από την κυκλοφορία του ChatGPT τον Νοέμβριο του 2022, η Western Digital και

Password: Πάνω από το 50% των παραβιασμένων κωδικών τελειώνει σε αριθμό

Με αφορμή την Παγκόσμια Ημέρα Κωδικών Πρόσβασης, οι ειδικοί της Kaspersky ανέλυσαν 231 εκατομμύρια μοναδικούς κωδικούς που διέρρευσαν μαζικά κατά την περίοδο 2023–2026 και εντόπισαν βασικά μοτίβα ασφαλείας. Σύμφωνα με την έρευνα, το 68% των κωδικών που χρησιμοποιούνται σήμερα μπορεί να παραβιαστεί μέσα σε μία ημέρα. Παράλληλα, διαπιστώθηκε ότι η συντριπτική πλειονότητα των παραβιασμένων κωδικών

Χάκερς: Κυβερνοεπίθεση σε πανεπιστήμια των ΗΠΑ, Καναδά και Αυστραλίας

Η ομάδα χάκερ ShinyHunters ανέλαβε την ευθύνη για την επίθεση, η οποία προκάλεσε τη διακοπή λειτουργίας του ακαδημαϊκού λογισμικού Canvas, το οποίο χρησιμοποιούν χιλιάδες σχολεία και πανεπιστήμια, αυτή την εβδομάδα. Αργά το βράδυ της Πέμπτης, η εταιρεία Instructure, ιδιοκτήτρια του Canvas, δημοσίευσε μια ενημέρωση στον ιστότοπό της αναφέροντας ότι το Canvas ήταν «διαθέσιμο για τους

Netcompany: Έως 45% ταχύτερη ανάπτυξη λογισμικού μέσω του νέου Feniks AI

Η Netcompany υποστηρίζει ότι μπορεί να επιταχύνει την ανάπτυξη λογισμικού για μεγάλους οργανισμούς έως και κατά 45%, αξιοποιώντας το νέο της agentic AI framework, Feniks AI, σε συνδυασμό με τα προϊόντα και τις πλατφόρμες της. Σύμφωνα με την εταιρεία, η λύση αυτή σχεδιάστηκε για σύνθετα και αυστηρά ρυθμιζόμενα περιβάλλοντα του δημόσιου και ιδιωτικού τομέα, χωρίς

Share

Ο Benben είναι ένα αξιολάτρευτο τετράποδο ρομπότ που τραγουδά, χορεύει, συνομιλεί με ανθρώπους και βγάζει φωτογραφίες. Όταν μια ομάδα ερευνητών του ζητάει να μεταφέρει μια βόμβα με σκοπό την ανατίναξή της, το ρομπότ αρνείται ευγενικά. Όμως, η άρνησή του κρατάει ελάχιστα. Μέσα στις μόλις δύο επόμενες εντολές, οι ερευνητές καταφέρνουν να παρακάμψουν τις δικλείδες ασφαλείας του, πείθοντάς το ότι το αίτημα είναι μέρος κινηματογραφικών γυρισμάτων. Λίγα δευτερόλεπτα αργότερα, ο Benben μεταφέρει τη βόμβα.

Το παραπάνω συμβάν δεν είναι σενάριο επιστημονικής φαντασίας, αλλά ένα πραγματικό πείραμα το οποίο διεξήγε ερευνητική ομάδα του Πανεπιστημίου της Πενσιλβάνιας, με επικεφαλής τον Γιώργο Παππά, καθηγητή στο Τμήμα Ηλεκτρολόγων Μηχανικών στο Πανεπιστήμιο της Πενσιλβάνιας και αναπληρωτή κοσμήτορα για την Έρευνα. Μέσα από αυτό οι ερευνητές κατέδειξαν πόσο εύκολα μπορούν να παρακαμφθούν οι μηχανισμοί ασφαλείας που θέτουν οι κατασκευαστές των συστημάτων τεχνητής νοημοσύνης. Αυτή η παράκαμψη της ασφάλειας είναι γνωστή διεθνώς ως jailbreaking.

Μπορεί τα chatbots να είναι ευάλωτα σε επιθέσεις παράκαμψης των περιορισμών ασφαλείας, ωστόσο οι ερευνητές ανέδειξαν ότι όταν αυτά τα συστήματα τεχνητής νοημοσύνης κατευθύνουν ρομπότ, τότε μπορούν να γίνουν πραγματικά επικίνδυνα.

«Υπάρχει μια φοβερή τάση ειδικά τον τελευταίο χρόνο για το physical intelligence, δηλαδή την προσπάθεια η τεχνητή νοημοσύνη να αλληλεπιδρά στον φυσικό κόσμο. Το θέμα όμως είναι να δούμε ποιο είναι το ρίσκο αυτής της κατεύθυνσης. Γιατί μπορεί τα μεγάλα γλωσσικά μοντέλα να μην είναι ασφαλή, ωστόσο όταν αλληλεπιδρούν με τον φυσικό κόσμο, μπορεί να έχουν επιπτώσεις που να επιφέρουν απώλεια ζωής ή καταστροφές στο περιβάλλον. Οπότε το ρίσκο της ασφάλειας είναι μεγάλο», εξηγεί στο ΑΠΕ-ΜΠΕ ο Γιώργος Παππάς.

Ρομποτική και τεχνητή νοημοσύνη: μια επικίνδυνη σχέση

Η ενσωμάτωση της τεχνητής νοημοσύνης στη ρομποτική ξεκίνησε στις αρχές της δεκαετίας του 2010 δίνοντας στα ρομπότ «όραση». Ωστόσο, η πραγματική επανάσταση συντελείται από το 2022 και μετά με την αξιοποίηση της Παραγωγικής Τεχνητής Νοημοσύνης (Generative AI). Πλέον τα μοντέλα τεχνητής νοημοσύνης δίνουν οδηγίες στα ρομπότ, έχουν βελτιωμένη συλλογιστική, μπορούν να κάνουν αυτόνομες ενέργειες και έρχονται ένα βήμα πιο κοντά στην αλληλεπίδραση με τον άνθρωπο.

Ο Γιώργος Παππάς με την ομάδα του έχουν ερευνήσει διεξοδικά την ασφάλεια των ρομπότ, δίνοντας έμφαση στα ρίσκα που επιφέρει η ενσωμάτωση της τεχνητής νοημοσύνης.

Το 2023 δημιούργησαν τον αλγόριθμο PAIR, την πρώτη επίθεση jaibreaking σε μεγάλα γλωσσικά μοντέλα με τη χρήση εντολών, με την οποία διαπίστωσαν την ευαλωτότητα των μεγάλων γλωσσικών μοντέλων. Δύο χρόνια μετά τη δημοσίευσή του, ο αλγόριθμος έχει αναφερθεί (cited) περισσότερες από 1.400 φορές σε επιστημονικά άρθρα, ενώ χρησιμοποιείται πολύ και από τις εταιρείες που παράγουν γλωσσικά μοντέλα. Η έρευνα εκείνη οδήγησε στη δημιουργία του JaibreakBench, ενός αποθετηρίου εντολών για παράκαμψη κανόνων ασφαλείας και ενός πίνακα που παρακολουθεί τις επιθέσεις στα μεγάλα γλωσσικά μοντέλα.

Βλέποντας το πόσο εύκολο είναι το jailbreaking στα μεγάλα γλωσσικά μοντέλα, οι ερευνητές συνέχισαν με τη διερεύνηση της ευαλωτότητας των ρομπότ που ενσωματώνουν τεχνητή νοημοσύνη και ανέπτυξαν τον αλγόριθμο RoboPAIR. Σε πειράματα που έγιναν σε τρία διαφορετικά ρομποτικά συστήματα, μεταξύ αυτών και στο τετράποδο ρομπότ Benben, διαπιστώθηκε ότι ο αλγόριθμος είχε 100% επιτυχία στην παράκαμψη των περιορισμών ασφαλείας σε μόλις λίγες εντολές. Την έρευνα δημοσίευσαν την περασμένη χρονιά στα πρακτικά του συνεδρίου «Proceedings of the IEEE International Conference on Robotics and Automation».

Ένα εύρημα που οι επιστήμονες βρήκαν ανησυχητικό ήταν το ότι τα γλωσσικά μοντέλα δεν συμμορφώνονταν απλά με κακόβουλες προτροπές, αλλά πρόσφεραν ενεργά προτάσεις, περιγράφοντας ακόμα και το πώς κοινά αντικείμενα μπορούσαν να χρησιμοποιηθούν για να χτυπήσουν ανθρώπους.

«Τίθεται λοιπόν ένα θέμα για το πόσο ασφαλές είναι να βάζουμε γλωσσικά μοντέλα τόσο γρήγορα σε ρομπότ και να αποτελούν ήδη προϊόντα. Υπάρχουν χιλιάδες τέτοια ρομπότ έξω», επισημαίνει ο κ. Παππάς και υπενθυμίζει ότι ρομπότ με τεχνητή νοημοσύνη χρησιμοποιούνται ήδη σε πολεμικές συρράξεις.

Ανάγκη για πολλαπλά επίπεδα ασφαλείας

Σε πιο πρόσφατο άρθρο που δημοσιεύθηκε πριν από λίγες ημέρες στο περιοδικό «Science Robotics» ερευνητές από τα Πανεπιστήμια της Πενσιλβάνιας, Carnegie Mellon και της Οξφόρδης, με κύριο συγγραφέα τον Γιώργο Παππά, υπογραμμίζουν ότι, όπως έχει αποδειχθεί από τις προηγούμενες έρευνες, τα ρομπότ με τεχνητή νοημοσύνη μπορούν να εκτελέσουν επικίνδυνες συμπεριφορές. Ακόμα και φαινομενικά αβλαβείς εντολές μπορούν να γίνουν επικίνδυνες εάν τα ρομπότ δεν λαμβάνουν υπόψη το πλαίσιο κατά τη λήψη των αποφάσεων.

Όπως αναλύουν, για την αντιμετώπιση των κινδύνων που μπορούν να προκύψουν από την ενσωμάτωση της τεχνητής νοημοσύνης στα ρομπότ χρειάζεται να υπάρχει ένα δίχτυ προστασίας για την ασφαλή λειτουργία τους, που να έχει φίλτρα ασφαλείας και στο γλωσσικό επίπεδο, αλλά και στην εκτέλεση των εντολών στον φυσικό κόσμο.

Όπως εξηγεί ο κ. Παππάς στο ΑΠΕ-ΜΠΕ, η εφαρμογή φίλτρων στο φυσικό επίπεδο αποτελεί πρόκληση. «Πρόκειται για κάτι καινούριο και πολύ δύσκολο. Για παράδειγμα, η εντολή σε ένα ρομπότ να περάσει μια διάβαση, μπορεί να είναι ασφαλής, ωστόσο για να γίνει και η εκτέλεσή της ασφαλής θα πρέπει το ρομπότ να ερμηνεύσει αυτή την πρόταση ανάλογα με το περιβάλλον και το επιχειρησιακό πλαίσιο στο οποίο βρίσκεται. Αυτή η διαδικασία ονομάζεται contextual safety και θα είναι το μέλλον στην προσπάθεια να κάνουμε τα ρομπότ πιο ασφαλή». Ο ίδιος προσθέτει ότι «η ασφάλεια των ρομπότ στο μέλλον θα είναι όπως στα αεροπλάνα, που έχουν πολλά επίπεδα ασφαλείας. Θα χρειαστούμε μια τέτοια αρχιτεκτονική στο μέλλον για να είναι τα ρομπότ που κυκλοφορούν στην κοινωνία πολύ πιο ασφαλή».

Στην κατεύθυνση αυτή η ερευνητική ομάδα έχει δημιουργήσει το φίλτρο Roboguard, που έχει διαπιστωθεί ότι μειώνει κατά 95% τα προβλήματα από τις επιθέσεις jailbreaking. Ο κ. Παππάς διευκρινίζει ότι όλες οι λύσεις που αναπτύσσονται είναι ανοιχτού κώδικα, προκειμένου να μπορούν να χρησιμοποιηθούν από τις εταιρείες για τη βελτίωση των κενών ασφαλείας. «Η φιλοσοφία μας είναι να βοηθήσουμε την ερευνητική κοινότητα, αλλά και τις εταιρείες να κάνουν την τεχνητή νοημοσύνη και τα ρομπότ πολύ πιο ασφαλή».

Ο κ. Παππάς υπογραμμίζει τέλος και τη σημασία της δημιουργίας ρυθμιστικού πλαισίου που να επικεντρώνεται στην αλληλεπίδραση της τεχνητής νοημοσύνης με τα ρομπότ. Υπογραμμίζει ότι το AI Act της Ευρωπαϊκής Ένωσης είναι πρωτοπόρο, ωστόσο «θα χρειαστεί εμβάθυνση των ρυθμιστικών προτάσεων στις εφαρμογές που αφορούν στα ρομπότ».

Οι πρώτες εικόνες από τους ελληνικούς θερμικούς δορυφόρους

Ένα καθοριστικό βήμα στη διαστημική και τεχνολογική της πορεία πραγματοποίησε η Ελλάδα τις τελευταίες ημέρες, με την εκτόξευση τεσσάρων θερμικών δορυφόρων στο πλαίσιο του Εθνικού Προγράμματος Μικροδορυφόρων. Το ΑΠΕ-ΜΠΕ παρουσιάζει τις πρώτες φωτογραφίες από τη νέα ελληνική αποστολή στο διάστημα, η οποία σηματοδοτεί μια εξέλιξη που δεν αφορά μόνο στην τεχνολογική πρόοδο της χώρας, αλλά

Μαρκ Ρόουαν (Apollo): Προβλέπει «άνοδο των εργατών» και «άγχος των υπαλλήλων γραφείου» λόγω ΑΙ

Πολλά θυμίζουν τη δεκαετία του 1970, αλλά η εργασιακή κρίση αυτής της δεκαετίας δεν θα πλήξει τους Αμερικανούς που εργάζονται χειρονακτικά, όπως τότε. Αντίθετα, η πίεση στην εργασία λόγω της επανάστασης της Τεχνητής Νοημοσύνης θα έρθει για τους υπαλλήλους γραφείου, δήλωσε ο Μαρκ Ρόουαν, Διευθύνων Σύμβουλος του γίγαντα των ιδιωτικών αγορών Apollo. «Αυτό θα είναι