Η τελευταία δεκαετία είχε ως επίκεντρο το αυξανόμενο ενδιαφέρον για τη μηχανική εκμάθηση, μία διαδικασία που προέκυψε από την αποδεδειγμένη ικανότητα των νευρωνικών δικτύων να εκτελούν πολύπλοκες αναλύσεις εικόνας. Αν κάποιος τροφοδοτήσει ένα τέτοιο δίκτυο με αρκετές φωτογραφίες γάτων και σκύλων, το δίκτυο θα εξοικειωθεί ώστε να βρίσκει συνεχή μοτίβα και να ξεχωρίζει τις φωτογραφίες.
Η Τεχνητή Νοημοσύνη είναι πια ικανή για όλα. Κυρίως για την ασφάλεια, αφού πλέον μπορεί να αναγνωρίζει ακόμη και εικόνες. Μπορεί να αποτελεί τμήμα της προστασίας των τραπεζικών συστημάτων, μπορεί να διασφαλίσει τις συναλλαγές για εταιρείες που δραστηριοποιούνται online και μπορεί να προστατέψει ιδρύματα που πραγματοποιούν οικονομικές συναλλαγές. Όλα αυτά τα παραδείγματα έχουν έναν κοινό παρονομαστή: αυτές οι εταιρείες χρειάζονται ασφάλεια διότι δέχονται κυβερνοεπιθέσεις.
Εκεί παρεμβαίνει πλέον η Τεχνητή Νοημοσύνη ως «ειδική», σύμφωνα τουλάχιστον με την έρευνα που πραγματοποίησε το Πανεπιστήμιο Πελοποννήσου σε συνεργασία με το αντίστοιχο του Πλίμουθ. Η μελέτη που δημοσιεύτηκε το 2019 και σήμερα είναι πιο επίκαιρη από ποτέ κατέδειξε ότι όταν κακόβουλα αρχεία μπορούν να απεικονιστούν με τον τρόπο που η Τεχνητή Νοημοσύνη μπορεί να “δει”, τότε είναι εύκολο να δημιουργηθούν μοτίβα που επιτρέπουν στα νευρωνικά συστήματα να τα διαχωρίζουν από τα ασφαλή αρχεία.
Οι διαφορές αυτές θα περνούσαν απαρατήρητες με τους συμβατικούς τρόπους αναζήτησης κακόβουλου λογισμικού. Ως σήμερα αυτό γινόταν με την κλασική πρακτική συγκέντρωσης δεδομένων από αρχεία με συγκεκριμένη ονομασία, την καταγραφή τους και την ενημέρωση της βάσης δεδομένων των αντίστοιχων software. Μία αλλαγή στον κώδικα του αρχείου όμως μπορούσε εύκολα να «κρύψει» το κακόβουλο λογισμικό.
Το 2019 όμως μία ομάδα αναλυτών κυβερνοασφάλειας αναρωτήθηκε αν μπορούσε να χρησιμοποιήσει τη Μηχανική Εκμάθηση για να απεικονίσει τους κινδύνους. Η σκέψη ακουγόταν περίεργη, αλλά αποδείχθηκ0ε εξαιρετική αφού κατάφερε να δημιουργήσει μοντέλα Μηχανικής Εκμάθησης, τα οποία βασίζονται σε εικόνες που δημιουργούνται μέσω του περιεχομένου των αρχείων. Έναν χρόνο αργότερα η ίδια τεχνική χρησιμοποιήθηκε για να εντοπίζονται κακόβουλες ιστοσελίδες υποκλοπής στοιχείων.
Τα νέα μοντέλα έφεραν αποτελέσματα, αλλά και νέες προκλήσεις εμφανίστηκαν στον ορίζοντα. Με τη μεθοδολογία απεικόνισης, τα αρχεία μπορούν πλέον να αναζητούν αλγόριθμους και τιμές σε αντίθεση με την προηγούμενη τακτική ανάγνωσης κώδικα. Τα κακόβουλα αρχεία φαίνεται ότι απεικονίζονται για την Τεχνητή Νοημοσύνη με πολύχρωμες εικόνες, ενώ τα καλοήθη αρχεία έχουν πιο καθαρή εικόνα.
Όταν υπάρχουν τέτοιου είδους δεδομένα, είναι δυνατό να εκπαιδευτεί ένα νευρωνικό δίκτυο προκειμένου να εντοπίζει τις διαφορές μεταξύ των αρχείων. Η βάση δεδομένων που ετοίμασαν οι ερευνητές περιλαμβάνει μία λίστα κακόβουλων (ιούς, worms, trojans κλπ) και ασφαλών (.exe, .doc, .pdf, .txt κλπ) αρχείων. Το παρακάτω παράδειγμα είναι ενδεικτικό: οι ερευνητές τροφοδότησαν την Τεχνητή Νοημοσύνη με εικόνες κώδικα κι από τα δύο είδη, το νευρωνικό δίκτυο εκπαιδεύτηκε με τα δεδομένα που δέχτηκε κι έπειτα κατάφερε να διαχωρίσει με μεγάλη επιτυχία τα αρχεία.
Συνολικά το δίκτυο δέχτηκε 4000 δείγματα και κατάφερε να τα επεξεργαστεί σε 15 δευτερόλεπτα. Με ποσοστό επιτυχίας 74%, η Τεχνητή Νοημοσύνη διάβασε τον αλγόριθμο και θεωρείται σίγουρο ότι το ποσοστό θα ανέβει όσο τα δεδομένα αυξάνονται για το δίκτυο. Αντίστοιχα πειράματα έγιναν και με τις κακόβουλες ιστοσελίδες το 2020 και το ποσοστό επιτυχίας του νευρωνικού δικτύου έφτασε στο 94%!
«Η χρήση της τεχνικής απεικόνισης επιτρέπει στη Μηχανική Εκμάθηση να ανοίξει νέους δρόμους στην αναγνώριση κακόβουλων και πραγματικών αρχείων ή ιστοσελίδων» αναφέρει στην έκθεσή του το Πανεπιστήμιο Πελοποννήσου: «Με βάση τα αρχικά μας συμπεράσματα, η μέθοδος που χρησιμοποιήθηκε φαίνεται πολλά υποσχόμενη και ικανή να αναγνωρίζει σε πολύ μικρό χρονικό διάστημα την επικινδυνότητα ενός αρχείου, με μεγάλη μάλιστα ακρίβεια. Επιπλέον, η μέθοδος συνεχίζει να εμπλουτίζεται με νέα δεδομένα, που επιτρέπει τη μείωση των λαθών και την αύξηση της αποτελεσματικότητας».
Ο Σταύρος Σιαλές, λέκτορας κυβερνοασφάλειας στο Πανεπιστήμιο του Πόρτσμουθ και συγγραφέας των δύο διαφορετικών ερευνών στο διάστημα των δύο ετών, θεωρεί ότι μέσα στο 2022 θα έρθει η στιγμή που η τεχνική αναγνώρισης κακόβουλου λογισμικού θα βγει από το πλαίσιο των ερευνών και θα παραδοθεί στον πραγματικό κόσμο. Ο λέκτορας πλέον έχει στρέψει την προσοχή του στη Μηχανική Εκμάθηση που θα αναγνωρίζει και θα καταγράφει τις απειλές στα δίκτυα IoT, μία πρόκληση που θα αλλάξει τον χάρτη της ασφάλειας στην πληροφορική.