Σουβλάκι, καλαμάκι, μπάλα, ποδόσφαιρο, σος, αλοιφή. Τόσο πολλά πράγματα λέγονται με διαφορετικά ονόματα. Καμιά φορά αυτό οφείλεται στη λειτουργία της γλώσσας, άλλες φορές όμως εξαρτάται από τις κοινωνικές τάσεις, τις διαφορετικές έννοιες ή, απλώς, από το πού βρίσκεται κάποιος στο κόσμο.
Ένα πολύ σχετικό παράδειγμα είναι η Covid-19. «Καθώς οι άνθρωποι σε όλο τον κόσμο έψαχναν για πληροφορίες, έπρεπε να μάθουμε να αναγνωρίζουμε όλες τις διαφορετικές φράσεις που χρησιμοποιούσαν σχετικά με τον νέο ιό για να σιγουρευτούμε ότι παρέχουμε υψηλού επιπέδου, άμεση πληροφόρηση από αξιόπιστους οργανισμούς υγείας όπως ο Παγκόσμιος Οργανισμός Υγείας και τα Κέντρα Ελέγχου και Πρόληψης Λοιμώξεων. Ένα χρόνο αργότερα αντιμετωπίζουμε μια παρόμοια πρόκληση με τα ονόματα των εμβολίων, μόνο που αυτή τη φορά έχουμε ένα νέο εργαλείο στη διάθεση μας το Multitask Unified Model (MUM)», αναφέρεται σε σχετική ενημέρωση από τη Google.
Tο νέο αυτό πρόγραμμα αναγνώρισης και κατανόησης γλώσσας παρουσίασε η Google στο φετινό Ι/Ο. Η συγκεκριμένη τεχνολογία αποδείχτηκε ιδιαίτερα αποτελεσματική και χρήσιμη κατά την περίοδο της πανδημίας, όπου οι χρήστες από όλο το κόσμο αναζητούσαν πληροφορίες σχετικά με τα διαθέσιμα εμβόλια κατά της Covid-19. Συγκεκριμένα, με το ΜUM η Google μπόρεσε να προσδιορίσει 800 διαφορετικές ονομασίες των εμβολίων σε πάνω από 50 γλώσσες εντός δευτερόλεπτων, την ώρα που το προηγούμενο μοντέλο θα χρειαζόταν μια εβδομάδα.
Κατανοώντας τις αναζητήσεις για πληροφορίες σχετικά με τα εμβόλια
AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik, και όλα τα ευρέως διαθέσιμα εμβόλια έχουν διαφορετικές ονομασίες ανά το κόσμο. Ο κόσμος που αναζητά πληροφορίες σχετικά με τα εμβόλια μπορεί να ψάχνει με λέξεις-κλειδιά όπως “Coronavaccin Pfizer,” “mRNA-1273,” “CoVaccine” – και πολλές άλλες.
Μεταφέροντας γνώση σε διάφορες γλώσσες
To MUM μπόρεσε να ολοκληρώσει ένα έργο που κανονικά θα χρειαζόταν μια εβδομάδα μέσα σε μερικά μόνο δευτερόλεπτα, χάρη στη δυνατότητά του για μεταφορά γνώσης. Το MUM μπορεί να αντλήσει και να μεταφέρει γνώσεις από τις 75 γλώσσες στις οποίες έχει εκπαιδευτεί. Για παράδειγμα, μπορεί να φανταστεί κάποιος ότι διαβάζει ένα βιβλίο. Αν είναι πολύγλωσσος μπορεί να μοιραστεί το περιεχόμενο του και σε άλλες γλώσσες τις οποίες μιλάει – ανάλογα με το πόσο καλά τις γνωρίζει – γιατί έχει μια κατανόηση του βιβλίου η οποία δεν εξαρτάται από τη γλώσσα ή τη μετάφραση. Το MUM μπορεί και μεταφέρει γνώσεις κατά τον ίδιο τρόπο, επισημαίνεται.
Αντίστοιχα, μέσα από τη δυνατότητα μεταφοράς γνώσεων που διαθέτει, το MUM δεν χρειάζεται να εκμάθει νέες δεξιότητες σε κάθε γλώσσα – μπορεί απλώς να τις μεταφέρει, βοηθώντας έτσι να γίνονται βελτιώσεις κλίμακας γρήγορα, ακόμα και όταν δεν υπάρχουν αρκετά δεδομένα προς επεξεργασία. Αυτό γίνεται χάρη στην αποτελεσματικότητα δειγματοληψίας του MUM – πράγμα που σημαίνει ότι το MUM χρειάζεται λιγότερα δεδομένα σε σχέση με προηγούμενα μοντέλα για να εκτελέσει το ίδιο έργο. Στη περίπτωση των εμβολίων, μέσα από ένα μικρό δείγμα των επίσημων ονομασιών τους, το MUM κατάφερε να αναγνωρίσει ταχύτατα τις παραλλαγές σε άλλες γλώσσες.
Βελτιώνοντας το Google Search με το MUM
«Η πρώτη αυτή εφαρμογή του ΜUM, μας βοήθησε να μεταφέρουμε σημαντικές πληροφορίες σε χρήστες σε όλο το κόσμο, με γρήγορο τρόπο και ανυπομονούμε να δούμε τους διάφορους τρόπους με τους οποίους το MUM θα βελτιώσει το Search ώστε να είναι ακόμη πιο χρήσιμο στο μέλλον. Οι αρχικές δοκιμές έδειξαν ότι το MUM θα μπορέσει όχι μόνο να βελτιώσει αρκετές πτυχές των υφιστάμενων συστημάτων μας, αλλά να μας βοηθήσει να δημιουργήσουμε εντελώς νέους τρόπους για να αναζητάμε και να διερευνούμε πληροφορίες», καταλήγει η ανακοίνωση.