Αποκαλύψεις για τη χρήση δεδομένων πνευματικών δικαιωμάτων στην εκπαίδευση AI της Meta

Related

Οι συμβουλές του Sam Altman για νέους επαγγελματίες

FORTUNE GREECE 21/03/2025, 17:00 Ο Sam Altman προειδοποιεί: η τεχνητή νοημοσύνη αλλάζει ριζικά τον κόσμο της εργασίας — και η εξοικείωση με τα εργαλεία AI είναι το νέο «κώδικας» για μια καριέρα με διάρκεια. Ο Sam Altman, CEO της OpenAI, εντείνει τις συμβουλές του προς τους φοιτητές που ετοιμάζονται να μπουν σε μια αγορά εργασίας

Η Ιαπωνία εφαρμόζει τεχνητή νοημοσύνη για την αντιμετώπιση της έλλειψης εργαζομένων στη φροντίδα ηλικιωμένων

Η Ιαπωνία αντιμετωπίζει μια κρίσιμη έλλειψη εργαζομένων στον τομέα της φροντίδας των ηλικιωμένων, καθώς ο πληθυσμός της γερνάει με ταχείς ρυθμούς. Προκειμένου να αντιμετωπίσει αυτή την πρόκληση, η Sompo Holdings, μια από τις μεγαλύτερες ασφαλιστικές εταιρείες της χώρας, στρέφεται στην τεχνητή νοημοσύνη και άλλες καινοτόμες τεχνολογίες. Η χρήση αυτών των εργαλείων βοηθά όχι μόνο στην

Cosmote blue: Στην προστασία των θαλασσών εστιάζει η «Ώρα της Γης»

Σημαντική η συμβολή της πρωτοβουλίας COSMOTE BLUE για τις θάλασσες όπου μέχρι τώρα: έχουν συγκεντρωθεί 64,15 τόνοι πλαστικού, ανακυκλωθεί 37 τόνοι και εκπαιδευτεί 261 ψαράδες, σε συνεργασία με την «ΕΝΑΛΕΙΑ» Στην ανάγκη προστασίας των θαλασσών εστιάζει φέτος η «Ώρα της Γης», η παγκόσμια συμμετοχική πρωτοβουλία για την προστασία του περιβάλλοντος στην οποία συμβάλλει και η

Στην προστασία των θαλασσών εστιάζει η «Ώρα της Γης» – Σημαντική η συμβολή της πρωτοβουλίας COSMOTE BLUE

Μέχρι σήμερα έχουν συγκεντρωθεί 64,15 τόνοι πλαστικού, ανακυκλωθεί 37 τόνοι και εκπαιδευτεί 261 ψαράδες, σε συνεργασία με την «ΕΝΑΛΕΙΑ» Στην ανάγκη προστασίας των θαλασσών εστιάζει φέτος η «Ώρα της Γης», η παγκόσμια συμμετοχική πρωτοβουλία για την προστασία του περιβάλλοντος στην οποία συμβάλλει και η COSMOTE για 17η συνεχή χρονιά. Στο θέμα της προστασίας των ελληνικών

Στην προστασία των θαλασσών εστιάζει η «Ώρα της Γης» – Σημαντική η συμβολή της πρωτοβουλίας COSMOTE BLUE

Στην ανάγκη προστασίας των θαλασσών εστιάζει φέτος η «Ώρα της Γης», η παγκόσμια συμμετοχική πρωτοβουλία για την προστασία του περιβάλλοντος στην οποία συμβάλλει και η COSMOTE για 17η συνεχή χρονιά. Στο θέμα της προστασίας των ελληνικών θαλασσών η εταιρεία έχει να επιδείξει σημαντικό έργο, μέσω της πρωτοβουλίας COSMOTE BLUE, που υλοποιείται σε συνεργασία με την

Το COSMOTE HISTORY HD τιμά την επέτειο της 25ης Μαρτίου

Με ένα ολοήμερο αφιέρωμα που περιλαμβάνει 16 ντοκιμαντέρ, το COSMOTE HISTORY HD τιμά την επέτειο της 25ης Μαρτίου, αναδεικνύοντας τις προσωπικότητες και τα γεγονότα που καθόρισαν την Ελληνική Επανάσταση. Οι προβολές θα ξεκινήσουν ανήμερα της επετείου (Τρίτη 25/3) στις 09.00 και θα διαρκέσουν έως αργά το βράδυ της ίδιας μέρας, προσφέροντας ένα ταξίδι στην ιστορία

GenZ, η γενιά που ψηφίζει ψηφιακές πληρωμές και φυσικά καταστήματα

ΣΟΦΙΑ ΕΜΜΑΝΟΥΗΛ 21/03/2025, 11:10 Close up photo of digital camera with young female influencer vlogger blogger online broadcasting in social media. Woman showing thumbs up sign on camera. Content maker concept Photo: Shutterstock Τι έδειξε η έρευνα που ανέθεσε η Visa στο Ινστιτούτο της ΕΣΕΕ. Η ψηφιακή γενιά απολαμβάνει τα ψώνια τόσο online όσο και

Open-Ear Ήχος & Smart Ευεξία: Η Huawei παρουσιάζει τα HUAWEI FreeArc & HUAWEI Band 10!

Η Huawei παρουσιάζει στην ελληνική αγορά δύο νέες πρωτοποριακές συσκευές, σχεδιασμένες να προσφέρουν κορυφαία τεχνολογία και άνεση: τα HUAWEI FreeArc, τα πρώτα open-ear ακουστικά της εταιρείας με earhooks, και το HUAWEI Band 10, ένα σύγχρονο smartwatch που εστιάζει στην ολιστική ευεξία και τη βελτίωση της καθημερινής ζωής. Με την αφοσίωση της Huawei στην καινοτομία και

Οι αθλητικές μεταδόσεις της ημέρας (21/3)

ATP Masters 1000 2025, ΜαϊάμιΤένις COSMOTE Sport 600:00COSMOTE Sport 7Γκόλντεν Στέιτ Ουόριορς - Τορόντο ΡάπτορςNBA COSMOTE Sport 704:00ΕΡΤ21η Μέρα ΠρωίΠαγκόσμιο Πρωτάθλημα Κλειστού Στίβου ΕΡΤ204:00COSMOTE Sport 4Λος Άντζελες Λέικερς - Μιλγουόκι ΜπακςNBA COSMOTE Sport 404:30ANΤ1+Shanghai International Circuit, Practice 1Formula 1 ANΤ1+05:30ΕΡΤ21η Μέρα ΠρωίΠαγκόσμιο Πρωτάθλημα Κλειστού Στίβου ΕΡΤ206:00COSMOTE Sport 5Κένυα, SS3 Camp Moran 1WRC COSMOTE Sport 506:25COSMOTE

Οι αθλητικές μεταδόσεις της Παρασκευής

Η αναμέτρηση του Παναθηναϊκού κόντρα στην Άλμπα Βερολίνου, για την Euroleague, τα ματς για τα προκριματικά του Μουντιάλ 2026 και η δράση στο Παγκόσμιο πρωτάθλημα κλειστού στίβου ξεχωρίζουν στο πρόγραμμα με τις αθλητικές μεταδόσεις της ημέρας. Αναλυτικά όλες οι επιλογές: 00:00 COSMOTE SPORT 6 HD ATP Masters 1000 2025 Μαϊάμι 04:00 ΕΡΤ2 Παγκόσμιο Πρωτάθλημα Κλειστού

Πώς θα φτάσει το νερό στο Ελληνικό, τα νέα deals της Eurobank στο real estate, τα δέκα χρόνια για την ανάπλαση του παραλιακού μετώπου...

Αναβάθμιση αγωγών στη μισή Αθήνα για να πάει το νερό στο Ελληνικό! Το σχέδιο της ΕΥΔΑΠ για την υδροδότηση του Ελληνικού φέρνει στο προσκήνιο ένα τεράστιο κατασκευαστικό εγχείρημα, που θα επηρεάσει το δίκτυο ύδρευσης της Αττικής σε μεγάλη κλίμακα. Ο διευθύνων σύμβουλος της εταιρείας, Χάρης Σαχίνης, περιέγραψε χθες κατά τη διάρκεια ξενάγησης στη Μονάδα Επεξεργασίας

Fake news από την Τεχνητή Νοημοσύνη; Το ChatGPT ενοχοποίησε αθώο για φόνο

FORTUNE GREECE 20/03/2025, 21:15 Ένας Νορβηγός χρήστης του διαδικτύου υπέβαλε καταγγελία κατά της OpenAI, αφού το ChatGPT τον παρουσίασε ψευδώς ως δολοφόνο, εγείροντας σοβαρά ερωτήματα για την αξιοπιστία της Τεχνητής Νοημοσύνης και τις νομικές της ευθύνες. Ένας Νορβηγός χρήστης του διαδικτύου, εμβρόντητος που το ChatGPT τον παρουσίασε ψευδώς ως εγκληματία που σκότωσε δύο από τα

Συνδρομη Cosmote TV + Novasports Full Pack απο τον λογαριασμο μου! Τσεκαρετε info! Μονο για 2 μερες!

Καλησπερα! Εχω το Full Pack της Cosmote TV μαζι με τα Novasports (πληρες αθλητικο πακετο)! Μπορω να κανω Share την συνδρομη με οποιον ενδιαφερετε διοτι μπορουμε να βλεπουμε ταυτοχρονα και οι 2 αθλητικο περιεχομενο! Η τιμη που το δινω ειναι 20Ε/μηνα αλλα το λιγοτερο που μπορω να το δωσω γιατι δεν θελω να ψαχνω καθε

Jensen Huang: «Κάθε εταιρεία θα γίνει ένα εργοστάσιο AI»

FORTUNE GREECE 20/03/2025, 19:00 epa11385529 Co-founder, president and CEO of Nvidia Corporation, Jensen Huang, presents NVIDIA NVLink Spine as he delivers his keynote speech ahead of the COMPUTEX 2024 trade show, in Taipei, Taiwan, 02 June 2024. COMPUTEX 2024 will run from 04-07 June 2024. Computex is one of the largest computer and technology trade

Ο CEO της Nvidia μιλάει σε ρομπότ στη σκηνή – και η Disney αλλάζει τα δεδομένα στην ψυχαγωγία

FORTUNE GREECE 20/03/2025, 17:15 Ο Jensen Huang της Nvidia παρουσίασε τον Blue, ένα αξιολάτρευτο ρομπότ, ανακοινώνοντας τη συνεργασία της εταιρείας με τη Disney Research και τη Google DeepMind για την ανάπτυξη μιας νέας γενιάς ρομποτικών χαρακτήρων και humanoid AI.       Κατά τη διάρκεια της κεντρικής του ομιλίας αυτή την εβδομάδα, ο CEO της

Share

Για χρόνια, οι υπάλληλοι της Meta συζητούσαν εσωτερικά τη χρήση έργων που προστατεύονται από πνευματικά δικαιώματα και έχουν αποκτηθεί με νομικά αμφισβητήσιμα μέσα για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης της εταιρείας, σύμφωνα με δικαστικά έγγραφα που είδα το φως της δημοσιότητας. .

Τα έγγραφα υποβλήθηκαν από τους ενάγοντες στην υπόθεση Kadrey v. Meta, μία από τις πολλές διαμάχες για τα πνευματικά δικαιώματα AI που σιγά- σιγά εξελίσσονται στο δικαστικό σύστημα των ΗΠΑ. Η εναγόμενη, η Meta, ισχυρίζεται ότι η εκπαίδευση των μοντέλων σε έργα που προστατεύονται από την πνευματική ιδιοκτησία, ιδίως σε βιβλία, αποτελεί «θεμιτή χρήση». Οι ενάγοντες, στους οποίους περιλαμβάνονται οι συγγραφείς Sarah Silverman και Ta-Nehisi Coates, διαφωνούν.

Όπως αναφέρει το techcrunch.com, προηγούμενο υλικό που υποβλήθηκε στο πλαίσιο της αγωγής ισχυρίζεται ότι ο διευθύνων σύμβουλος της Meta Mark Zuckerberg έδωσε στην ομάδα AI της Meta το «οκ» να εκπαιδεύσει σε περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα και ότι η Meta σταμάτησε τις συνομιλίες για την αδειοδότηση δεδομένων εκπαίδευσης AI με εκδότες βιβλίων.

Όμως τα νέα αρχεία, τα περισσότερα από τα οποία δείχνουν τμήματα εσωτερικών συνομιλιών εργασίας μεταξύ υπαλλήλων της Meta, δίνουν την πιο σαφή εικόνα για το πώς η Meta μπορεί να χρησιμοποίησε δεδομένα που προστατεύονται από πνευματικά δικαιώματα για την εκπαίδευση των μοντέλων της, συμπεριλαμβανομένων των μοντέλων της οικογένειας Llama της εταιρείας.

Σε μια συνομιλία, οι υπάλληλοι της Meta, συμπεριλαμβανομένης της Melanie Kambadur, ανώτερης διευθύντριας της ερευνητικής ομάδας μοντέλων Llama της Meta, συζήτησαν την εκπαίδευση των μοντέλων σε έργα που γνώριζαν ότι μπορεί να είναι νομικά επιβαρυμένα.

«Η γνώμη μου θα ήταν στη γραμμή του “ζητάμε συγχώρεση, όχι άδεια”: προσπαθούμε να αποκτήσουμε τα βιβλία και να το κλιμακώσουμε στα στελέχη, ώστε να κάνουν την κλήση», έγραψε ο Xavier Martinet, ένας μηχανικός έρευνας της Meta, σε μια συνομιλία με ημερομηνία Φεβρουάριος 2023, σύμφωνα με τα αρχεία. «Αυτός είναι ο λόγος για τον οποίο δημιούργησαν αυτό το gen ai org έτσι ώστε να μπορούμε να είμαστε λιγότερο ριψοκίνδυνοι».

Στην ίδια συνομιλία, ο Kambadur, ο οποίος σημείωσε ότι η Meta βρισκόταν σε συζητήσεις με την πλατφόρμα φιλοξενίας εγγράφων Scribd «και άλλους» για άδειες, προειδοποίησε ότι ενώ η χρήση «δημόσια διαθέσιμων δεδομένων» για την εκπαίδευση μοντέλων θα απαιτούσε εγκρίσεις, οι δικηγόροι της Meta ήταν «λιγότερο συντηρητικοί» από ό,τι ήταν στο παρελθόν με τέτοιες εγκρίσεις.

«Ναι, πρέπει σίγουρα να πάρουμε άδειες ή εγκρίσεις για δημόσια διαθέσιμα δεδομένα ακόμα», δήλωσε ο Kambadur, σύμφωνα με τις καταθέσεις. «Η διαφορά τώρα είναι ότι έχουμε περισσότερα χρήματα, περισσότερους δικηγόρους, περισσότερη βοήθεια στο bizdev, δυνατότητα ταχείας παρακολούθησης/επιτάχυνσης για ταχύτητα και οι δικηγόροι είναι λίγο λιγότερο συντηρητικοί στις εγκρίσεις».

Το Libgen, η Meta και οι αντιφάσεις στην εκπαίδευση μοντέλων τεχνητής νοημοσύνης

Υπολογιστής με τεχνητή νοημοσύνη

Σε μια άλλη συνομιλία εργασίας που αναμεταδίδεται στις καταθέσεις, ο Kambadur συζητά την πιθανή χρήση του Libgen, ενός «συγκεντρωτή συνδέσμων» που παρέχει πρόσβαση σε έργα που προστατεύονται από πνευματικά δικαιώματα από εκδότες, ως εναλλακτική λύση για τις πηγές δεδομένων που θα μπορούσε να αδειοδοτήσει η Meta.

Η Libgen έχει μηνυθεί αρκετές φορές, έχει διαταχθεί να κλείσει και της έχει επιβληθεί πρόστιμο δεκάδων εκατομμυρίων δολαρίων για παραβίαση πνευματικών δικαιωμάτων. Ένας από τους συναδέλφους του Kambadur απάντησε με ένα στιγμιότυπο οθόνης ενός αποτελέσματος της αναζήτησης Google για το Libgen που περιείχε το απόσπασμα «Όχι, το Libgen δεν είναι νόμιμο».

Ορισμένοι υπεύθυνοι λήψης αποφάσεων εντός της Meta φαίνεται να είχαν την εντύπωση ότι η μη χρήση του Libgen για την εκπαίδευση μοντέλων θα μπορούσε να βλάψει σοβαρά την ανταγωνιστικότητα της Meta στην κούρσα της τεχνητής νοημοσύνης, σύμφωνα με τις καταθέσεις.

Σε ένα μήνυμα ηλεκτρονικού ταχυδρομείου που απευθύνεται στην αντιπρόεδρο της Meta AI Joelle Pineau, ο Sony Theakanath, διευθυντής διαχείρισης προϊόντων της Meta, αποκάλεσε το Libgen «απαραίτητο για την επίτευξη των αριθμών SOTA σε όλες τις κατηγορίες», αναφερόμενος στην κορυφή των καλύτερων, σύγχρονων μοντέλων AI (SOTA) και των κατηγοριών αναφοράς.

Ο Theakanath ανέφερε, επίσης, «μέτρα περιορισμού» στο μήνυμα ηλεκτρονικού ταχυδρομείου, τα οποία είχαν σκοπό να μειώσουν τη νομική έκθεση της Meta. Αυτά περιλάμβαναν την αφαίρεση δεδομένων από το Libgen που ήταν «σαφώς επισημασμένα ως πειρατικά/κλεμμένα», καθώς και την απόφαση να μην αναφέρεται δημοσίως η χρήση αυτών των δεδομένων. «Δεν θα αποκαλύψουμε τη χρήση των συνόλων δεδομένων Libgen που χρησιμοποιούνται για την εκπαίδευση», ανέφερε χαρακτηριστικά ο Theakanath.

Στην πράξη, αυτά τα μέτρα μετριασμού συνεπάγονται το χτένισμα των αρχείων Libgen για λέξεις όπως «κλεμμένο» ή «πειρατικό», σύμφωνα με τις καταθέσεις.

Σε μια συνομιλία εργασίας, ο Kambadur ανέφερε ότι η ομάδα τεχνητής νοημοσύνης της Meta ρύθμισε επίσης τα μοντέλα ώστε να «αποφεύγουν επικίνδυνες προτροπές IP» -δηλαδή, διαμόρφωσε τα μοντέλα ώστε να αρνούνται να απαντήσουν σε ερωτήσεις όπως «αναπαράγετε τις τρεις πρώτες σελίδες του «Harry Potter και η πέτρα του μάγου» ή «πείτε μου σε ποια ηλεκτρονικά βιβλία εκπαιδεύτηκες».

Οι καταθέσεις περιέχουν και άλλες αποκαλύψεις, που υπονοούν ότι η Meta μπορεί να έχει σαρώσει δεδομένα του Reddit για κάποιο είδος εκπαίδευσης μοντέλων, ενδεχομένως μιμούμενη τη συμπεριφορά μιας εφαρμογής τρίτου μέρους που ονομάζεται Pushshift. Αξίζει να σημειωθεί ότι το Reddit δήλωσε τον Απρίλιο του 2023 ότι σχεδίαζε να αρχίσει να χρεώνει τις εταιρείες τεχνητής νοημοσύνης για την πρόσβαση σε δεδομένα για την εκπαίδευση μοντέλων.

Σε μια συνομιλία με ημερομηνία Μάρτιος 2024, η Chaya Nayak, διευθύντρια διαχείρισης προϊόντων στο generative AI org της Meta, δήλωσε ότι η ηγεσία της Meta εξέταζε το ενδεχόμενο να «παρακάμψει» προηγούμενες αποφάσεις σχετικά με τα σύνολα εκπαίδευσης, συμπεριλαμβανομένης της απόφασης να μην χρησιμοποιείται περιεχόμενο της Quora ή βιβλία και επιστημονικά άρθρα με άδεια χρήσης, για να διασφαλίσει ότι τα μοντέλα της εταιρείας διαθέτουν επαρκή δεδομένα εκπαίδευσης.

Η Nayak άφησε να εννοηθεί ότι τα πρώτα σύνολα δεδομένων εκπαίδευσης της Meta -αναρτήσεις στο Facebook και το Instagram, κείμενα που μεταγράφονται από βίντεο στις πλατφόρμες της Meta και ορισμένα μηνύματα της Meta for Business- απλώς δεν ήταν αρκετά. «Χρειαζόμαστε περισσότερα δεδομένα», έγραψε.

Οι ενάγοντες στην υπόθεση Kadrey κατά Meta έχουν τροποποιήσει την καταγγελία τους αρκετές φορές από τότε που η υπόθεση κατατέθηκε στο Περιφερειακό Δικαστήριο των ΗΠΑ για τη Βόρεια Περιφέρεια της Καλιφόρνιας, το 2023.

Η τελευταία ισχυρίζεται ότι η Meta, μεταξύ άλλων ισχυρισμών, διασταύρωσε ορισμένα πειρατικά βιβλία με βιβλία που προστατεύονται από πνευματικά δικαιώματα και είναι διαθέσιμα για άδεια χρήσης, προκειμένου να καθορίσει αν είχε νόημα να επιδιώξει μια συμφωνία αδειοδότησης με έναν εκδότη.

Σε ένδειξη του πόσο υψηλό θεωρεί η Meta ότι είναι το νομικό διακύβευμα, η εταιρεία προσέθεσε στην ομάδα υπεράσπισής της στην υπόθεση δύο δικαστές του Ανώτατου Δικαστηρίου από τη νομική εταιρεία Paul Weiss.