Αποκαλύψεις για τη χρήση δεδομένων πνευματικών δικαιωμάτων στην εκπαίδευση AI της Meta

Related

Μπορεί κανείς να φανταστεί τον κόσμο χωρίς iPhone;

FORTUNE GREECE 01/08/2025, 20:15 SHARE The iOS 17 operating system for iPhone is seen in this illustration photo on 20 July, 2023. (Photo by Jaap Arriens/NurPhoto) (Photo by Jaap Arriens / NurPhoto / NurPhoto via AFP) Photo: AFP Παρά τις ανησυχίες της αγοράς για την καθυστέρηση της Apple στον αγώνα της τεχνητής νοημοσύνης, ο Τιμ

Η Meta επενδύει 72 δισ. δολάρια για το επόμενο μεγάλο τεχνολογικό στοίχημα: την υπερνοημοσύνη

FORTUNE GREECE 01/08/2025, 19:01 SHARE Η Meta προχωρά δυναμικά στην κούρσα της υπερνοημοσύνης, με τον Mark Zuckerberg να δηλώνει πως η εταιρεία έχει πλέον ό,τι χρειάζεται για να πρωταγωνιστήσει στη νέα εποχή της Τεχνητής Νοημοσύνης.   Η Meta θέλει να χτίσει «υπερνοημοσύνη» για όλους — και ο CEO Μαρκ Ζούκερμπεργκ δηλώνει πως ο τεχνολογικός κολοσσός

Με όλους τους αγώνες της SuperLeague η Cosmote TV – Τυπολογίες – όλα γύρω από τα media

Με το ίδιο τηλεοπτικό περιεχόμενο η Cosmote TV  και τη νέα ποδοσφαιρική σεζόν. Οι συζητήσεις με τις ομάδες ολοκληρώθηκαν και η Coasmote TV από τον Αύγουστο θα ξεκινήσει  τις μεταδόσεις του Πρωταθλήματος της  SuperLeague. Σύμφωνα με πληροφορίες η Cosmote TV  ανανέωσε τη συνεργασία της με την ΠΑΕ Παναθηναϊκός ,ενώ οι αγώνες των υπόλοιπων ομάδων ύστερα

Η COSMOTE επενδύει 3 εκατ. ευρώ για να συνδέσει το παρελθόν με το παρόν

Η COSMOTE TELEKOM αποδεικνύει στην πράξη ότι η τεχνολογία δεν αφορά μόνο το μέλλον, αλλά και τη διατήρηση της πολιτιστικής μας κληρονομιάς. Με συνολική επένδυση άνω των 3 εκατ. ευρώ, η εταιρεία ενισχύει την πρόσβαση σε κορυφαία αρχαιολογικά μνημεία της Ελλάδας, παρέχοντας δωρεάν Wi-Fi και τεχνολογικές λύσεις αιχμής σε αρχαιολογικές αποστολές. Wi-Fi στους Σημαντικότερους Αρχαιολογικούς

Playstation 6: Πόσο πιο γρήγορο θα είναι από το PS5, ποια θα είναι η τιμή του και πότε θα κυκλοφορήσει

Η επόμενη γενιά της κονσόλας PlayStation από τη Sony αναμένεται να είναι τρεις φορές ταχύτερη από το τυπικό PS5, με χαμηλότερη κατανάλωση ενέργειας και χαμηλότερη τιμή κατά την κυκλοφορία της από το PS5 Pro, η οποία εκτιμάται ότι θα κυκλοφορήσει είτε στα τέλη του 2027 είτε στις αρχές του 2028. Σε νέο βίντεο του γνωστού

Ανδρέας Κονδύλης για εργασίες Cosmote: «Καμαρώστε αποκατάσταση οδοστρώματος»

Με δύο φωτογραφίες στα κοινωνικά δίκτυα, ο Δήμαρχος Αλίμου, Ανδρέας Κονδύλης, αναφέρει την πρόχειρη αποκατάσταση οδοστρώματος στην οδό Αριστοτέλους στο Καλαμάκι, μετά απο εργασίες για εγκατάσταση οπτικής ίνας. Όπως αναφέρει στην ανάρτησή του, πρόκειται για μία πρόχειρη και κακότεχνη αποκατάσταση, κάτι το οποιο έχει αναφέρει αρκετές φορές για τις ΔΕΚΟ που πραγματοποιούν εργασίες. Η ανακοίνωση:

Δήμαρχος κατά Cosmote: “Καμαρώστε, αποκατάσταση οδοστρώματος!” (φωτο)

Κατά της Cosmote Telekom στράφηκε μέσω ανάρτησής του ο Δήμαρχος Αλίμου, Ανδρέας Κονδύλης, καταγγέλλοντας την εταιρεία και τα συνεργεία ΔΕΚΟ για την προχειρότητα με την οποία αντιμετωπίζουν την αποκατάσταση των δρόμων που πραγματοποιούν εργασίες. “Μιας και η COSMOTE Telekom είναι πλέον γερμανική εταιρεία (όμιλος Deutsche Telekom), τους ερωτώ (και) δημόσια: στη Γερμανία, έτσι αποκαθιστούν τους

COSMOTE TELEKOM: Νέες επενδύσεις 3 εκατ. ευρώ για ανάδειξη της πολιτιστικής κληρονομιάς της χώρας

Με επενδύσεις που ξεπερνούν τα 3 εκατομμύρια ευρώ, η COSMOTE TELEKOM επεκτείνει τη συνδεσιμότητα σε κορυφαίους αρχαιολογικούς χώρους και μουσεία της Ελλάδας, αναδεικνύοντας την πολιτιστική κληρονομιά. της χώρας μέσα από την τεχνολογία. Η εταιρεία ενισχύει τη δυνατότητα δωρεάν πρόσβασης στο διαδίκτυο σε 25 σημεία ιστορικού ενδιαφέροντος, ενώ συνεχίζει να στηρίζει εμβληματικά αρχαιολογικά εγχειρήματα, όπως τις

Conference League: Χάποελ Μπερ Σεβά – ΑΕΚ: Σέντρα στις 21:00 (COSMOTE SPORT 1 HD)

Να σφραγίσει την πρόκριση στον τρίτο προκριματικό γύρο του UEFA Conference League, θέλει η ΑΕΚ στον αποψινό αγώνα ρεβάνς με την Χάποελ Μπερ Σεβά, (21:00 COSMOTE SPORT 1 HD), στο Nagyerdei Stadion, στην πόλη του Ντέμπρετσεν της Ουγγαρίας. Η ΑΕΚ στο πρώτο παιχνίδι στη Νέα Φιλαδέλφεια είχε επικρατήσει 1-0, ωστόσο όπως δήλωσε ο προπονητής της

COSMOTE TELEKOM: Με νέες επενδύσεις τεχνολογίας αναδεικνύει την πολιτιστική κληρονομιά της Ελλάδας (pics)

Με την πολιτιστική κληρονομιά της χώρας μάς συνδέει η COSMOTE TELEKOM, αξιοποιώντας τεχνολογίες αιχμής και τα κορυφαία δίκτυά της. Επενδύοντας συνολικά πάνω από 3 εκατ. ευρώ, η εταιρεία αυξάνει συνεχώς τους αρχαιολογικούς χώρους όπου παρέχει δωρεάν Wi-Fi. Παράλληλα, συνεχίζει να στηρίζει τις πρωτοποριακές ανασκαφές στην Κέρο και στον βυθό των Αντικυθήρων με κορυφαίες λύσεις συνδεσιμότητας

Υπαίθριες Κινηματογραφικές Προβολές στην Τρίπολη από τον Δήμο Τρίπολης και το Cosmote Telecom Open Air Cinema

Ο Δήμος Τρίπολης, σε συνεργασία με τον υπαίθριο κινητό κινηματογράφο Cosmote Telecom Open Air Cinema, προσκαλεί μικρούς και μεγάλους σε μια μοναδική κινηματογραφική βραδιά. Το Σάββατο 2 Αυγούστου 2025, στην Πλατεία Φιλικών, θα πραγματοποιηθούν δύο προβολές αγαπημένων ταινιών για όλες τις ηλικίες: 19:30 – Τα Μυαλά που Κουβαλάς 2 (Inside Out 2): Μια συναρπαστική και ευαίσθητη παιδική ταινία

Τι αθλητικές μεταδόσεις έχει η τηλεόραση σήμερα Πέμπτη, 31 Ιουλίου 2025

Οι αθλητικές μεταδόσεις της ημέρας με όλη την αθλητική δράση. Το τηλεοπτικό πρόγραμμα αγώνων ποδοσφαίρου, μπάσκετ, τένις και των λοιπών σπορ με όλους τους αγώνες live από τις αγαπημένες σου ομάδες και αθλήματα. Αναλυτικά όλες οι αθλητικές μεταδόσεις της τηλεόρασης για σήμερα Πέμπτη, 31 Ιουλίου 2025 13:15 ΕΡΤ 2 Υγρός Στίβος – Σιγκαπούρη 2025 –

Ρομποτικό χέρι μαγείρεψε πίτσα και δημιούργησε ελπίδες σε άτομα με κινητικά προβλήματα

Το άνοιγμα ενός βάζου, το κόψιμο των λαχανικών ή το σερβίρισμα για τους περισσότερους είναι καθημερινή ρουτίνα, όχι όμως και για τα άτομα με κινητικά προβλήματα. Τώρα, ένα ρομποτικό χέρι υπόσχεται να λύσει αυτό το πρόβλημα. Μηχανικοί στο Virginia Tech ανέπτυξαν το νέο ρομποτικό σύστημα, αξιοποιώντας χρηματοδότηση άνω των 600.000 δολαρίων από το Εθνικό Ίδρυμα

Παναθηναϊκός – Ρέιντζερς: Σέντρα στις 21:00 (COSMOTE SPORT 1 HD )

ΕΙΔΗΣΕΙΣ ΑΘΛΗΤΙΚΑ 30 Ιουλίου 2025 Με πίστη και πάθος για την ανατροπή του εις βάρος του 2-0 του πρώτου αγώνα στο Άϊμπροξ και την πρόκριση στον τρίτο προκριματικό γύρο του Champions League, ο Παναθηναϊκός θα φιλοξενήσει απόψε το βράδυ (21.00 COSMOTE SPORT 1 HD) τη Ρέιντζερς στο κατάμεστο ΟΑΚΑ, στη ρεβάνς του ματς της Γλασκώβης.

Η Ιταλία ερευνά τη Meta για παραβίαση κανόνων ανταγωνισμού μετά την εγκατάσταση εργαλείου Α.I. στο WhatsApp

Σεισμός-«μαμούθ» 8,8 Ρίχτερ και τσουνάμι, συναγερμός σε όλο τον Ειρηνικό – Κύματα έφτασαν σε Καλιφόρνια και Χαβάη: Όλες οι εξελίξεις Βορίδης στη Βουλή για ΟΠΕΚΕΠΕ: Δεν άκουσα καμία κατηγορία εις βάρος μου, για να υπάρχει έγκλημα θα πρέπει να υπάρχει και πράξη Bloomberg: Η ΕΕ εγκαινιάζει το νέο σύστημα ελέγχου συνόρων τον Οκτώβριο Στις 10

Share

Για χρόνια, οι υπάλληλοι της Meta συζητούσαν εσωτερικά τη χρήση έργων που προστατεύονται από πνευματικά δικαιώματα και έχουν αποκτηθεί με νομικά αμφισβητήσιμα μέσα για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης της εταιρείας, σύμφωνα με δικαστικά έγγραφα που είδα το φως της δημοσιότητας. .

Τα έγγραφα υποβλήθηκαν από τους ενάγοντες στην υπόθεση Kadrey v. Meta, μία από τις πολλές διαμάχες για τα πνευματικά δικαιώματα AI που σιγά- σιγά εξελίσσονται στο δικαστικό σύστημα των ΗΠΑ. Η εναγόμενη, η Meta, ισχυρίζεται ότι η εκπαίδευση των μοντέλων σε έργα που προστατεύονται από την πνευματική ιδιοκτησία, ιδίως σε βιβλία, αποτελεί «θεμιτή χρήση». Οι ενάγοντες, στους οποίους περιλαμβάνονται οι συγγραφείς Sarah Silverman και Ta-Nehisi Coates, διαφωνούν.

Όπως αναφέρει το techcrunch.com, προηγούμενο υλικό που υποβλήθηκε στο πλαίσιο της αγωγής ισχυρίζεται ότι ο διευθύνων σύμβουλος της Meta Mark Zuckerberg έδωσε στην ομάδα AI της Meta το «οκ» να εκπαιδεύσει σε περιεχόμενο που προστατεύεται από πνευματικά δικαιώματα και ότι η Meta σταμάτησε τις συνομιλίες για την αδειοδότηση δεδομένων εκπαίδευσης AI με εκδότες βιβλίων.

Όμως τα νέα αρχεία, τα περισσότερα από τα οποία δείχνουν τμήματα εσωτερικών συνομιλιών εργασίας μεταξύ υπαλλήλων της Meta, δίνουν την πιο σαφή εικόνα για το πώς η Meta μπορεί να χρησιμοποίησε δεδομένα που προστατεύονται από πνευματικά δικαιώματα για την εκπαίδευση των μοντέλων της, συμπεριλαμβανομένων των μοντέλων της οικογένειας Llama της εταιρείας.

Σε μια συνομιλία, οι υπάλληλοι της Meta, συμπεριλαμβανομένης της Melanie Kambadur, ανώτερης διευθύντριας της ερευνητικής ομάδας μοντέλων Llama της Meta, συζήτησαν την εκπαίδευση των μοντέλων σε έργα που γνώριζαν ότι μπορεί να είναι νομικά επιβαρυμένα.

«Η γνώμη μου θα ήταν στη γραμμή του “ζητάμε συγχώρεση, όχι άδεια”: προσπαθούμε να αποκτήσουμε τα βιβλία και να το κλιμακώσουμε στα στελέχη, ώστε να κάνουν την κλήση», έγραψε ο Xavier Martinet, ένας μηχανικός έρευνας της Meta, σε μια συνομιλία με ημερομηνία Φεβρουάριος 2023, σύμφωνα με τα αρχεία. «Αυτός είναι ο λόγος για τον οποίο δημιούργησαν αυτό το gen ai org έτσι ώστε να μπορούμε να είμαστε λιγότερο ριψοκίνδυνοι».

Στην ίδια συνομιλία, ο Kambadur, ο οποίος σημείωσε ότι η Meta βρισκόταν σε συζητήσεις με την πλατφόρμα φιλοξενίας εγγράφων Scribd «και άλλους» για άδειες, προειδοποίησε ότι ενώ η χρήση «δημόσια διαθέσιμων δεδομένων» για την εκπαίδευση μοντέλων θα απαιτούσε εγκρίσεις, οι δικηγόροι της Meta ήταν «λιγότερο συντηρητικοί» από ό,τι ήταν στο παρελθόν με τέτοιες εγκρίσεις.

«Ναι, πρέπει σίγουρα να πάρουμε άδειες ή εγκρίσεις για δημόσια διαθέσιμα δεδομένα ακόμα», δήλωσε ο Kambadur, σύμφωνα με τις καταθέσεις. «Η διαφορά τώρα είναι ότι έχουμε περισσότερα χρήματα, περισσότερους δικηγόρους, περισσότερη βοήθεια στο bizdev, δυνατότητα ταχείας παρακολούθησης/επιτάχυνσης για ταχύτητα και οι δικηγόροι είναι λίγο λιγότερο συντηρητικοί στις εγκρίσεις».

Το Libgen, η Meta και οι αντιφάσεις στην εκπαίδευση μοντέλων τεχνητής νοημοσύνης

Υπολογιστής με τεχνητή νοημοσύνη

Σε μια άλλη συνομιλία εργασίας που αναμεταδίδεται στις καταθέσεις, ο Kambadur συζητά την πιθανή χρήση του Libgen, ενός «συγκεντρωτή συνδέσμων» που παρέχει πρόσβαση σε έργα που προστατεύονται από πνευματικά δικαιώματα από εκδότες, ως εναλλακτική λύση για τις πηγές δεδομένων που θα μπορούσε να αδειοδοτήσει η Meta.

Η Libgen έχει μηνυθεί αρκετές φορές, έχει διαταχθεί να κλείσει και της έχει επιβληθεί πρόστιμο δεκάδων εκατομμυρίων δολαρίων για παραβίαση πνευματικών δικαιωμάτων. Ένας από τους συναδέλφους του Kambadur απάντησε με ένα στιγμιότυπο οθόνης ενός αποτελέσματος της αναζήτησης Google για το Libgen που περιείχε το απόσπασμα «Όχι, το Libgen δεν είναι νόμιμο».

Ορισμένοι υπεύθυνοι λήψης αποφάσεων εντός της Meta φαίνεται να είχαν την εντύπωση ότι η μη χρήση του Libgen για την εκπαίδευση μοντέλων θα μπορούσε να βλάψει σοβαρά την ανταγωνιστικότητα της Meta στην κούρσα της τεχνητής νοημοσύνης, σύμφωνα με τις καταθέσεις.

Σε ένα μήνυμα ηλεκτρονικού ταχυδρομείου που απευθύνεται στην αντιπρόεδρο της Meta AI Joelle Pineau, ο Sony Theakanath, διευθυντής διαχείρισης προϊόντων της Meta, αποκάλεσε το Libgen «απαραίτητο για την επίτευξη των αριθμών SOTA σε όλες τις κατηγορίες», αναφερόμενος στην κορυφή των καλύτερων, σύγχρονων μοντέλων AI (SOTA) και των κατηγοριών αναφοράς.

Ο Theakanath ανέφερε, επίσης, «μέτρα περιορισμού» στο μήνυμα ηλεκτρονικού ταχυδρομείου, τα οποία είχαν σκοπό να μειώσουν τη νομική έκθεση της Meta. Αυτά περιλάμβαναν την αφαίρεση δεδομένων από το Libgen που ήταν «σαφώς επισημασμένα ως πειρατικά/κλεμμένα», καθώς και την απόφαση να μην αναφέρεται δημοσίως η χρήση αυτών των δεδομένων. «Δεν θα αποκαλύψουμε τη χρήση των συνόλων δεδομένων Libgen που χρησιμοποιούνται για την εκπαίδευση», ανέφερε χαρακτηριστικά ο Theakanath.

Στην πράξη, αυτά τα μέτρα μετριασμού συνεπάγονται το χτένισμα των αρχείων Libgen για λέξεις όπως «κλεμμένο» ή «πειρατικό», σύμφωνα με τις καταθέσεις.

Σε μια συνομιλία εργασίας, ο Kambadur ανέφερε ότι η ομάδα τεχνητής νοημοσύνης της Meta ρύθμισε επίσης τα μοντέλα ώστε να «αποφεύγουν επικίνδυνες προτροπές IP» -δηλαδή, διαμόρφωσε τα μοντέλα ώστε να αρνούνται να απαντήσουν σε ερωτήσεις όπως «αναπαράγετε τις τρεις πρώτες σελίδες του «Harry Potter και η πέτρα του μάγου» ή «πείτε μου σε ποια ηλεκτρονικά βιβλία εκπαιδεύτηκες».

Οι καταθέσεις περιέχουν και άλλες αποκαλύψεις, που υπονοούν ότι η Meta μπορεί να έχει σαρώσει δεδομένα του Reddit για κάποιο είδος εκπαίδευσης μοντέλων, ενδεχομένως μιμούμενη τη συμπεριφορά μιας εφαρμογής τρίτου μέρους που ονομάζεται Pushshift. Αξίζει να σημειωθεί ότι το Reddit δήλωσε τον Απρίλιο του 2023 ότι σχεδίαζε να αρχίσει να χρεώνει τις εταιρείες τεχνητής νοημοσύνης για την πρόσβαση σε δεδομένα για την εκπαίδευση μοντέλων.

Σε μια συνομιλία με ημερομηνία Μάρτιος 2024, η Chaya Nayak, διευθύντρια διαχείρισης προϊόντων στο generative AI org της Meta, δήλωσε ότι η ηγεσία της Meta εξέταζε το ενδεχόμενο να «παρακάμψει» προηγούμενες αποφάσεις σχετικά με τα σύνολα εκπαίδευσης, συμπεριλαμβανομένης της απόφασης να μην χρησιμοποιείται περιεχόμενο της Quora ή βιβλία και επιστημονικά άρθρα με άδεια χρήσης, για να διασφαλίσει ότι τα μοντέλα της εταιρείας διαθέτουν επαρκή δεδομένα εκπαίδευσης.

Η Nayak άφησε να εννοηθεί ότι τα πρώτα σύνολα δεδομένων εκπαίδευσης της Meta -αναρτήσεις στο Facebook και το Instagram, κείμενα που μεταγράφονται από βίντεο στις πλατφόρμες της Meta και ορισμένα μηνύματα της Meta for Business- απλώς δεν ήταν αρκετά. «Χρειαζόμαστε περισσότερα δεδομένα», έγραψε.

Οι ενάγοντες στην υπόθεση Kadrey κατά Meta έχουν τροποποιήσει την καταγγελία τους αρκετές φορές από τότε που η υπόθεση κατατέθηκε στο Περιφερειακό Δικαστήριο των ΗΠΑ για τη Βόρεια Περιφέρεια της Καλιφόρνιας, το 2023.

Η τελευταία ισχυρίζεται ότι η Meta, μεταξύ άλλων ισχυρισμών, διασταύρωσε ορισμένα πειρατικά βιβλία με βιβλία που προστατεύονται από πνευματικά δικαιώματα και είναι διαθέσιμα για άδεια χρήσης, προκειμένου να καθορίσει αν είχε νόημα να επιδιώξει μια συμφωνία αδειοδότησης με έναν εκδότη.

Σε ένδειξη του πόσο υψηλό θεωρεί η Meta ότι είναι το νομικό διακύβευμα, η εταιρεία προσέθεσε στην ομάδα υπεράσπισής της στην υπόθεση δύο δικαστές του Ανώτατου Δικαστηρίου από τη νομική εταιρεία Paul Weiss.