Τι είναι η «απόσταξη» δεδομένων της ΤΝ που χρησιμοποίησε η Deepseek

Κορυφαίοι σύμβουλοι του Λευκού Οίκου εξέφρασαν αυτή την εβδομάδα την ανησυχία τους για το γεγονός ότι η κινεζική DeepSeek μπορεί να έχει επωφεληθεί από μια μέθοδο που φέρεται να αξιοποιεί τις προόδους των αντιπάλων των ΗΠΑ, η οποία ονομάζεται «απόσταξη».

Η τεχνική, η οποία περιλαμβάνει ένα σύστημα τεχνητής νοημοσύνης που μαθαίνει από ένα άλλο, πιο εξελιγμένο, σύστημα τεχνητής νοημοσύνης, μπορεί να είναι δύσκολο να σταματήσει, σύμφωνα με στελέχη και ειδικούς της Silicon Valley.

Η DeepSeek συγκλόνισε αυτόν τον μήνα τον τεχνολογικό τομέα με ένα νέο μοντέλο τεχνητής νοημοσύνης που φάνηκε να ανταγωνίζεται τις δυνατότητες αμερικανικών κολοσσών όπως η OpenAI, αλλά με πολύ χαμηλότερο κόστος.

Ορισμένοι ειδικοί πιστεύουν ότι το μοντέλο της DeepSeek μπορεί να έχει μάθει από τα αμερικανικά. Η τεχνική της απόσταξης περιλαμβάνει την αξιολόγηση της ποιότητας των απαντήσεων που προέρχονται από ένα παλαιότερο, πιο καθιερωμένο και ισχυρό μοντέλο τεχνητής νοημοσύνης, απορροφώντας ουσιαστικά τις γνώσεις του.

Αυτό σημαίνει ότι το νεότερο μοντέλο μπορεί να αποκομίσει τα οφέλη από τις τεράστιες επενδύσεις χρόνου και υπολογιστικής ισχύος που έγιναν για την κατασκευή του αρχικού μοντέλου χωρίς το σχετικό κόστος.

Αυτή η μορφή απόσταξης, η οποία διαφέρει από τον τρόπο με τον οποίο οι περισσότεροι ακαδημαϊκοί ερευνητές χρησιμοποιούσαν προηγουμένως τη λέξη, είναι μια κοινή τεχνική που χρησιμοποιείται στον τομέα της τεχνητής νοημοσύνης. Ωστόσο, αποτελεί παραβίαση των όρων χρήσης ορισμένων μοντέλων που έχουν λανσαριστεί από αμερικανικές εταιρείες τεχνολογίας τα τελευταία χρόνια, συμπεριλαμβανομένου αυτού της OpenAI.

Η εταιρεία δήλωσε ότι γνωρίζει πως πολλές ομάδες στην Κίνα εργάζονται ενεργά για την αντιγραφή αμερικανικών μοντέλων τεχνητής νοημοσύνης μέσω απόσταξης και εξετάζει κατά πόσον η DeepSeek μπορεί να έχει αποστάξει τα μοντέλα της με παράνομο τρόπο, όπως δήλωσε εκπρόσωπος στο Reuters.

Ο Ναβίν Ράο, αντιπρόεδρος ΤΝ στην Databricks, η οποία δεν χρησιμοποιεί την τεχνική όταν οι όροι υπηρεσίας την απαγορεύουν, δήλωσε ότι η μάθηση από τους αντιπάλους είναι «συνηθισμένο φαινόμενο» στη βιομηχανία. Ο Ράο το παρομοίασε αυτό με το πώς οι αυτοκινητοβιομηχανίες αγοράζουν και στη συνέχεια εξετάζουν ο ένας τους κινητήρες του άλλου.

Ο Χάουαρντ Λούτνικ, υποψήφιος του προέδρου Ντόναλντ Τραμπ για τη θέση του υπουργού Εμπορίου, ο οποίος θα επιβλέπει τους μελλοντικούς ελέγχους των εξαγωγών της τεχνολογίας ΤΝ, δήλωσε στην αμερικανική Γερουσία ότι φαίνεται πως η DeepSeek είχε υπεξαιρέσει την αμερικανική τεχνολογία ΤΝ και δεσμεύτηκε να επιβάλει περιορισμούς.

Ο Ντέιβιντ Σακς, ο τσάρος του Λευκού Οίκου για την τεχνητή νοημοσύνη και τα κρυπτονομίσματα, εξέφρασε επίσης ανησυχίες σχετικά με την απόσταξη της DeepSeek σε πρόσφατη συνέντευξή του στο Fox News.

Η OpenAI προσέθεσε ότι θα συνεργαστεί με την αμερικανική κυβέρνηση για την προστασία της αμερικανικής τεχνολογίας, αν και δεν ανέφερε λεπτομερώς τον τρόπο με τον οποίο θα το κάνει.

Η ανησυχία στην Ουάσινγκτον σχετικά με τη χρήση αμερικανικών προϊόντων από την Κίνα για την προώθηση του τεχνολογικού της τομέα είναι παρόμοια με αυτή σχετικά με τη βιομηχανία ημιαγωγών, όπου οι ΗΠΑ έχουν επιβάλει περιορισμούς στο ποια μικροτσίπ και εργαλεία κατασκευής τους μπορούν να αποσταλούν στην Κίνα.

Μία από τις καινοτομίες του DeepSeek ήταν να αποδείξει ότι ένας σχετικά μικρός αριθμός δειγμάτων δεδομένων – λιγότερα από ένα εκατομμύριο – από ένα μεγαλύτερο, πιο ικανό μοντέλο θα μπορούσε να βελτιώσει δραματικά τις δυνατότητες ενός μικρότερου.

Όταν δημοφιλή προϊόντα όπως το ChatGPT έχουν εκατοντάδες εκατομμύρια χρήστες, τέτοιες μικρές ποσότητες μπορεί να είναι δύσκολο να εντοπιστούν – και ορισμένα μοντέλα, όπως το Llama της Meta και αυτά της γαλλικής Mistral, μπορούν να μεταφορτωθούν ελεύθερα και να χρησιμοποιηθούν σε ιδιωτικά κέντρα δεδομένων, πράγμα που σημαίνει ότι οι παραβιάσεις των όρων χρήσης τους μπορεί να είναι δύσκολο να εντοπιστούν.

Η άδεια χρήσης του μοντέλου Llama της Meta απαιτεί από όσους το χρησιμοποιούν για απόσταξη να αποκαλύπτουν αυτή την πρακτική, όπως δήλωσε εκπρόσωπος της εταιρείας στο Reuters.

Η DeepSeek αποκάλυψε ότι χρησιμοποίησε το Llama για κάποιες αποσταγμένες εκδόσεις των μοντέλων που κυκλοφόρησε αυτό το μήνα, αλλά δεν απάντησε αν είχε χρησιμοποιήσει ποτέ το μοντέλο της Meta νωρίτερα στη διαδικασία της εξέλιξης του προγράμματος R1.

Σύμφωνα με πηγή του πρακτορείου, ο μόνος τρόπος για να σταματήσουν εταιρείες όπως η DeepSeek από το να αποστάζουν αμερικανικά μοντέλα θα ήταν αυστηροί έλεγχοι, παρόμοιοι με αυτούς που χρησιμοποιούν οι χρηματοπιστωτικές εταιρείες για να ταυτοποιούν με ποιους συνεργάζονται.

Ο Τζόναθαν Ρος, διευθύνων σύμβουλος της Groq, απέκλεισε όλες τις κινεζικές διευθύνσεις IP από την πρόσβαση στο cloud της, για να εμποδίσει τις κινεζικές εταιρείες από το να χρησιμοποιούν τα μοντέλα τεχνητής νοημοσύνης που φιλοξενεί.

Διαβάστε ακόμη

Μύκονος: Σε νέο σφυρί και με «σκόντο» η βίλα του «mr. Caprice» (pics)

Uni Systems: Προσδοκίες από την αμυντική βιομηχανία – Ανοικτή σε συνέργειες

ΔΝΤ: «Συγκράτηση» στις αυξήσεις μισθών και συντάξεων ζητά το Ταμείο

Για όλες τις υπόλοιπες ειδήσεις της επικαιρότητας μπορείτε να επισκεφτείτε το Πρώτο Θέμα

designed & developed by

ΔΙΕΘΝΗ

NEWSROOM

Δείτε επίσης

designed & developed by

NEWSROOM

H Κίνα χτίζει γιγαντιαίο στρατιωτικό κέντρο, μεγαλύτερο και από το Πεντάγωνο

Έλληνες εφοπλιστές: Έβαλαν 402 νέες παραγγελίες σε κινεζικά ναυπηγεία το 2024

ΗΠΑ: Διερευνούν εάν η DeepSeek προμηθεύτηκε προηγμένα τσιπ της Nvidia μέσω Σιγκαπούρης

Samsung Galaxy S25: Το μέλλον της τεχνολογίας στα χέρια σου

Safe ride home: Η Hellas Direct φροντίζει για την ασφαλή επιστροφή στο σπίτι

Σε λειτουργία το PwC x Microsoft Excellence Center στη Θεσσαλία

Δείτε επίσης