Οι ερευνητές του Berkeley αναδημιουργούν τον πυρήνα του Deepseek AI για μόλις 30 $ - εδώ σημαίνει

Μια ομάδα ερευνητών στο Πανεπιστήμιο της Καλιφόρνιας, Berkeley, έχει αναδημιουργήσει με επιτυχία την βασική τεχνολογία πίσω από το Deepseek AI για ένα εκπληκτικά χαμηλό κόστος μόλις $ 30. Με επικεφαλής τον Ph.D. Ο υποψήφιος Jiayi Pan, η ομάδα κατάφερε να αναπαράγει τις δυνατότητες μάθησης Deepseek R1-Zero, χρησιμοποιώντας ένα μικρό μοντέλο γλωσσών με μόλις 3 δισεκατομμύρια παραμέτρους.

Παρά το μέτριο μέγεθος του, το AI κατέδειξε ικανότητες αυτοκράτειας και αναζήτησης, επιτρέποντάς του να βελτιώσει τις απαντήσεις του επαναληπτικά. Για να ελέγξει τις δεξιότητές του στην επίλυση προβλημάτων, οι ερευνητές χρησιμοποίησαν το παιχνίδι αντίστροφης μέτρησης, ένα μαθηματικό παζλ που απαιτεί από τους παίκτες να φτάσουν σε έναν αριθμό στόχου χρησιμοποιώντας αριθμητικές λειτουργίες. Αρχικά, η AI έκανε τυχαίες εικασίες, αλλά μέσω της μάθησης ενίσχυσης, βελτίωσε την ικανότητά της να αναθεωρήσει και να βελτιστοποιήσει τις απαντήσεις της.

Συνιστώμενη ανάγνωση:Οι ερευνητές χρησιμοποιούν το Super Mario Bros. για να αναφέρετε την απόδοση AI

Η ομάδα του PAN πειραματίστηκε με διαφορετικά μεγέθη μοντέλων, σημειώνοντας ότι ένα μοντέλο παραμέτρων 500 εκατομμυρίων παραμέτρων αγωνίστηκε να βελτιώσει τις απαντήσεις, ενώ ένα μοντέλο παραμέτρων 1,5 δισεκατομμυρίων άρχισε να ενσωματώνει τεχνικές αναθεώρησης. Μόλις κλιμακωθεί σε 3 έως 7 δισεκατομμύρια παραμέτρους, το ΑΙ εμφάνισε σημαντική βελτίωση στην αποτελεσματική επίλυση προβλημάτων.

Η οικονομική προσιτότητα αυτής της αναψυχής εγείρει ερωτήματα σχετικά με το κόστος της ανάπτυξης του AI. Επί του παρόντος, η OpenAI χρεώνει 15 δολάρια ανά εκατομμύριο μάρκες μέσω του API, ενώ το DeepSeek προσφέρει πολύ χαμηλότερο ποσοστό 0,55 δολαρίων ανά εκατομμύριο μάρκες. Ωστόσο, ο ερευνητής της AI Nathan Lambert εξέφρασε σκεπτικισμό για την προσιτότητα του Deepseek, υποστηρίζοντας ότι το λειτουργικό του κόστος μπορεί να φτάσει τα 500 εκατομμύρια δολάρια σε πάνω από 1 δισεκατομμύριο δολάρια ετησίως.

Επιπλέον, οι ανησυχίες σχετικά με την ιδιωτική ζωή των δεδομένων και την εθνική ασφάλεια οδήγησαν στην απαγόρευση της Deepseek σε μέρη των ΗΠΑ, ορισμένες αναφορές υποδηλώνουν ότι η Deepseek μπορεί να έχει εκπαιδευτεί χρησιμοποιώντας το ChatGPT της OpenAI, ενδεχομένως εξηγώντας τα χαμηλότερα έξοδά του. Ενώ παραμένουν ερωτήματα, τα ευρήματα του Berkeley υποδηλώνουν ότι τα μοντέλα AI υψηλής απόδοσης θα μπορούσαν να γίνουν πολύ πιο προσιτά στο εγγύς μέλλον-διαταράσσοντας ιδιαίτερα την κυριαρχία των γίγαντων AI όπως το OpenAI, το Google και το Microsoft.

Lire aussi

Διορθώστε: Μη έγκυρο πρόβλημα διεύθυνσης IP στα Windows 11

Πώς να ξέρετε αν κάποιος σας εμπόδισε το Android

Η Apple εξηγεί γιατί τα μεγαλύτερα iPhones μπορεί να μην είναι αρκετά για την Apple Intelligence

Απλό ραδιόφωνο: Ακούστε τους αγαπημένους σας ραδιοφωνικούς σταθμούς στο iPhone

Καλύτερες αδιάβροχες περιπτώσεις iPhone SE 2

Η όπερα για το iOS φέρνει προηγμένο σύστημα διαχείρισης νέων καρτελών