Μια ομάδα ερευνητών στο Πανεπιστήμιο της Καλιφόρνιας, Berkeley, έχει αναδημιουργήσει με επιτυχία την βασική τεχνολογία πίσω από το Deepseek AI για ένα εκπληκτικά χαμηλό κόστος μόλις $ 30. Με επικεφαλής τον Ph.D. Ο υποψήφιος Jiayi Pan, η ομάδα κατάφερε να αναπαράγει τις δυνατότητες μάθησης Deepseek R1-Zero, χρησιμοποιώντας ένα μικρό μοντέλο γλωσσών με μόλις 3 δισεκατομμύρια παραμέτρους.
Παρά το μέτριο μέγεθος του, το AI κατέδειξε ικανότητες αυτοκράτειας και αναζήτησης, επιτρέποντάς του να βελτιώσει τις απαντήσεις του επαναληπτικά. Για να ελέγξει τις δεξιότητές του στην επίλυση προβλημάτων, οι ερευνητές χρησιμοποίησαν το παιχνίδι αντίστροφης μέτρησης, ένα μαθηματικό παζλ που απαιτεί από τους παίκτες να φτάσουν σε έναν αριθμό στόχου χρησιμοποιώντας αριθμητικές λειτουργίες. Αρχικά, η AI έκανε τυχαίες εικασίες, αλλά μέσω της μάθησης ενίσχυσης, βελτίωσε την ικανότητά της να αναθεωρήσει και να βελτιστοποιήσει τις απαντήσεις της.
Συνιστώμενη ανάγνωση:Οι ερευνητές χρησιμοποιούν το Super Mario Bros. για να αναφέρετε την απόδοση AI
Η ομάδα του PAN πειραματίστηκε με διαφορετικά μεγέθη μοντέλων, σημειώνοντας ότι ένα μοντέλο παραμέτρων 500 εκατομμυρίων παραμέτρων αγωνίστηκε να βελτιώσει τις απαντήσεις, ενώ ένα μοντέλο παραμέτρων 1,5 δισεκατομμυρίων άρχισε να ενσωματώνει τεχνικές αναθεώρησης. Μόλις κλιμακωθεί σε 3 έως 7 δισεκατομμύρια παραμέτρους, το ΑΙ εμφάνισε σημαντική βελτίωση στην αποτελεσματική επίλυση προβλημάτων.
Η οικονομική προσιτότητα αυτής της αναψυχής εγείρει ερωτήματα σχετικά με το κόστος της ανάπτυξης του AI. Επί του παρόντος, η OpenAI χρεώνει 15 δολάρια ανά εκατομμύριο μάρκες μέσω του API, ενώ το DeepSeek προσφέρει πολύ χαμηλότερο ποσοστό 0,55 δολαρίων ανά εκατομμύριο μάρκες. Ωστόσο, ο ερευνητής της AI Nathan Lambert εξέφρασε σκεπτικισμό για την προσιτότητα του Deepseek, υποστηρίζοντας ότι το λειτουργικό του κόστος μπορεί να φτάσει τα 500 εκατομμύρια δολάρια σε πάνω από 1 δισεκατομμύριο δολάρια ετησίως.
Επιπλέον, οι ανησυχίες σχετικά με την ιδιωτική ζωή των δεδομένων και την εθνική ασφάλεια οδήγησαν στην απαγόρευση της Deepseek σε μέρη των ΗΠΑ, ορισμένες αναφορές υποδηλώνουν ότι η Deepseek μπορεί να έχει εκπαιδευτεί χρησιμοποιώντας το ChatGPT της OpenAI, ενδεχομένως εξηγώντας τα χαμηλότερα έξοδά του. Ενώ παραμένουν ερωτήματα, τα ευρήματα του Berkeley υποδηλώνουν ότι τα μοντέλα AI υψηλής απόδοσης θα μπορούσαν να γίνουν πολύ πιο προσιτά στο εγγύς μέλλον-διαταράσσοντας ιδιαίτερα την κυριαρχία των γίγαντων AI όπως το OpenAI, το Google και το Microsoft.
