Το Openai κάνει ντεμπούτο GPT-OSS, μια ελαφριά οικογένεια μοντέλου για χρήση ανοιχτού κώδικα

Το OpenAI εισήγαγε την GPT-OSS, μια νέα οικογένεια μικρών, ανοιχτών γλωσσικών μοντέλων που έχουν σχεδιαστεί για την κοινότητα ανοιχτού κώδικα. Αυτά τα μοντέλα βελτιστοποιούνται για αποτελεσματικότητα, ταχύτητα και ευρεία συμβατότητα με μια σειρά υλικού, καθιστώντας τα ιδανικά για προγραμματιστές και ερευνητές που θέλουν προσαρμόσιμα εργαλεία AI χωρίς να βασίζονται σε υποδομές μεγάλης κλίμακας.

Το GPT-OSS απελευθερώνεται σε τρία μεγέθη μοντέλων: 120 εκατομμύρια, 410 εκατομμύρια και 1,1 δισεκατομμύρια παραμέτρους. Κάθε έκδοση είναι συντονισμένη με οδηγίες και υποστηρίζει πολλές γλώσσες. Αυτά τα μοντέλα είναι μικρότερα από τα GPT-3.5 και GPT-4, αλλά έχουν σχεδιαστεί για να παρέχουν γρήγορη απόδοση σε συσκευές άκρων και να λειτουργούν καλά σε περιβάλλοντα εκτός σύνδεσης ή περιορισμένα. Παρά το μικρό τους μέγεθος, τα μοντέλα επιδεικνύουν ισχυρά αποτελέσματα σε μια ποικιλία σημείων αναφοράς, συμπεριλαμβανομένων των MMLU και GSM8K.

Ο στόχος της GPT-OSS είναι να προσφέρει μια ελαφριά, ευέλικτη εναλλακτική λύση σε μεγαλύτερα μοντέλα, ειδικά σε περιπτώσεις χρήσης όπου καθορίζεται προτεραιότητα σε χαμηλή λανθάνουσα κατάσταση, ερμηνεία ή ενεργειακή απόδοση. Τα μοντέλα προορίζονται επίσης να χρησιμεύσουν ως ισχυρές βασικές γραμμές για ακαδημαϊκή έρευνα ή πειράματα ρύθμισης. Ο OpenAI δηλώνει ότι έχουν συγκριθεί με την GPT-OSS έναντι συγκρίσιμων μοντέλων ανοιχτού βάρους και τα διαπίστωσαν ότι είναι ανταγωνιστικά σε γενικές γλωσσικές εργασίες.

Σε αντίθεση με το CHATGPT ή το GPT-4, τα μοντέλα GPT-OSS δεν συνδέονται με το ευρύτερο οικοσύστημα OpenAI. Δεν υπάρχει εγγενής ενσωμάτωση, μνήμη ή υποστήριξη περιήγησης. Αντ 'αυτού, απελευθερώνονται με άδεια ανοικτού βάρους και διατίθενται στο GitHub και Hugging Face, δίνοντας στους προγραμματιστές πλήρη έλεγχο της ανάπτυξης, της προσαρμογής και της τοπικής χρήσης. Τα βάρη έρχονται με κάρτες μοντέλων και μετρήσεις αξιολόγησης για διαφάνεια.

Η απελευθέρωση της GPT-OSS από την OpenAI έρχεται σε μια εποχή που τα ελαφριά μοντέλα κερδίζουν δημοτικότητα για εφαρμογές on-device και ιδιωτικές αναπτύξεις. Με αυξημένο ενδιαφέρον για τα μοντέλα ανοιχτού βάρους και την ανάγκη για αναπαραγωγική έρευνα, η GPT-OSS προσθέτει ένα νέο σημείο εισόδου για όσους αναζητούν LLMS μικρότερης κλίμακας με την αξιοπιστία της εκπαιδευτικής υποδομής της OpenAI. Η εταιρεία υπογράμμισε ότι αυτά τα μοντέλα δεν εκπαιδεύτηκαν χρησιμοποιώντας ιδιωτικά δεδομένα χρήστη και ότι οι αξιολογήσεις ασφαλείας έχουν τεκμηριωθεί στις κάρτες μοντέλων.

Διαβάστε επίσης:Το μοντέλο ανοιχτού κώδικα της Κίνας «Goku» αμφισβητεί την κυριαρχία των ΗΠΑ

Ενώ η GPT-OSS δεν θα ανταγωνιστεί το GPT-4 σε συλλογιστική ή ποιότητα συνομιλίας πολλαπλών μεταφορών, η προσβασιμότητα, η αναλογία απόδοσης προς το μέγεθος και η ευκολία πειραματισμού καθιστούν πολύτιμη συμβολή στο οικοσύστημα των μοντέλων ανοιχτού βάρους. Οι προγραμματιστές μπορούν τώρα να χτίσουν με το GPT-OSS τοπικά, να το τελειοποιήσετε για συγκεκριμένους τομείς ή να το χρησιμοποιήσετε ως δοκιμαστική πλατφόρμα για την έρευνα αρχιτεκτονικής.