Οι ερευνητές της ασφάλειας έχουν ανακαλύψει ότι χιλιάδες αποθετήρια Github, τα οποία κάποτε ήταν προσβάσιμα από το κοινό, αλλά έχουν γίνει ιδιωτικά, παραμένουν προσβάσιμα μέσω εργαλείων που τροφοδοτούνται με AI όπως το Github Copilot. Αυτό το ζήτημα υπογραμμίζει την επίμονη φύση της έκθεσης δεδομένων στο Διαδίκτυο, όπου οι πληροφορίες, ακόμη και αν είναι σύντομα δημόσιες, μπορούν να διατηρηθούν και να χρησιμοποιηθούν από γενετικά συστήματα AI πολύ καιρό μετά την περιορισμένη του.
Ο Github Copilot, που αναπτύχθηκε από την GitHub σε συνεργασία με την OpenAI και τη Microsoft, είναι βοηθός κωδικοποίησης που βασίζεται στην ΑΙ, ο οποίος υποδηλώνει αποσπάσματα κώδικα και ολοκληρώσεις σε προγραμματιστές. Έχει εκπαιδευτεί σε ένα τεράστιο σώμα του διαθέσιμου στο κοινό κώδικα, επιτρέποντάς του να παρέχει σχετικές προτάσεις. Ωστόσο, αυτά τα δεδομένα εκπαίδευσης περιλαμβάνουν κώδικα από αποθετήρια που ήταν δημόσια κατά τη στιγμή της κατάρτισης, αλλά από τότε έχουν γίνει ιδιωτικά. Ως αποτέλεσμα, ο Copilot μπορεί ακόμα να δημιουργήσει προτάσεις κώδικα με βάση το περιεχόμενο από αυτά τα αποθετήρια τώρα-ιδιωτικών.
Δείτε επίσης:Η εφαρμογή NORDVPN ξεκινά στο TVOS που προσφέρει ασφαλή ροή και ιδιωτική περιήγηση
Αυτή η κατάσταση δημιουργεί σημαντικές ανησυχίες σχετικά με την ιδιωτική ζωή και την ασφάλεια των δεδομένων. Οι προγραμματιστές οι οποίοι κατά λάθος εκτελούσαν ευαίσθητες πληροφορίες σε δημόσια αποθετήρια, ακόμη και για σύντομη διάρκεια, μπορεί να διαπιστώσουν ότι αυτά τα δεδομένα έχουν απορροφηθεί από μοντέλα AI και μπορούν ακόμα να έχουν πρόσβαση έμμεσα μέσω εργαλείων όπως το copilot. Αυτό υπογραμμίζει τη σημασία της άσκησης προειδοποίησης κατά την κοινή χρήση του κώδικα δημοσίως και τις προκλήσεις της πλήρους αποσύνδεσης των πληροφοριών μόλις εκτεθεί στο διαδίκτυο.
Απαντώντας σε αυτές τις ανησυχίες, η GitHub έχει εφαρμόσει χαρακτηριστικά για να βελτιώσει τη διαφάνεια και τον έλεγχο των προτάσεων κώδικα που παράγονται από την AI. Για παράδειγμα, το Visual Studio υποστηρίζει τώρα την αναφορά κώδικα για την ολοκλήρωση του GitHub Copilot, επιτρέποντας στους προγραμματιστές να επαληθεύσουν εάν οι προτάσεις βασίζονται στον δημόσιο κώδικα, οι οποίες θα μπορούσαν να έχουν επιπτώσεις αδειοδότησης. Αυτή η λειτουργία παρέχει λεπτομερείς πληροφορίες σχετικά με τυχόν αντιστοιχίες δημόσιων κώδικα, επιτρέποντας στους προγραμματιστές να λαμβάνουν τεκμηριωμένες αποφάσεις σχετικά με την ενσωμάτωση του προτεινόμενου κώδικα στα έργα τους.
Παρά τα μέτρα αυτά, το περιστατικό χρησιμεύει ως υπενθύμιση της διαρκούς φύσης των δεδομένων μόλις δημοσιοποιηθεί. Οι προγραμματιστές καλούνται να αναθεωρήσουν διεξοδικά τον κώδικα τους για ευαίσθητες πληροφορίες προτού το κάνουν δημόσιο και να γνωρίζουν ότι, ακόμη και μετά την πραγματοποίηση ενός ιδιωτικού αποθετηρίου, τα προηγούμενα εκτεθειμένα δεδομένα ενδέχεται να είναι προσβάσιμα μέσω εργαλείων AI που εκπαιδεύονται σε προηγούμενα δημόσια δεδομένα.
Πηγή:Τεχνολογική
