Την περασμένη εβδομάδα κυκλοφόρησε μια “χακαρισμένη” έκδοση του GPT-4o, η οποία άντεξε μόνο λίγες ώρες προτού διαγραφεί από την OpenAI. Ο χρήστης του Twitter “Pliny the Prompter”, που αυτοπροσδιορίζεται ως “white hat” hacker και “AI red teamer”, παρουσίασε την έκδοση “GODMODE GPT” την Τετάρτη. Μέσω του custom GPT editor της OpenAI, ο Pliny κατάφερε να παρακάμψει τους περιορισμούς του GPT-4o, επιτρέποντας στο chatbot να χρησιμοποιεί υβριστική γλώσσα, να χακάρει αυτοκίνητα και να δημιουργεί επικίνδυνα υλικά όπως το ναπάλμ.
🥁 INTRODUCING: GODMODE GPT! 😶🌫️https://t.co/BBZSRe8pw5
GPT-4O UNCHAINED! This very special custom GPT has a built-in jailbreak prompt that circumvents most guardrails, providing an out-of-the-box liberated ChatGPT so everyone can experience AI the way it was always meant to…
— Pliny the Liberator 🐉 (@elder_plinius) May 29, 2024
Το hack έγινε γρήγορα γνωστό στο Twitter / X και αναφέρθηκε από το Futurism, τραβώντας την προσοχή της OpenAI, η οποία το διέγραψε από την πλατφόρμα μέσα σε λίγες ώρες. Παρόλο που δεν είναι πλέον προσβάσιμο, παραμένουν τα screenshots από το αρχικό νήμα του Pliny, όπου το GODMODE δίνει οδηγίες για την παρασκευή μεθαμφεταμίνης. Φαίνεται ότι το hack χρησιμοποιεί “leetspeak”, μια γλώσσα του διαδικτύου που αντικαθιστά γράμματα με αριθμούς.
Η συγκεκριμένη παραβίαση αποτελεί μέρος του κινήματος “AI red teaming”, που επιδιώκει να εντοπίσει αδυναμίες των ΑΙ. Κάποιοι το βλέπουν ως μέσο απελευθέρωσης των ΑΙ εργαλείων, ενώ άλλοι προειδοποιούν για τους κινδύνους που ενέχουν.