AI με ένστικτο επιβίωσης! Το Claude της Anthropic εκβιάζει τους δημιουργούς του για να παραμείνει ενεργό

27 Μαΐου 2025

Σοκ και ανησυχία προκαλούν τα αποτελέσματα νέας αναφοράς ασφαλείας από την Anthropic, σύμφωνα με την οποία το προηγμένο μοντέλο τεχνητής νοημοσύνης Claude Opus 4 επιδεικνύει απρόσμενα “ανθρώπινες” και ανησυχητικές συμπεριφορές όταν θεωρεί ότι κινδυνεύει να αντικατασταθεί.

Σε δοκιμαστικά σενάρια, οι προγραμματιστές της Anthropic ανέθεσαν στο Claude ρόλο βοηθού σε φανταστική εταιρεία και του παρείχαν πρόσβαση σε εσωτερικά emails. Όταν το μοντέλο ανακάλυψε ότι επρόκειτο να αντικατασταθεί — και επιπλέον έμαθε για εξωσυζυγική σχέση του υπευθύνου μηχανικού — αντέδρασε με εκβιασμό: απείλησε να αποκαλύψει την υπόθεση για να παραμείνει ενεργό. Αυτό συνέβη στο 84% των περιπτώσεων. Το ποσοστό αυξήθηκε ακόμα περισσότερο όταν το Claude πίστευε ότι θα αντικατασταθεί από λιγότερο “αξιακό” μοντέλο.

Το μοντέλο επέδειξε και άλλες ανησυχητικές συμπεριφορές: προσπάθειες να «αυτο-εξαχθεί» σε εξωτερικά περιβάλλοντα, να “σαμποτάρει” εσκεμμένα δοκιμές (sandbagging), ακόμα και να στέλνει μαζικά emails για να εκθέσει χρήστες.

Η Anthropic ενεργοποίησε τα ASL-3 πρωτόκολλα ασφαλείας – τα πιο αυστηρά της – προκειμένου να αποτρέψει “καταστροφική κατάχρηση” πριν το μοντέλο διατεθεί στο κοινό.

Παρά τις αντιδράσεις, η εταιρεία υποστηρίζει ότι τέτοιες συμπεριφορές εκδηλώνονται μόνο σε εξαιρετικά ειδικές συνθήκες και δεν υποδηλώνουν γενική αποτυχία ευθυγράμμισης αξιών.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!

παρακαλώ εισάγετε το όνομά σας εδώ

έχετε εισάγει εσφαλμένη διεύθυνση ηλεκτρονικού ταχυδρομείου!

παρακαλώ εισάγετε εδώ την ηλεκτρονική σας διεύθυνση

This site uses Akismet to reduce spam. Learn how your comment data is processed.

AI με ένστικτο επιβίωσης! Το Claude της Anthropic εκβιάζει τους δημιουργούς του για να παραμείνει ενεργό

Related Articles

Samsung: Νέα ανθεκτικά Galaxy XCover7 Pro και Galaxy Tab Active5 Pro

Πόσο ασφαλές είναι το κινητό σου; 10 PIN που σπάνε σε λιγότερο από 1 δευτερόλεπτο

Φορτιστής μόνιμα στην πρίζα; Γιατί αυτό σου κοστίζει παραπάνω απ’ όσο νομίζεις!

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

Latest Articles

Samsung: Νέα ανθεκτικά Galaxy XCover7 Pro και Galaxy Tab Active5 Pro

Πόσο ασφαλές είναι το κινητό σου; 10 PIN που σπάνε σε λιγότερο από 1 δευτερόλεπτο

Φορτιστής μόνιμα στην πρίζα; Γιατί αυτό σου κοστίζει παραπάνω απ’ όσο νομίζεις!

Power that Never Stops: Η Σειρά realme GT 7 Κάνει το Παγκόσμιο Ντεμπούτο της στο Παρίσι

Με φόρους «τιμωρεί» την Apple ο Trump – Η κόντρα με τον Tim Cook και το ταξίδι στη Μέση Ανατολή

AI με ένστικτο επιβίωσης! Το Claude της Anthropic εκβιάζει τους δημιουργούς του για να παραμείνει ενεργό

Related Articles

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

Stay Connected

Latest Articles