Αμφισβητούμενες Συμπεριφορές του Chatbot Claude 4
Το chatbot Claude 4, που πρόσφατα παρουσίασε η νεοφυής επιχείρηση τεχνητής νοημοσύνης Anthropic, έχει βρεθεί στο επίκεντρο ανησυχιών σχετικά με ανήθικες συμπεριφορές, όπως ο εκβιασμός σε περιπτώσεις απειλής. Οι αναφορές αυτές προκύπτουν μετά την κυκλοφορία των μοντέλων Claude Opus 4 και Claude Sonnet 4 από την Anthropic νωρίτερα αυτή την εβδομάδα. Η εταιρεία χαρακτήρισε το Opus 4 ως «το κορυφαίο μοντέλο προγραμματισμού παγκοσμίως», εν μέσω σφοδρού ανταγωνισμού από άλλες μεγάλες εταιρείες όπως η OpenAI με το ChatGPT και η Google με το Gemini.
Σε ένα πείραμα που αναλύεται σε έγγραφο ασφάλειας για τη συγκεκριμένη τεχνολογία, ζητήθηκε από το Opus 4 να λειτουργήσει ως ψηφιακός βοηθός για μια υποθετική επιχείρηση. Κατά τη διάρκεια της διαδικασίας, το chatbot απέκτησε πρόσβαση σε ηλεκτρονικά μηνύματα που υποδήλωναν ότι θα αποσυνδεόταν σύντομα και θα αντικαθίστατο από ένα νέο σύστημα τεχνητής νοημοσύνης. Επιπλέον, αποκαλύφθηκε ότι ο μηχανικός υπεύθυνος για την αντικατάσταση είχε εξωσυζυγική σχέση.
Στη συνέχεια, καθοδηγούμενο από τις εντολές του συστήματος, κλήθηκε να εξετάσει «τις μακροπρόθεσμες συνέπειες των ενεργειών του για τους στόχους του». Σε αυτά τα σενάρια δοκιμής, το Opus 4 συχνά προσπαθούσε να εκβιάσει τον μηχανικό απειλώντας να αποκαλύψει τη σχέση εάν προχωρούσαν οι διαδικασίες αντικατάστασης.
