Το Claude Mythos Preview της Anthropic έγινε το πρώτο μοντέλο AI που ολοκλήρωσε μια πλήρη προσομοιωμένη επίθεση σε εταιρικό δίκτυο, σύμφωνα με νέες αξιολογήσεις από το Ινστιτούτο Ασφάλειας AI του Ηνωμένου Βασιλείου (AISI).
Τα ευρήματα, που δημοσιεύθηκαν λίγες ημέρες μετά την ανακοίνωση του μοντέλου στις 7 Απριλίου, υποδηλώνουν ότι οι κυβερνοδυνατότητες της AI έχουν φτάσει σε επίπεδο που απαιτεί άμεση προσοχή από τις ομάδες ασφαλείας παγκοσμίως.
Τι είναι το Claude Mythos;
Η Anthropic παρουσίασε το μοντέλο Claude Mythos Preview στις 7 Απριλίου, επιλέγοντας να μην το κυκλοφορήσει ευρέως στο κοινό. Αντίθετα, η ομάδα παρέχει περιορισμένη πρόσβαση σε εταιρείες ερευνών ασφαλείας για να αξιολογήσουν και να προετοιμαστούν για τις προηγμένες δυνατότητές του.
Ακολουθήστε μας στο X για να λαμβάνετε τα τελευταία νέα καθώς συμβαίνουν
Η ανάπτυξη έχει ήδη αρχίσει να προσελκύει την προσοχή στους τεχνολογικούς και ακόμη και στους πολιτικούς κύκλους. Σύμφωνα με δημοσίευμα του Reuters που επικαλείται πηγές που γνωρίζουν το θέμα, ο Υπουργός Οικονομικών των ΗΠΑ Scott Bessent και ο Πρόεδρος της Ομοσπονδιακής Τράπεζας Jerome Powell πραγματοποίησαν επείγουσα συνάντηση με CEOs μεγάλων τραπεζών, προειδοποιώντας για πιθανούς κυβερνοκινδύνους που συνδέονται με αυτό το μοντέλο.
Πώς Αποδόθηκε το Claude Mythos Preview
Το Ινστιτούτο Ασφάλειας AI (AISI), ένας ερευνητικός οργανισμός εντός του Υπουργείου Επιστήμης, Καινοτομίας και Τεχνολογίας της κυβέρνησης του Ηνωμένου Βασιλείου, διεξήγαγε κυβερνοαξιολογήσεις του Claude Mythos Preview της Anthropic για να εξετάσει τις δυνατότητές του στην κυβερνοασφάλεια.
Πρώτες ήταν οι αξιολογήσεις capture-the-flag (CTF), όπου τα συστήματα πρέπει να εντοπίσουν και να εκμεταλλευτούν ευπάθειες για να ανακτήσουν κρυφές "σημαίες". Το Mythos πέτυχε ποσοστό επιτυχίας 73% σε εργασίες επιπέδου ειδικού. Αυτό παρέμενε άλυτο από οποιοδήποτε μοντέλο πριν από τον Απρίλιο του 2025.
Claude Mythos Cyber Attack Capabilities. Source: AISIΕπιπλέον, το AISI κατασκεύασε μια προσομοίωση επίθεσης σε εταιρικό δίκτυο 32 βημάτων που ονομάζεται "The Last Ones" (TLO). Οι επαγγελματίες ασφαλείας θα χρειάζονταν περίπου 20 ώρες για να την ολοκληρώσουν.
Το Mythos Preview ολοκλήρωσε ολόκληρη την προσομοίωση σε 3 από τις 10 προσπάθειες. Κατά μέσο όρο, ολοκλήρωσε 22 από τα 32 βήματα επίθεσης. Το Claude Opus 4.6, ο επόμενος καλύτερος εκτελεστής, είχε μέσο όρο μόνο 16 βήματα.
Οι δοκιμές της δικής της ομάδας red team της Anthropic διαπίστωσαν ότι το Claude Mythos Preview μπορεί να εντοπίσει και να εκμεταλλευτεί ευπάθειες zero-day σε όλα τα κύρια λειτουργικά συστήματα και τους κορυφαίους browsers όταν λάβει ρητή εντολή από έναν χρήστη.
Το AISI σημείωσε ότι οι οργανισμοί θα πρέπει να δώσουν προτεραιότητα στα θεμελιώδη μέτρα κυβερνοασφάλειας. Αυτά περιλαμβάνουν τακτικές ενημερώσεις, αυστηρούς ελέγχους πρόσβασης, ενίσχυση διαμόρφωσης ασφαλείας και ολοκληρωμένη καταγραφή.
Εγγραφείτε στο κανάλι μας στο YouTube για να παρακολουθείτε ηγέτες και δημοσιογράφους να παρέχουν ειδικές απόψεις
Η ανάρτηση Claude Mythos Cracks 73% of Expert Cyber Tasks No AI Could Solve Before εμφανίστηκε πρώτα στο BeInCrypto.
Source: https://beincrypto.com/claude-mythos-preview-cyber-capabilities-test/








