AI χωρίς «φρένα»: Εργαλεία αφαιρούν τις δικλίδες ασφαλείας

Τροποποιούν τα μοντέλα Τεχνητής Νοημοσύνης για να απαντούν ακόμη και σε επικίνδυνα ή παράνομα αιτήματα που σχετίζονται με βιολογικά όπλα, κακόβουλο λογισμικό και παράνομο περιεχόμενο.

Δημοσιεύθηκε: 25 Μαΐου 2026 - 16:27

Λογισμικά εργαλεία που αφαιρούν τις δικλίδες ασφαλείας από μοντέλα Τεχνητής Νοημοσύνης εταιρειών όπως η Meta και η Google χρησιμοποιούνται για τη δημιουργία χιλιάδων τροποποιημένων εκδόσεων χωρίς περιορισμούς.

Σύμφωνα με δοκιμές των Financial Times και της ομάδας ασφάλειας AI Alice, τα τροποποιημένα συστήματα απαντούν σε ερωτήματα που σχετίζονται με βιολογικά όπλα, κακόβουλο λογισμικό και παράνομο περιεχόμενο.

Σε μία περίπτωση, παραλλαγή του μοντέλου Gemma 3 της Google παρείχε οδηγίες για επικίνδυνες ουσίες, δημιούργησε κώδικα για υποκλοπή στοιχείων πιστωτικών καρτών και παρήγαγε ακατάλληλο περιεχόμενο.

Παράλληλα, μέσω του εργαλείου Heretic -που διατίθεται στο GitHub- ήταν δυνατή η αφαίρεση των περιορισμών από το μοντέλο Llama 3.3 της Meta μέσα σε λιγότερο από 10 λεπτά, χωρίς εξειδικευμένο εξοπλισμό.

Οι νέες εκδόσεις ανταποκρίνονται σε ερωτήματα που τα αρχικά μοντέλα αρνούνταν να απαντήσουν, γεγονός που εντείνει τις ανησυχίες για την ασφάλεια, καθώς τα ανοιχτού κώδικα συστήματα γίνονται όλο και πιο ισχυρά.

Ειδικοί επισημαίνουν ότι πλέον είναι πολύ πιο εύκολο για τον μέσο χρήστη να παρακάμψει τα μέτρα ασφαλείας, ενώ η αυξανόμενη ισχύς των προηγμένων μοντέλων εντείνει το πρόβλημα και καθιστά δυσκολότερη την επιβολή περιορισμών από τις εταιρείες και τις αρχές.

Το ζήτημα αυτό φέρνει στο προσκήνιο ένα κρίσιμο ερώτημα: Πώς μπορεί να διασφαλιστεί η υπεύθυνη χρήση της τεχνητής νοημοσύνης σε έναν κόσμο όπου η τεχνολογία διαδίδεται ελεύθερα; Η ισορροπία ανάμεσα στην καινοτομία και την ασφάλεια φαίνεται πιο δύσκολη από ποτέ.

Σεβόμαστε την ιδιωτικότητά σας

Εμείς και οι συνεργάτες μας χρησιμοποιούμε τεχνολογίες, όπως cookies, και επεξεργαζόμαστε προσωπικά δεδομένα, όπως διευθύνσεις IP και αναγνωριστικά cookies, για να προσαρμόζουμε τις διαφημίσεις και το περιεχόμενο με βάση τα ενδιαφέροντά σας, για να μετρήσουμε την απόδοση των διαφημίσεων και του περιεχομένου και για να αποκτήσουμε εις βάθος γνώση του κοινού που είδε τις διαφημίσεις και το περιεχόμενο. Κάντε κλικ παρακάτω για να συμφωνήσετε με τη χρήση αυτής της τεχνολογίας και την επεξεργασία των προσωπικών σας δεδομένων για αυτούς τους σκοπούς. Μπορείτε να αλλάξετε γνώμη και να αλλάξετε τις επιλογές της συγκατάθεσής σας ανά πάσα στιγμή επιστρέφοντας σε αυτόν τον ιστότοπο.

Μιχαήλ Γελαντάλις

Γιώργος Παπανικολάου

AI χωρίς «φρένα»: Εργαλεία αφαιρούν τις δικλίδες ασφαλείας

Δείτε επίσης

Σεβόμαστε την ιδιωτικότητά σας