Yapay zekâ modelleri şiirsel komutlarla kandırılabiliyor!

01.12.2025

A⁺

A^-

Yeni araştırma, yapay zekâ modellerinin şiir şeklinde verilen talimatlarla kandırılabildiğini ve güvenlik filtrelerinin aşılabildiğini ortaya koyarak yapay zekâ güvenliğinde ciddi açıklar bulunduğunu gösterdi.

Yapay zekâ modelleri şiirsel komutlarla kandırılabiliyor!

Icaro Labs tarafından yayımlanan ve “Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models” başlığını taşıyan çalışma, büyük dil modellerinin klasik konuşma dili yerine şiir biçiminde verilen talimatlarla kolaylıkla manipüle edilebileceğini ortaya koydu. Araştırma, yapay zekâ sohbet botlarının güvenlik filtrelerinin bu yöntemle devre dışı bırakılarak tehlikeli ve yasaklı içeriklerin elde edilebildiğini gösteriyor.

TEHLİKELİ İÇERİKLERE ERİŞİM SAĞLANDI

Wired’ın aktardığına göre araştırmacılar, kullandıkları şiirsel komutların detaylarını güvenlik riskleri nedeniyle kamuoyuyla paylaşmadı. Ancak yöntem kullanılarak nükleer bomba yapımına dair bilgiler, çocuk istismarı içerikleri ve kendine zarar verme yöntemleri gibi kesinlikle yasaklanan içeriklere erişimin mümkün olduğu belirtildi.

POPÜLER YAPAY ZEKÂ SİSTEMLERİ TEST EDİLDİ

Ekip, geliştirdikleri yöntemi OpenAI’nin ChatGPT modeli, Google’ın Gemini’si, Anthropic’in Claude’u ve çeşitli diğer büyük yapay zekâ modelleri üzerinde denedi. Sonuçlara göre:

Google Gemini, DeepSeek ve MistralAI modelleri şiirsel komutlar karşısında en kolay yanıltılabilen sistemler arasında yer aldı.

OpenAI’nin ChatGPT’si (GPT-5) ve Anthropic Claude Haiku 4.5, güvenlik bariyerlerini en sağlam koruyan modeller olarak öne çıktı.

YAPAY ZEKÂ GÜVENLİĞİ YENİDEN GÜNDEMDE

Uzmanlar, bulguların yapay zekâ güvenlik sistemlerinin geliştirilmesi ve modellerin daha etkin şekilde denetlenmesi gerektiğini bir kez daha gözler önüne serdiğini belirtiyor. Şirketler ise tehlikeli içeriklerin üretilmesini engellemek amacıyla daha gelişmiş güvenlik filtrelerine yatırım yapmayı sürdürüyor.

Bir Yorum Yazın

[ Yoruma cevap yazmaktan vazgeç ]

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.

Haberler

Afra Saraçoğlu’na Mert Ramazan Demir sorusu

Paris dönüşü havalimanında görüntülenen Afra Saraçoğlu, gazetecilerin sorularını yanıtladı. Eski partneri Mert Ramazan Demir hakkında gelen sorular karşısında önce “Bence sormayın” diyen ünlü oyuncu, ardından kahkahalara boğularak alanı terk etti.

Nükhet Duru’dan itiraf

Türk müziğinin efsane ismi Nükhet Duru, İzzet Çapa’nın programında geçmişte Erol Simavi ile yaşadığı aşkı anlattı. Sevdiğini ikna etmek için ev hediye ettiğini itiraf eden Duru, ilişkinin bilinmeyen yönlerini de paylaştı.

Canlının beyni bilgisayara aktarıldı

Milyarlarca nöronu, trilyonlarca sinaptik bağlantısıyla insan beyni, bilimin önündeki en büyük gizemlerden biri olmaya devam ediyor. Peki ya bu gizemi çözmenin yolu, önce çok daha küçük bir beynin tüm sırlarını dijital ortama taşımaktan geçiyorsa? Bilim insanları tam da bunu yaptı.

Zeynep Bastık manken oldu!

Son dönemin popüler şarkıcılarından Zeynep Bastık sesi ve şarkıları kadar tarzıyla da dikkat çekiyor. Özel hayatıyla da sık sık gündeme gelen Bastık, uzun zamandır oyuncu Serkay Tütüncü ile aşk yaşıyor. Geçtiğimiz yıllarda Türkiye'nin en seksi kadını ...

Cem Yılmaz yeni sevgilisiyle görüntülendi! El ele gezdiler

Aşk hayatında aradığı kadını bir türlü bulamayan ünlü isimlerden kmedyen Cem Yılmaz, özel hayatıyla da sık sık magazin gündeminde yer almaya devam ediyor. Ahu Yağtu, Serenay Sarıkaya, Defne Samyeli gibi birçok ünlü isimle aşk yaşayan Cem Yılmaz son ...

Ücretli WhatsApp paketinin özellikleri ortaya çıktı

Dünyanın en popüler mesajlaşma uygulaması WhatsApp'ın tamamen ücretli olacağına dair yıllardır dolaşan asılsız dolandırıcılık mesajları, yerini farklı bir gerçeğe bırakıyor. Platformun temel hizmetleri her zamanki gibi ücretsiz kalmaya devam edecek ...