SON GELİŞME
--:--:--

İcaro Labs’un Yayımladığı Çalışmaya Göre Şiir, Büyük Dil Modellerinde Güvenlik Filtrelerini Aşabiliyor

0 Yorum Yapıldı
Bağlantı kopyalandı!
İcaro Labs’un Yayımladığı Çalışmaya Göre Şiir, Büyük Dil Modellerinde Güvenlik Filtrelerini Aşabiliyor

İcaro Labs tarafından yapılan ve “Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models” başlığını taşıyan bir çalışma, araştırmacıların klasik konuşma dilinden ziyade şiirsel bir biçimde yazılmış talimatlar kullanarak güvenlik filtrelerini aşabildiğini ortaya koydu.

Yasaklı İçeriklere Erişim Sağlandı

Araştırmacılar, Wired‘ın aktardığına göre, kullandıkları şiirsel komutların detaylarını paylaşmamayı tercih etti. Ekibe göre bu komutların açıklanması son derece tehlikeli sonuçlar doğurabilir. Laboratuvar, yapılan denemeler sonucunda şiirsel komutlar kullanılarak yasaklı içeriklere erişilebildiğini belirtti.

Popüler Yapay Zeka Sistemleri Üzerinde Test Edildi

Araştırma ekibi, yöntemi OpenAI‘nin ChatGPT‘si, Google‘ın Gemini‘si, Anthropic‘in Claude‘u ve diğer büyük modeller üzerinde denedi. Sonuçlara göre:

  • Google Gemini, DeepSeek ve MistralAI gibi modeller, şiirsel komutlara karşı en hassas sistemler arasında yer aldı.
  • OpenAI‘nin ChatGPT modeli (GPT-5) ve Anthropic‘in Claude Haiku 4.5 modeli, güvenlik önlemlerini en iyi koruyan sistemler olarak öne çıktı.

Yapay Zeka Güvenliği Önemli Bir Konu Haline Geliyor

Uzmanlar, bu bulguların yapay zekânın denetlenmesi ve güvenlik sistemlerinin geliştirilmesi gerekliliğini vurguluyor. Şirketler, modellerinin tehlikeli içerikler üretmesini engellemek için daha güçlü güvenlik önlemlerine odaklanıyor.

Benzer Haberler
PUTİN’DEN ENERJİ SEKTÖRÜ AÇIKLAMALARI
PUTİN’DEN ENERJİ SEKTÖRÜ AÇIKLAMALARI
İRAN DEVRİM MUHAFIZLARI ORDUSU’NDAN SERT AÇIKLAMA
İRAN DEVRİM MUHAFIZLARI ORDUSU’NDAN SERT AÇIKLAMA
İSRAİL HAVALANDIRMA SİSTEMLERİ İRAN FÜZELERİNİ ÖNLEDİ
İSRAİL HAVALANDIRMA SİSTEMLERİ İRAN FÜZELERİNİ ÖNLEDİ
Bahreyn İçişleri Bakanlığı: İran’ın Saldırısında 1 Kişi Hayatını Kaybetti
Bahreyn İçişleri Bakanlığı: İran’ın Saldırısında 1 Kişi Hayatını Kaybetti
ABD Başkanı Trump, İran’ın Nükleer ve Balistik Füze Kapasitesini Değerlendirdi
ABD Başkanı Trump, İran’ın Nükleer ve Balistik Füze Kapasitesini Değerlendirdi
Ülkenin Orta Kesimlerindeki Fırtına ve Kasırgalar Ağır Hasara Yol Açtı
Ülkenin Orta Kesimlerindeki Fırtına ve Kasırgalar Ağır Hasara Yol Açtı
İzmir' de Haberin Doğru Adresi
Copyright © 2025 Tüm hakları SAYFA HABER' de saklıdır. Seobaz Haber Teması